01/08/2025
Análise de Risco de Split-Brain em Cenário com MC-LAG: Possíveis Falhas e Soluções

Engenharia de Aplicações - Adriano Guedes 

Este artigo analisa um cenário típico com Multi Chassi Link Agregation (MC-LAG) e exercita como a arquitetura planejada pode extrair o máximo de resiliência de um cenário de implantação com MC-LAG em uma rede L2 existente, inclusive mitigando cenários onde ocorre o split-brain.

O fenômeno conhecido como split-brain, ocorre quando dois ou mais nós de um sistema que deveriam operar em conjunto, perdem a comunicação entre si, porém continuam ativos de forma independente, cada um, acreditando que o outro nó está inativo. É como se os dois dispositivos que deveriam operar em modo ativo/passivo, atuassem como ativo, impactando diretamente na escalabilidade da topologia, gerando instabilidade e perdas de conectividade.

 

Tradicionalmente uma agregação de links, onde várias interfaces físicas se comportam como uma interface lógica, operam sempre de um equipamento A para um equipamento B, realizando a distribuição do tráfego de acordo com a sua variabilidade, entre as interfaces disponíveis, como visualizado na imagem abaixo.

O balanceamento pode ocorrer por critérios como:

  • dst-ip: Destino IP, portas TCP/UDP;
  • dst-mac: Detino MAC, VLAN e Ethertype;
  • Dynamic: Balanceamento dinâmico, os fluxos são movidos de acordo com a capacidade/disponibilidade dos enlaces;
  • Enhanced: Labels MPLS, IP e MAC addresses, portas TCP/UDP;
  • src-dst-ip: Origem e destino IP e portas TCP/UDP;
  • src-dst-mac: Origem e destino MAC, VLAN e Ethertype;
  • src-ip: Origem IP e portas TCP/UDP;
  • src-mac: Origem MAC, VLAN e Ethertype.

 

Não há um método melhor ou pior, mas sim, aquele que se adapta as características da sua topologia.

 

Já o MC-LAG, traz a ideia da agregação de links físicos em um lógico, mas com a possibilidade de que seja estabelecido com destinos distintos, conforme abaixo.

Tornando-se uma excelente solução para fornecer redundância, resiliência e balanceamento de carga em ambientes críticos.

 

Nos equipamentos com sistema operacional DmOS, o MC-LAG funciona no modo Active/Standby, onde um dos PEs assumirá o papel de ativo, e o outro, o papel standby, servindo como um dispositivo backup. O tráfego será encaminhado apenas para o dispositivo PE sinalizado como ativo.

A configuração entre os PEs envolve os parâmetros de:

  • VLAN de interligação dos PEs ativo e standby;
  • Interface L3 com um endereço IP associado;

 

Já para o funcionamento do MC-LAG, teremos:

A configuração do lag-priority de menor índice definirá qual será a conexão física (das duas alocadas para o link aggregation) do LAG que será percorrida pelo tráfego, denominada ativa, e qual ficará em espera, denominada standby. Deve ser evitado o uso do mesmo valor de lag-priority nos dois PEs.

 

Os pares do MC-LAG utilizam o Inter-Chassis Control Protocol (ICCP) para trocar informações de controle e coordenar entre si, garantindo que o tráfego de dados seja encaminhado corretamente.

O LACP é usado para descobrir vários links de um dispositivo CE conectado a um par MC-LAG e deve ser configurado em ambos os pares MC-LAG para o funcionamento correto.

O parâmetro de admin-key do LAG entre os PEs deverá ser igual, o DmOS utiliza mesmo valor do ID do LAG como admin-key.

A seguir temos um cenário típico de MC-LAG, com as condições perfeitas de funcionamento entre todos os equipamentos, reforçamos que a topologia é composta pelo CE A – identificado pela imagem de um computador e os switches PE A e PE B.


Cenário Tradicional de MC-LAG

 

O fluxo de dados será encaminhado pela interligação ativa do LAG 1, sinalizado pela seta verde, entre o PE A e o CE A, seguindo pela interface de uplink principal com a rede L2 acima dos dois switches configurados em MC-LAG, o equipamento PE B será mantido com o status standby e sem tráfego de dados, entre PE B e o CE A.

A rede L2, identificada pela nuvem na imagem acima, possuirá protocolos para a prevenção de loops lógicos, como spanning-tree (xSTP), EAPS, ERPS ou outros, logo, a porta por onde o tráfego será encaminhado, no nosso caso a do PE A – DmOS 1 deverá estar ativa/liberada.

Em situações normais de operação de uma rede, os enlaces estão sujeitos a falhas simples e mais complexas, que detalhamos a seguir, os quais, geram 5 comportamentos distintos.

 

Caso 1 – Falha Única entre CE e PE

 A falha, sinalizada com um “X” vermelho na topologia abaixo, ocorre em uma das conexões físicas que compõem o LAG1, e opera como link principal de interligação entre PE A e CE A.

Observe que o equipamento PE A – DmOS 1 permanece como ativo, pois não houve perda na comunicação com o PE B – DmOS 2, logo o tráfego fluirá pelo outro membro do LAG1, a conexão entre o CE A e PE B. Já o encaminhamento do tráfego para a rede L2 continuará pelo PE A, pois percorre a interligação entre os dois switches (A e B) em MC-LAG.

A normalização ocorrerá após a interligação principal entre PE A e CE A ficar disponível.

 

Caso 2 – Falha Única entre PEs

A falha ocorre no link de interligação entre os PEs, é onde ocorre a situação de Split Brain.

No cenário acima, em teoria, haverá a  condição de split brain. A comunicação entre os PEs é interrompida, fazendo com que o PE A permaneça em estado Ativo, porém, o PE B terá o seu status alterado para Ativo.

Na prática, o tráfego do MC-LAG continuará fluindo sem perturbações, não haverá a convergência do tráfego para o PE B, contudo é importante que a conexão entre os PEs seja reestabelecida, pois é um ponto de atenção na arquitetura MC-LAG.

O valor de System Priority define a preferência do equipamento na seleção dos links ativos em um LAG. Esse valor é transmitido nos LACPDUs, permitindo que o equipamento remoto (CE), interprete corretamente a hierarquia de prioridade entre os sistemas.

Para restaurar o funcionamento, é necessário garantir a normalização do link de controle entre os PEs, permitindo que o PE B retorne ao estado de Standby, mantendo o PE A como único Ativo.

 

Caso 3 – Falha Única no PE Ativo

A falha ocorre no equipamento PE A, o qual opera como equipamento ativo do MC-LAG, interrompendo o link principal de interligação entre PE A e CE A, bem como o de interligação entre os PEs.

Note que esse cenário representa tanto a falha total do PE A, quanto a interrupção simultânea das 03 conexões (isolamento total) que o conectam à topologia.

O equipamento PE A estará totalmente inoperante, por consequência, o PE B e o CE A perdem a comunicação com o equipamento ativo, fazendo com que o PE B assuma o papel de ativo, aqui, não acontece o split brain, pois apenas o PE B assumirá como ativo.

O tráfego será redirecionado para a conexão secundária do LAG 1 entre PE B e CE A – seta verde. Quanto a interconexão com a rede L2, uma vez que o PE A está totalmente inoperante, a interface será identificada como down, fazendo com que o  protocolo de resiliência realize a convergência.

A topologia será reestabelecida após o equipamento PE A e suas conexões serem normalizadas.

 

Caso 4 – Falha Dupla no PE Ativo

O isolamento do PE A (equipamento ativo do MC-LAG) pode ocorrer por dupla falha, quando o link interligação entre PE A e CE A e de interligação entre os PEs estão inativos, como por exemplo, um rompimento.

Com esta falha, o equipamento PE A e PE B perdem a comunicação e ambos passam a ficar com status Ativo, ocorrendo o fenômeno conhecido como split brain, porém, mesmo com os dois PEs assumindo o status de Ativo, não haverá impacto, pois existe uma falha na conectividade principal do LAG 1 entre PE A e CE A, sinalizado pelo “X” em vermelho. O tráfego será redirecionado para a interligação secundária entre CE A e PE B.

Destaca-se que a interconexão com a rede L2 (nuvem) está fora do contexto do MC-LAG, a continuidade da comunicação, dependerá do protocolo de resiliência utilizado na rede e que seja capaz de perceber que o PE A não é mais um caminho válido e ativo para o CE A, realizando a convergência do tráfego para a conexão com o PE B.

Para reestabelecer a topologia,  ative em primeiro lugar a interligação entre PE A e PE B, de forma que somente o equipamento PE A fique com status Ativo, para na sequência  garantir que a interligação entre o PE A e CE A seja normalizada.

 

Caso 5 – Falha Dupla no CE

Ocorre com o isolamento do CE por dupla falha nos links principal e secundário do LAG 1, aqueles utilizados para a interligação com os PEs.

Esta falha não é comum, mas provoca interrupção total do tráfego.

O PE A permanecerá com o status Ativo e PE B como Standby, devido a comunicação entre PEs continuar operacional. Trata-se aqui da concretização do risco de ter um único CE.

O tráfego será reestabelecido após a normalização do CE A. 

 

Conclusão

O DmOS adota uma abordagem simplificada em relação ao vPC da Cisco, eliminando a necessidade de canais paralelos de controle (Peer-Link e Keepalive), o que reduz a complexidade e o custo de infraestrutura e configuração, sem comprometer a resiliência.   A solução Cisco vPC é ilustrada nesta documentação externa: 🔗 vPC Failure Scenarios – Impact and Solution

Recomendamos a leitura do tópico MC-LAG do nosso guia de configuração rápida do DmOS, onde destacamos  a aplicação de  prioridades diferentes nos campos system priority e mc-lag lag-priority.  

Essa prática é essencial para evitar impactos no tráfego em caso de perda da sessão de controle do MC-LAG (ICCP), como apresentado no Caso 2.

O recurso MC-LAG destaca-se pela entrega de serviços e pela alta disponibilidade entre switches, evitando a interrupção total do tráfego do cliente e está presente em cenários de datacenter, provedores de Internet e ambientes corporativos.

As possíveis falhas mencionadas visam alertar a possibilidade de ocorrência do split-brain, o qual poderá comprometer a integridade da rede, porém com dicas e com planejamento a mitigação dos problemas torna-se mais eficaz.

  • Especificação técnica - norma IEEE 802.1AX, seção 6.3.2 System identification

 

O parâmetro System Priority é incluído nas LACPDUs (Link Aggregation Control Protocol Data Units) trocadas durante o estabelecimento do LACP entre os equipamentos PEs e o equipamento CE.

A  identificação única de um sistema (System ID) é composta pela concatenação de um endereço MAC único administrado e pelo System Priority configurado, ou seja, a prioridade do sistema influencia diretamente qual lado será eleito como o sistema principal no LAG.

Em resumo, o equipamento com  o menor valor de System Priority será selecionado como ativo e terá os links principais no LAG, pois esse parâmetro é enviado nos pacotes de controle LACPDU, garantindo que o equipamento remoto (CE) identifique e aplique corretamente as prioridades recebidas, desde que implemente a norma IEEE 802.1AX.

A solução MC-LAG entre PEs foi desenvolvida para operação entre equipamentos do mesmo fabricante, não garantindo interoperabilidade com terceiros. Já o equipamento posicionado como CE, sim, desde que atenda ao IEEE 802.1AX, pois o LACP foi projetado para interoperar entre fabricantes diferentes.

Os casos apresentados ilustram falhas hipotéticas que são amplamente mitigáveis com as boas práticas de configuração abordadas neste artigo.

  • Informações complementares

 

Todas as configurações estão disponíveis no nosso “DmOS – Guia de Configuração Rápida” e em https://www.datacom.com.br/pt/blog/120/mc-lag-no-dmos-alta-disponibilidade-e-escalabilidade-em-infraestruturas-de-rede.


Se surgir qualquer dúvida ao longo do processo, nosso time Suporte - Datacom e Comercial - Datacom está pronto para apoiar você em cada etapa, garantindo excelência, agilidade e evolução contínua para o seu negócio.

 

Lembrando que a Datacom conta com uma estrutura completa em sua matriz onde são ofertados treinamentos presenciais, bem como uma plataforma de treinamentos on-line (DATACOM EAD). Nos treinamentos será possível realizar configurações de diversas topologias e cenários de aplicação, além de poder contar com a ajuda dos nossos profissionais em uma série de boas práticas que ajudarão muito na operação de sua rede.

Inscreva-se também no nosso canal do YouTube, marque o recebimento de notificações e compartilhe o link nas suas redes sociais.

TAGS

Voltar para o blog