Contate-Nos

info@serverion.com

Ligue para nós

+1 (302) 380 3902

Como configurar o failover de MPLS para alta disponibilidade

Como configurar o failover de MPLS para alta disponibilidade

O tempo de inatividade custa às empresas milhares de dólares por minuto, tornando a confiabilidade das redes crítica. O failover MPLS garante conectividade ininterrupta, redirecionando o tráfego automaticamente quando os caminhos primários falham. Aqui está uma breve análise:

  • MPLS: Uma tecnologia que usa rótulos para direcionar o tráfego por caminhos predefinidos, garantindo um desempenho mais rápido e previsível.
  • Failover:Alterna automaticamente para sistemas de backup durante interrupções, minimizando interrupções.
  • Alta disponibilidade: Mantém os sistemas funcionando com tempo de inatividade mínimo, normalmente medido em "noves" (por exemplo, tempo de atividade de 99,99% = 52,56 minutos de tempo de inatividade anualmente).

Etapas principais para configurar o failover de MPLS

  1. Circuitos Redundantes: Configurar circuitos MPLS primários e de backup com diversos caminhos físicos.
  2. Detecção de Failover: Use o monitoramento de ping ICMP para detectar interrupções em segundos.
  3. Políticas de Roteamento: Ajuste atributos BGP como Preferência Local e Prefixo de Caminho AS para redirecionamento de tráfego perfeito.
  4. Testando: Simule falhas, monitore tempos de resposta e verifique atualizações de roteamento para garantir confiabilidade.

Problemas comuns e correções

  • Atributos BGP incompatíveis: Padronizar preferências em todos os circuitos.
  • Listas de prefixos incorretos: Certifique-se de que todas as rotas necessárias estejam incluídas.
  • Desajustes de temporizador: Alinhar os temporizadores de manutenção e retenção do BGP.
  • Lacunas de capacidade: Combine a capacidade do circuito de backup com as cargas de tráfego primárias.

Ferramentas para monitorar e testar

  • SNMP: Acompanhe estatísticas e alertas da interface.
  • Traceroute: Verifique os caminhos de tráfego durante o failover.
  • Log de sistema: Identifique problemas por meio de logs do roteador.

Sistemas de failover MPLS confiáveis reduzem o tempo de inatividade e mantêm a qualidade do serviço, especialmente quando combinados com ferramentas adequadas de teste e monitoramento.

Projeto e configurações empresariais de MPLS + Internet Dual WAN | Configuração de MPLS com failover de Internet

Pré-requisitos e requisitos de rede

Antes de configurar o failover MPLS, é crucial confirmar se sua infraestrutura de rede está pronta para suportar alta disponibilidade e processos de failover tranquilos. Essas etapas fundamentais são essenciais para construir um sistema de failover MPLS confiável.

Requisitos de hardware e software

Comece com roteadores de nível empresarial certificados para MPLS e projetados para alta disponibilidade. Certifique-se de que o hardware inclua pelo menos duas interfaces WAN para suportar redundância MPLS. Os dispositivos devem ser capazes de lidar com o tráfego MPLS de forma eficiente, sem comprometer o desempenho ou a estabilidade.

Configuração de rede e requisitos do ISP

Para uma confiabilidade ideal, certifique-se de que seus circuitos primário e de backup sigam diversos caminhos físicosAlém disso, complemente a redundância MPLS com uma combinação de links WAN, como conexões de banda larga, celular ou satélite. Essa abordagem multicamadas minimiza o risco de problemas de conectividade causados por interrupções em toda a operadora.

Trabalhe em estreita colaboração com seu provedor de internet para confirmar se a configuração da sua rede suporta protocolos de failover. Uma parceria sólida com seu provedor de internet garante que seus mecanismos de failover operem perfeitamente, reforçando a resiliência geral da sua rede.

Requisitos de energia e ambientais

Energia estável e um ambiente controlado são tão críticos quanto a redundância da rede. Conecte todos os roteadores, switches e firewalls a fontes de alimentação ininterruptas (UPS) para proteger contra quedas de energia. Utilize fontes de alimentação redundantes para eliminar pontos únicos de falha e combine sistemas UPS com geradores de emergência para quedas de energia prolongadas.

Para sistemas críticos para MPLS, mantenha sistemas de resfriamento redundantes para evitar superaquecimento. Em áreas propensas a desastres naturais, considere adicionar diversidade geográfica à sua infraestrutura de rede para uma camada extra de proteção. Por exemplo, soluções globais de hospedagem como os oferecidos por Serverion pode manter serviços críticos funcionando mesmo durante interrupções locais.

Uma configuração de energia e ambiente confiável é tão importante quanto circuitos MPLS redundantes quando se trata de garantir alta disponibilidade e conectividade ininterrupta.

Configuração de failover MPLS passo a passo

A configuração do failover MPLS envolve a criação de circuitos redundantes, a implementação de mecanismos de detecção e a definição de políticas de roteamento. Aqui está um guia detalhado para configurar cada parte do seu sistema de failover MPLS.

Configurando circuitos MPLS redundantes

Para garantir a confiabilidade, estabeleça vários caminhos de circuito. Configure o circuito MPLS primário como a rota preferida e a circuito secundário como backup. Cada circuito deve se conectar a roteadores Provider Edge (PE) separados para minimizar o risco de um único ponto de falha.

  • Usar Comunidades BGP para priorizar rotas: atribua uma Preferência Local de 100 para o circuito primário e 90 para o backup.
  • Opte por rotas fisicamente diversas para maior resiliência.
  • Se a sua organização utiliza tipos de conectividade mistos (por exemplo, banda larga ou backup celular), configure rotas estáticas nos seus dispositivos WAN. Atribua diferentes distâncias administrativas, garantindo que a conexão MPLS tenha prioridade sobre outras opções.

Configurando a detecção de failover

Para detectar falhas no circuito, configure Monitoramento de ping ICMPConfigure roteadores para enviar ping continuamente a destinos críticos por meio de cada circuito MPLS. Se o sistema detectar um número específico de falhas consecutivas de ping (geralmente de 3 a 5), ele marcará o circuito como indisponível e iniciará os procedimentos de failover.

Configurando políticas de roteamento para failover

Ajuste as decisões de roteamento com Comunidades BGP para controlar a seleção de caminhos na sua rede MPLS. Veja como configurar políticas de roteamento:

  1. Habilitar formatação de comunidade BGP no seu roteador Customer Edge:
    ip bgp-community novo-formato 
  2. Definir uma lista de prefixos IP para redes que exigem failover:
    lista de prefixos IP PFX-LIST-TO-CTL permissão 10.10.10.0/24 
  3. Crie um mapa de rotas que corresponde à sua lista de prefixos e atribui o valor de comunidade BGP desejado:
    mapa de rotas SEND-COMM-TO-CTL permite 10 correspondência de lista de prefixos de endereço IP PFX-LIST-TO-CTL define comunidade 209:90 mapa de rotas SEND-COMM-TO-CTL permite 20 
    • O valor da comunidade 209:90 define uma Preferência Local de 90, tornando esse caminho menos preferido que o valor padrão de 100.
    • A segunda declaração de permissão garante que outras rotas sejam anunciadas normalmente.
  4. Usar Caminho AS Prependente em circuitos de backup para tornar suas rotas menos atrativas em condições normais. Se o circuito primário falhar, o caminho prefixado se torna a próxima melhor rota disponível.

Testando e verificando failover de MPLS

Após a configuração do seu sistema de failover MPLS, a próxima etapa crítica é testá-lo para garantir um desempenho confiável durante interrupções na rede. Esse processo confirma que seus circuitos redundantes, mecanismos de detecção e políticas de roteamento funcionam em conjunto conforme o esperado quando ocorrem falhas.

Simulação de falhas e monitoramento de resposta

A melhor maneira de testar o failover do MPLS é simular cenários de falha em um ambiente controlado. Por exemplo, você pode desconectar o circuito primário fisicamente ou usar o desligar comando para simular uma falha completa do circuito. Isso permite que você observe a rapidez com que sua rede alterna para o caminho de backup.

Para medir tempo de detecção, monitore as respostas de ping ICMP durante o teste. Idealmente, o sistema deve detectar falhas dentro de 15 a 45 segundos, dependendo do intervalo de ping e das configurações de limite de falha. Registre quanto tempo leva para o tráfego ser redirecionado para o circuito de backup.

Você também pode testar cenários de degradação parcial introduzindo perda de pacotes ou latência no circuito primário. Simular uma perda de pacotes de 10 a 15%, por exemplo, permite observar como o sistema reage. Muitas configurações são configuradas para failover quando a perda de pacotes excede 5% em um período de 30 segundos.

Para uma análise mais detalhada, realize Teste de convergência BGP para ver a rapidez com que as tabelas de roteamento são atualizadas em sua rede. Durante um failover, o BGP deve retirar as rotas associadas ao circuito com falha e anunciar o caminho de backup. Use o mostrar ip bgp comando para verificar se os anúncios de rota são atualizados em 30 a 60 segundos. Garanta que os valores de Preferência Local se ajustem automaticamente, tornando o circuito de backup o caminho preferencial.

Por fim, alavancagem monitoramento de rede ferramentas para validar o desempenho de failover.

Usando ferramentas de monitoramento de rede

Monitoramento SNMP Oferece insights em tempo real sobre o failover do seu MPLS. Configure seu sistema de gerenciamento de rede para consultar estatísticas de interface a cada 30 segundos, monitorando métricas como status da interface, perda de pacotes e taxas de erro. Configure alertas para notificá-lo se a utilização da interface atingir picos no circuito de backup, sinalizando um evento de failover.

Análise de Syslog é outra ferramenta valiosa para entender gatilhos e tempo de failover. Configure roteadores para enviar logs críticos – como eventos de BGP e de interface – para um servidor syslog centralizado. Procure entradas de log que indiquem que as relações de vizinhança BGP estão caindo e se restabelecendo em circuitos alternados.

Correr testes de traceroute antes, durante e depois de simulações de falhas para confirmar se o tráfego está seguindo o caminho esperado. Por exemplo, durante um failover, você deverá observar o redirecionamento do tráfego do roteador PE primário para o roteador PE de backup dentro do período de detecção configurado.

Ferramentas de monitoramento de largura de banda são essenciais para garantir que seu circuito de backup possa suportar a carga de tráfego. Se o seu circuito primário normalmente transporta 80 Mbps de tráfego, mas o seu circuito de backup suporta apenas 50 Mbps, você poderá enfrentar problemas de desempenho durante o failover. Monitore os níveis de utilização e ajuste o planejamento de capacidade conforme necessário.

Após a conclusão do teste, concentre-se em registrar e analisar os resultados.

Registro de resultados de testes

Documente os resultados dos seus testes com registros precisos de data e hora (MM/DD/AAAA HH:MM:SS AM/PM). Inclua detalhes como o tipo de falha, o horário de detecção e a duração do impacto.

Comece criando um linha de base de desempenho que captura o comportamento normal da rede antes do início dos testes. Registre a latência média, a perda de pacotes e as taxas de transferência para os circuitos primário e de backup durante as operações regulares. Essa linha de base ajudará você a identificar quaisquer alterações de desempenho durante o failover.

Registre qualquer problemas de configuração descobertos durante os testes. Por exemplo, anote comandos específicos do roteador que não funcionaram como esperado e as ações corretivas tomadas. Se você ajustou intervalos de ping, temporizadores BGP ou atrasos de anúncio de rota, documente essas alterações também.

Acompanhar métricas de impacto nos negócios durante testes de failover, como tempos de resposta de aplicativos, reclamações de usuários e porcentagens de disponibilidade do serviço. Por exemplo, se o seu sistema VoIP apresentar baixa qualidade de chamada por mais de dois minutos durante um failover, registre esse problema para investigação e otimização adicionais.

Por fim, configure um cronograma regular de testes Para garantir confiabilidade contínua. Muitas organizações realizam testes de failover mensalmente ou trimestralmente, frequentemente durante janelas de manutenção programadas, para minimizar interrupções. Teste em vários horários do dia para entender como diferentes cargas de tráfego afetam o desempenho do failover. Mantenha registros detalhados para acompanhar melhorias ao longo do tempo, como taxas de detecção mais rápidas e redução de interrupções de serviço.

Solução de problemas comuns de failover de MPLS

Mesmo com a melhor preparação, os sistemas de failover MPLS podem, às vezes, apresentar problemas, interrompendo o bom funcionamento durante interrupções de rede. Reconhecer esses problemas e saber como lidar com eles pode ajudar a garantir que sua rede mantenha alta disponibilidade confiável.

Erros comuns de configuração

Um erro frequente nas configurações de failover de MPLS envolve atributos BGP incompatíveisPor exemplo, se o seu circuito primário anunciar rotas com uma Preferência Local de 200, enquanto o circuito de backup usar o valor padrão de 100, o sistema sempre favorecerá o caminho primário, mesmo que ele esteja com baixo desempenho. Para resolver isso, confirme se ambos os circuitos compartilham atributos BGP consistentes. Use o mostrar ip bgp Comando para comparar anúncios de rota nos seus roteadores PE primários e de backup. Ajuste os valores de Preferência Local conforme necessário, geralmente definindo-os como 150 para circuitos primários e 100 para backups.

Outro problema comum é configurações incorretas da lista de prefixos, o que pode bloquear anúncios de rotas. Listas de prefixos excessivamente restritivas podem ignorar sub-redes necessárias ou rotas de host /32 adicionadas posteriormente. Verifique suas listas de prefixos com mostrar lista de prefixos IP para garantir que todos os intervalos de rede relevantes sejam incluídos.

Desajustes de temporizador A discrepância entre os temporizadores de keepalive e de espera do BGP também pode causar problemas. Por exemplo, se um circuito usa um temporizador de espera de 60 segundos e outro usa 180 segundos, o comportamento de failover pode ser inconsistente. Padronize esses temporizadores em todos os circuitos – a maioria das redes usa um temporizador de espera de 60 segundos com intervalos de keepalive de 20 segundos.

Por último, erros no mapa de rotas podem interferir no fluxo de tráfego. Mapas de rotas mal configurados podem não conseguir modificar atributos como valores MED ou prefixação de caminho AS. Use mostrar mapa de rotas para verificar se suas configurações estão alinhadas com o comportamento de failover pretendido.

Diagnosticando problemas de failover

Após a verificação das configurações, concentre-se no comportamento da rede em tempo real para identificar problemas. Comece verificando status da interface usando mostrar interfacesOs circuitos de backup devem exibir o status "up/up". Problemas geralmente surgem quando as interfaces de backup estão desligadas ou apresentam problemas na camada física.

Próximo, validar tabelas de roteamento com mostrar rota ip. Rotas de backup devem aparecer com distâncias administrativas maiores ou valores de preferência menores. Se essas rotas estiverem ausentes, inspecione seus relacionamentos de vizinhança BGP usando mostrar resumo do ip bgp.

Examinar Seleção de caminho BGP com mostrar ip bgp para identificar problemas de preferência. O processo de tomada de decisão do BGP considera fatores como Preferência Local, comprimento do caminho AS, tipo de origem e valores MED. Circuitos de backup com caminhos AS mais longos podem não ser ativados, mesmo quando o primário estiver com dificuldades.

Verificar Comutação de rótulos MPLS com mostrar tabela de encaminhamento mpls para garantir que os rótulos sejam distribuídos corretamente pelos circuitos. Mesmo que as tabelas de roteamento pareçam boas, problemas com rótulos podem bloquear o tráfego em caminhos de backup.

Usar depure os comandos com cautela em ambientes ao vivo. Comandos como depurar atualizações de ip bgp pode revelar por que os anúncios de rota não estão se propagando, mas só habilita a depuração durante as janelas de manutenção e a desabilita imediatamente depois.

Por último, teste para loops de roteamento usando traceroute de vários locais. Loops podem ocorrer quando circuitos de backup criam dependências de caminho inesperadas, fazendo com que o tráfego fique oscilando infinitamente entre roteadores.

Corrigindo problemas de latência e desempenho

Quando ocorre failover, garantir que os circuitos de backup correspondam ao circuito primário em termos de capacidade e políticas de QoSSe o primário suportar 100 Mbps, mas o backup suportar apenas 50 Mbps, o desempenho será prejudicado. Use a pesquisa SNMP para monitorar a utilização da interface e mostrar interface de mapa de políticas para confirmar se as configurações de QoS são consistentes.

Problemas de descoberta de MTU de caminho podem surgir se os circuitos de backup tiverem unidades máximas de transmissão menores. Por exemplo, se o circuito primário suportar quadros de 1.500 bytes, mas o de backup fragmentar pacotes a 1.400 bytes, os aplicativos poderão apresentar timeouts. Teste os tamanhos de MTU executando ping com o bit "não fragmentar" definido: ping -f -l 1472 ip_de_destino.

Roteamento assimétrico é outro culpado pelo aumento da latência. Isso acontece quando o tráfego percorre caminhos diferentes em cada direção, geralmente devido a circuitos primários e de backup conectando-se a locais diferentes. Use o traceroute da origem e do destino para detectar assimetrias e, em seguida, ajuste os atributos BGP para garantir um roteamento simétrico.

Estouros de buffer em circuitos de backup pode levar à perda de pacotes durante períodos de alto tráfego. Verifique as estatísticas da interface com mostrar interfaces para identificar quedas de entrada/saída ou falhas de buffer. Ajuste os tamanhos dos buffers ou implemente modelagem de tráfego para lidar com picos de tráfego de forma mais eficaz.

Atrasos na resolução de DNS pode fazer com que o failover pareça mais lento do que realmente é. Os aplicativos podem continuar tentando endereços IP em cache mesmo após o roteamento ter sido alterado para circuitos de backup. Reduza os valores de TTL do DNS para serviços críticos para 300 segundos ou menos, para que os aplicativos possam se adaptar rapidamente aos novos caminhos.

Por fim, endereço Tempo limite de conexão TCP ajustando as configurações de keepalive do aplicativo. Muitos aplicativos usam temporizadores de keepalive TCP de 2 horas por padrão, atrasando a detecção de alterações de caminho. Reduza esses intervalos para 60 a 120 segundos para uma resposta de failover mais rápida.

Conclusão

Pontos-chave

A configuração de failover MPLS exige planejamento cuidadoso, execução precisa e manutenção contínua. Para começar, implemente circuitos MPLS redundantes que garantam que tanto os caminhos primários quanto os de backup possam lidar com o tráfego de rede sem problemas. Também é essencial manter as configurações de BGP consistentes para permitir transições de failover tranquilas.

Testes regulares são essenciais. A execução de simulações de failover ajuda a descobrir quaisquer problemas de configuração antes que se transformem em problemas reais. Ferramentas de monitoramento de rede são inestimáveis nesse caso, oferecendo insights sobre métricas de desempenho e ajudando a detectar possíveis problemas precocemente. Quando surgem problemas, a solução sistemática de problemas – como a verificação do status da interface e das tabelas de roteamento – pode restaurar o serviço rapidamente.

Desde o início, desempenho durante failover deve ser uma prioridade. Os caminhos de backup devem fornecer desempenho aceitável para garantir que a qualidade do serviço não seja comprometida durante interrupções.

Documentação e padronização são igualmente importantes. Ao padronizar as configurações de temporizador BGP, listas de prefixos e mapas de rotas, você pode minimizar erros de configuração e simplificar a solução de problemas. Uma abordagem bem documentada e padronizada não apenas apoia a implantação inicial, mas também torna a manutenção contínua mais eficiente. Esse nível de preparação fortalece a base para uma integração robusta de rede e hospedagem.

Usando soluções de hospedagem para alta disponibilidade

Para complementar sua estratégia de failover MPLS, integrando confiável soluções de hospedagem pode aprimorar ainda mais a alta disponibilidade. A rede de data centers globais da Serverion combina perfeitamente com configurações MPLS, oferecendo opções de hospedagem geograficamente distribuídas que se alinham à arquitetura da sua rede.

Serviços de colocation são particularmente eficazes quando usados com MPLS. Ao implantar infraestrutura em vários locais conectados por meio de sua rede com failover habilitado, você pode reduzir a latência durante as operações normais e garantir a continuidade do serviço caso um local principal sofra inatividade.

Para organizações que dependem de cargas de trabalho virtualizadas, implantando VPS e servidores dedicados em vários data centers garante conectividade consistente entre os locais. A combinação de failover em nível de rede com redundância de infraestrutura adiciona camadas de proteção contra interrupções inesperadas.

Adicionalmente, serviços gerenciados pode otimizar a coordenação entre atualizações de rede e hospedagem. Isso garante que tanto os mecanismos de failover quanto os recursos de hospedagem permaneçam otimizados e alinhados às suas necessidades em constante evolução.

Investir em failover MPLS junto com uma infraestrutura de hospedagem confiável oferece benefícios claros, incluindo custos de tempo de inatividade minimizados e uma melhor experiência do usuário. Juntas, essas tecnologias trabalham para manter a disponibilidade consistente da rede, ajudando você a se manter competitivo e resiliente.

Perguntas frequentes

Quais são as principais vantagens de usar failover MPLS para garantir alta disponibilidade em redes empresariais?

Garantindo Failover de MPLS mantém a rede da sua empresa funcionando sem problemas, redirecionando automaticamente o tráfego durante interrupções. Isso reduz o tempo de inatividade, permitindo que as operações continuem sem interrupções e preservando uma experiência estável para o usuário.

Graças aos seus recursos integrados de redundância e failover, o MPLS promove alta disponibilidade e fortalece a confiabilidade da rede. Também aumenta Qualidade de Serviço (QoS), tornando-o uma ótima opção para empresas que dependem de conectividade estável para aplicativos essenciais.

Como posso ter certeza de que meu circuito MPLS de backup pode lidar com o mesmo tráfego que o primário durante um failover?

Para garantir que seu circuito MPLS de backup possa lidar com o mesmo tráfego que o principal durante um failover, você precisará configurar balanceamento de carga e engenharia de tráfego em ambos os circuitos. Isso significa implementar sistemas que distribuam o tráfego uniformemente e aloquem largura de banda de acordo com a capacidade do seu circuito primário.

Também é crucial monitorar os padrões de tráfego e ajustar as configurações conforme necessário. Isso garante que seu link de backup tenha o mesmo desempenho que o principal. Ao monitorar o gerenciamento de tráfego, você pode manter alta disponibilidade e reduzir o tempo de inatividade durante situações de failover, mantendo sua rede funcionando de forma tranquila e confiável.

Quais erros devo evitar ao configurar atributos BGP para failover de MPLS?

Erros comuns na configuração de atributos BGP para failover de MPLS

Ao configurar atributos BGP para failover de MPLS, existem alguns erros frequentes que podem causar problemas. Veja o que observar:

  • Preferências de rota mal configuradas: Definir atributos como preferência local ou MED (Multi-Exit Discriminator) usado incorretamente pode resultar em roteamento ineficiente, caminhos de failover ruins ou até mesmo loops de roteamento.
  • Filtragem de rota inadequada: Se as rotas de backup não forem filtradas ou priorizadas corretamente, o failover poderá ser atrasado ou comportamentos de roteamento inesperados poderão ocorrer. Certifique-se sempre de que as rotas de backup estejam configuradas corretamente e recebam a prioridade correta.
  • Configurações incorretas do refletor de rota: Erros na configuração de refletores de rota podem interromper o processo de failover e comprometer a estabilidade do roteamento.

Para manter alta disponibilidade, você precisa de um forte conhecimento dos atributos BGP, como peso, preferência local, e MED. Configuração cuidadosa, planejamento completo e testes rigorosos podem ajudar você a evitar esses problemas e garantir um failover de MPLS tranquilo.

Postagens de blog relacionadas

pt_PT