Как настроить отказоустойчивость MPLS для обеспечения высокой доступности
Простои обходятся компаниям в тысячи долларов в минуту, что делает надежность сетей критически важной. Технология MPLS-переключения обеспечивает бесперебойное подключение, автоматически перенаправляя трафик при выходе из строя основных маршрутов. Вот краткий обзор:
- MPLS: технология, которая использует метки для направления трафика по заранее определенным маршрутам, обеспечивая более быструю и предсказуемую производительность.
- Отказоустойчивость: Автоматически переключается на резервные системы во время сбоев, сводя перерывы в работе к минимуму.
- Высокая доступность: поддерживает работу систем с минимальным временем простоя, обычно измеряемым в «девятках» (например, 99,99% — время безотказной работы = 52,56 минут простоя в год).
Основные этапы настройки отказоустойчивости MPLS
- Резервные схемы: Настройте основные и резервные каналы MPLS с различными физическими путями.
- Обнаружение отказа: Используйте мониторинг ICMP-пинга для обнаружения сбоев в течение нескольких секунд.
- Политики маршрутизации: Тонкая настройка атрибутов BGP, таких как Local Preference и AS Path Prepending, для бесперебойного перенаправления трафика.
- Тестирование: Моделируйте сбои, отслеживайте время отклика и проверяйте обновления маршрутизации для обеспечения надежности.
Распространенные проблемы и способы их устранения
- Несоответствующие атрибуты BGP: Стандартизировать предпочтения во всех схемах.
- Неправильные списки префиксов: Убедитесь, что включены все необходимые маршруты.
- Несоответствия таймера: Выровняйте таймеры BGP keepalive и hold.
- Пробелы в мощностях: Сопоставьте емкость резервного канала с основной нагрузкой трафика.
Инструменты для мониторинга и тестирования
- SNMP: Отслеживание статистики и оповещений интерфейса.
- Трассировка маршрута: Проверка путей трафика во время переключения при сбое.
- Системный журнал: Выявление проблем с помощью журналов маршрутизатора.
Надежные системы отказоустойчивости MPLS сокращают время простоя и поддерживают качество обслуживания, особенно в сочетании с надлежащими инструментами тестирования и мониторинга.
Проектирование и конфигурации MPLS + Интернет Dual WAN Enterprise | Настройка MPLS с переключением на резервный Интернет
Предпосылки и требования к сети
Перед настройкой отказоустойчивости MPLS крайне важно убедиться, что ваша сетевая инфраструктура готова поддерживать высокую доступность и плавный процесс отказоустойчивости. Эти основополагающие шаги имеют ключевое значение для построения надежной системы отказоустойчивости MPLS.
Требования к аппаратному и программному обеспечению
Начать с маршрутизаторы корпоративного уровня Сертифицированные для MPLS и разработанные для обеспечения высокой доступности. Убедитесь, что оборудование включает как минимум два WAN-интерфейса для поддержки резервирования MPLS. Устройства должны эффективно обрабатывать трафик MPLS без ущерба для производительности и стабильности.
Настройка сети и требования к интернет-провайдеру
Для оптимальной надежности убедитесь, что ваши основные и резервные цепи соответствуют разнообразные физические пути. Кроме того, дополните резервирование MPLS комбинацией каналов WAN, таких как широкополосные, сотовые или спутниковые соединения. Этот многоуровневый подход минимизирует риск проблем с подключением, вызванных сбоями в работе оператора.
Тесно сотрудничайте со своим интернет-провайдером, чтобы убедиться, что ваша сеть поддерживает протоколы отказоустойчивости. Прочное партнёрство с интернет-провайдером гарантирует бесперебойную работу механизмов отказоустойчивости, повышая общую устойчивость вашей сети.
Требования к электропитанию и окружающей среде
Стабильное питание и контролируемая среда так же важны, как и резервирование сети. Подключите все маршрутизаторы, коммутаторы и межсетевые экраны к источники бесперебойного питания (ИБП) Для защиты от перебоев с электроснабжением. Используйте резервные источники питания, чтобы исключить точки отказа, и объединяйте системы бесперебойного питания с аварийными генераторами на случай длительных отключений электроэнергии.
Для систем, критически важных для MPLS, поддерживайте резервные системы охлаждения для предотвращения перегрева. В районах, подверженных стихийным бедствиям, рассмотрите возможность географического разнесения вашей сетевой инфраструктуры для обеспечения дополнительного уровня защиты. Например, глобальные хостинговые решения как те, которые предлагаются Serverion может поддерживать работу критически важных служб даже во время локальных сбоев.
Надежная система электропитания и экологическая безопасность так же важны, как и резервные каналы MPLS, когда речь идет об обеспечении высокой доступности и бесперебойного подключения.
Пошаговая настройка отказоустойчивости MPLS
Настройка отказоустойчивости MPLS включает в себя создание резервных каналов, реализацию механизмов обнаружения и определение политик маршрутизации. Ниже приведено подробное руководство по настройке каждого компонента системы отказоустойчивости MPLS.
Настройка резервных каналов MPLS
Для обеспечения надежности используйте несколько путей передачи данных. первичный канал MPLS как предпочтительный маршрут и вторичная цепь в качестве резервного. Каждый канал должен быть подключен к отдельным маршрутизаторам Provider Edge (PE), чтобы минимизировать риск возникновения единой точки отказа.
- Использовать сообщества BGP для назначения приоритетов маршрутам: назначьте локальное предпочтение 100 для основного контура и 90 для резервного.
- Для повышения устойчивости выбирайте физически разнообразные маршруты.
- Если в вашей организации используются смешанные типы подключения (например, широкополосный доступ или резервное сотовое подключение), настройте статические маршруты на устройствах WAN. Назначьте различные административные расстояния, обеспечив приоритет MPLS-подключения над другими вариантами.
Настройка обнаружения отказа
Для обнаружения неисправностей цепи настройте Мониторинг ICMP-пингаНастройте маршрутизаторы на непрерывную отправку пингов критически важным адресам через каждый канал MPLS. Если система обнаруживает определённое количество последовательных сбоев пинга (обычно 3–5), она отметит канал как недоступный и запустит процедуры аварийного переключения.
Настройка политик маршрутизации для отказоустойчивости
Точная настройка решений по маршрутизации с помощью сообщества BGP для управления выбором пути в вашей сети MPLS. Вот как настроить политики маршрутизации:
- Включить форматирование сообщества BGP на вашем клиентском маршрутизаторе:
ip bgp-community новый-формат - Определить список префиксов IP для сетей, требующих отказоустойчивости:
IP prefix-list PFX-LIST-TO-CTL разрешение 10.10.10.0/24 - Создать карту маршрута который соответствует вашему списку префиксов и присваивает желаемое значение сообщества BGP:
route-map SEND-COMM-TO-CTL разрешение 10 сопоставление префиксов IP-адресов PFX-LIST-TO-CTL установка сообщества 209:90 route-map SEND-COMM-TO-CTL разрешение 20- Ценность сообщества
209:90устанавливает локальное предпочтение 90, делая этот путь менее предпочтительным, чем значение по умолчанию 100. - Второе разрешение гарантирует, что остальные маршруты будут рекламироваться в обычном режиме.
- Ценность сообщества
- Использовать Добавление пути AS на резервных маршрутах, чтобы сделать их маршруты менее привлекательными в обычных условиях. В случае отказа основного маршрута добавленный маршрут становится следующим оптимальным доступным маршрутом.
Тестирование и проверка отказоустойчивости MPLS
После настройки системы отказоустойчивости MPLS следующим важным шагом станет её тестирование для обеспечения надёжной работы при сбоях в работе сети. Этот процесс подтверждает, что ваши резервные каналы, механизмы обнаружения и политики маршрутизации работают должным образом при возникновении сбоев.
Моделирование отказов и мониторинг реагирования
Лучший способ проверить отказоустойчивость MPLS — это моделировать сценарии отказов В контролируемой обстановке. Например, вы можете физически отключить первичный контур или использовать неисправность Команда, имитирующая полный отказ цепи. Это позволяет наблюдать, как быстро ваша сеть переключается на резервный маршрут.
Для измерения время обнаруженияОтслеживайте ответы ICMP-пингов во время теста. В идеале система должна обнаруживать сбои в течение 15–45 секунд, в зависимости от интервала пингования и настроек порога сбоя. Запишите время, необходимое для перенаправления трафика на резервный канал.
Вы также можете протестировать сценарии частичной деградации Например, имитация потери пакетов от 10 до 15% позволяет увидеть реакцию системы. Многие конфигурации настроены на аварийное переключение, когда потеря пакетов превышает 5% в течение 30 секунд.
Для более детального анализа проведите Тестирование конвергенции BGP Чтобы увидеть, насколько быстро обновляются таблицы маршрутизации в вашей сети. При аварийном переключении BGP должен отозвать маршруты, связанные с отказавшим каналом, и вместо них объявить резервный маршрут. Используйте показать ip bgp Команда для проверки того, что объявления маршрутов обновляются в течение 30–60 секунд. Убедитесь, что значения локальных предпочтений автоматически корректируются, делая резервный маршрут предпочтительным.
Наконец, используйте рычаги сетевой мониторинг инструменты для проверки производительности отказоустойчивости.
Использование инструментов сетевого мониторинга
SNMP-мониторинг Предоставляет аналитику в режиме реального времени о вашем отказоустойчивом MPLS-соединении. Настройте систему управления сетью на опрос статистики интерфейса каждые 30 секунд, отслеживая такие показатели, как состояние интерфейса, потеря пакетов и частота ошибок. Настройте оповещения, чтобы получать уведомления о резких скачках загрузки интерфейса в резервном канале, сигнализируя о необходимости аварийного переключения.
Анализ системного журнала — ещё один ценный инструмент для понимания триггеров и времени аварийного переключения. Настройте маршрутизаторы на отправку критически важных журналов, таких как события BGP и интерфейсов, на централизованный сервер системных журналов. Ищите записи в журнале, указывающие на сбой в отношениях соседей BGP и их восстановление на альтернативных каналах.
Бегать тесты traceroute до, во время и после имитации сбоев, чтобы убедиться, что трафик следует по ожидаемому маршруту. Например, во время переключения на резерв вы должны увидеть перенаправление трафика с основного PE-маршрутизатора на резервный PE-маршрутизатор в течение настроенного вами периода обнаружения.
Инструменты мониторинга пропускной способности Необходимы для обеспечения способности резервного канала справляться с нагрузкой. Если ваш основной канал обычно передает трафик со скоростью 80 Мбит/с, а резервный — только 50 Мбит/с, при отказе могут возникнуть проблемы с производительностью. Следите за уровнями загрузки и корректируйте планирование пропускной способности по мере необходимости.
После завершения тестирования сосредоточьтесь на записи и анализе результатов.
Регистрация результатов теста
Задокументируйте результаты испытаний, указав точную дату и время (мм/дд/гггг чч:мм:сс AM/PM). Укажите такие сведения, как тип неисправности, время обнаружения и продолжительность воздействия.
Начните с создания базовый уровень производительности который фиксирует нормальное поведение сети перед началом тестирования. Запишите среднюю задержку, потерю пакетов и пропускную способность как основного, так и резервного каналов во время штатной работы. Этот базовый показатель поможет вам выявить любые изменения производительности при аварийном переключении.
Регистрируйте любые проблемы с конфигурацией обнаруженные в ходе тестирования. Например, отметьте конкретные команды маршрутизатора, которые не работали должным образом, и предпринятые действия по их устранению. Если вы изменили интервалы пингования, таймеры BGP или задержки объявления маршрутов, также задокументируйте эти изменения.
Отслеживать показатели влияния на бизнес во время тестирования отказоустойчивости, например, времени отклика приложений, жалоб пользователей и процента доступности сервисов. Например, если ваша система VoIP испытывает плохое качество связи более двух минут во время отказоустойчивости, зафиксируйте эту проблему для дальнейшего изучения и оптимизации.
Наконец, настройте регулярный график тестирования Для обеспечения постоянной надежности. Многие организации проводят тестирование отказоустойчивости ежемесячно или ежеквартально, часто во время планового технического обслуживания, чтобы минимизировать сбои. Проводите тестирование в разное время суток, чтобы понять, как различные объемы трафика влияют на производительность отказоустойчивости. Ведите подробные записи, чтобы отслеживать улучшения с течением времени, такие как более высокая скорость обнаружения и сокращение перерывов в обслуживании.
sbb-itb-59e1987
Устранение распространенных проблем с отказоустойчивостью MPLS
Даже при самой тщательной подготовке системы отказоустойчивости MPLS иногда могут сталкиваться с проблемами, нарушая бесперебойную работу сети во время сбоев. Знание этих проблем и знание способов их решения поможет обеспечить надежную и высокую доступность вашей сети.
Распространенные ошибки конфигурации
Одна из частых ошибок при настройке отказоустойчивости MPLS заключается в следующем: несоответствующие атрибуты BGPНапример, если ваш основной канал объявляет маршруты с локальным приоритетом 200, а резервный использует значение по умолчанию 100, система всегда будет отдавать предпочтение основному маршруту, даже если он работает неэффективно. Чтобы решить эту проблему, убедитесь, что оба канала имеют одинаковые атрибуты BGP. Используйте показать ip bgp Команда для сравнения объявлений маршрутов на основном и резервном PE-маршрутизаторах. При необходимости отрегулируйте значения локальных предпочтений, часто устанавливая их на 150 для основных каналов и 100 для резервных.
Другая распространенная проблема — неправильные конфигурации списка префиксов, что может блокировать объявления маршрутов. Слишком строгие списки префиксов могут не учитывать необходимые подсети или маршруты /32 для хостов, добавленные позже. Проверьте свои списки префиксов с помощью показать список префиксов IP чтобы гарантировать включение всех соответствующих диапазонов сети.
Несоответствия таймера Между таймерами BGP keepalive и hold также могут возникать проблемы. Например, если один канал использует 60-секундный таймер удержания, а другой — 180 секунд, поведение аварийного переключения может быть нестабильным. Стандартизируйте эти таймеры для всех каналов — в большинстве сетей используется 60-секундный таймер удержания с 20-секундными интервалами keepalive.
И наконец, ошибки карты маршрута Может помешать потоку трафика. Неправильно настроенные карты маршрутов могут не изменять такие атрибуты, как значения MED или добавление пути AS. Используйте показать карту маршрута чтобы убедиться, что ваши конфигурации соответствуют предполагаемому поведению при отказе.
Диагностика проблем с отказоустойчивостью
После проверки настроек конфигурации сосредоточьтесь на поведении сети в реальном времени, чтобы выявить проблемы. Начните с проверки статус интерфейса с использованием показать интерфейсыРезервные каналы должны иметь статус «включено/включено». Проблемы часто возникают, когда резервные интерфейсы находятся в отключенном состоянии или имеют проблемы на физическом уровне.
Следующий, проверить таблицы маршрутизации с показать IP-маршрутРезервные маршруты должны отображаться с более высокими административными расстояниями или более низкими значениями приоритета. Если эти маршруты отсутствуют, проверьте соседние отношения BGP, используя показать сводку ip bgp.
Исследовать Выбор пути BGP с показать ip bgp для выявления проблем с предпочтениями. Процесс принятия решений BGP учитывает такие факторы, как локальные предпочтения, длина пути автономной системы, тип источника и значения MED. Резервные каналы с более длинными путями автономной системы могут не сработать, даже если основной канал испытывает трудности.
Проверять коммутация меток MPLS с показать таблицу пересылки mpls для обеспечения правильного распределения меток по каналам. Даже если таблицы маршрутизации выглядят нормально, проблемы с метками могут блокировать трафик на резервных маршрутах.
Использовать отлаживайте команды осторожно в реальных условиях. Команды типа отладка обновлений IP BGP может выявить, почему объявления маршрутов не распространяются, но включить отладку только во время периодов обслуживания и отключить ее сразу после них.
Наконец, проверьте на петли маршрутизации Использование traceroute из нескольких мест. Циклы могут возникать, когда резервные каналы создают непредвиденные зависимости путей, из-за чего трафик бесконечно перескакивает между маршрутизаторами.
Устранение проблем с задержкой и производительностью
Когда происходит отказ, обеспечить соответствие резервных каналов основному каналу по емкости и политикам QoSЕсли основной сервер поддерживает 100 Мбит/с, а резервный — только 50 Мбит/с, производительность снизится. Используйте опрос SNMP для мониторинга использования интерфейса и показать интерфейс политики-карты для подтверждения согласованности настроек QoS.
Проблемы обнаружения MTU пути Может возникнуть, если резервные каналы имеют меньшие максимальные блоки передачи. Например, если основной канал поддерживает кадры размером 1500 байт, а резервный фрагментирует пакеты по 1400 байт, приложения могут столкнуться с тайм-аутами. Проверьте размер MTU, отправив ping-запрос с установленным битом «не фрагментировать»: ping -f -l 1472 destination_ip.
Асимметричная маршрутизация — ещё одна причина увеличения задержки. Это происходит, когда трафик проходит по разным путям в каждом направлении, часто из-за того, что основной и резервный каналы подключаются к разным точкам. Используйте traceroute как от источника, так и от назначения, чтобы выявить асимметрию, а затем скорректируйте атрибуты BGP для обеспечения симметричной маршрутизации.
Переполнение буфера в резервных цепях Может привести к потере пакетов в периоды высокой нагрузки. Проверьте статистику интерфейса с помощью показать интерфейсы Для выявления сбоев ввода/вывода или сбоев буфера. Отрегулируйте размер буфера или используйте шейпинг трафика для более эффективной обработки пиков.
Задержки разрешения DNS Может создать впечатление, что отработка отказа происходит медленнее, чем есть на самом деле. Приложения могут продолжать использовать кэшированные IP-адреса даже после переключения маршрутизации на резервные каналы. Уменьшите значения DNS TTL для критически важных сервисов до 300 секунд или меньше, чтобы приложения могли быстро адаптироваться к новым маршрутам.
Наконец, адрес Тайм-ауты TCP-соединения путем настройки параметров проверки активности приложения. Многие приложения по умолчанию используют двухчасовые таймеры проверки активности TCP, задерживая обнаружение изменений пути. Сократите эти интервалы до 60–120 секунд для более быстрого реагирования на отказ.
Заключение
Ключевые моменты
Настройка отказоустойчивости MPLS требует тщательного планирования, точного выполнения и постоянного обслуживания. Для начала внедрите резервные MPLS-каналы, которые обеспечат бесперебойную работу как основного, так и резервного маршрутов. Также важно поддерживать согласованные настройки BGP для обеспечения плавного перехода на отказ.
Регулярное тестирование является обязательным. Моделирование отказоустойчивости помогает выявить любые проблемы конфигурации до того, как они приведут к реальным проблемам. Инструменты сетевого мониторинга здесь бесценны, предоставляя информацию о показателях производительности и помогая выявлять потенциальные проблемы на ранней стадии. При возникновении проблем систематическое устранение неполадок, например, проверка состояний интерфейсов и таблиц маршрутизации, позволяет быстро восстановить работу.
С самого начала, производительность при отказе Резервные пути должны обеспечивать приемлемую производительность, чтобы качество обслуживания не снижалось во время сбоев.
Документация и стандартизация Не менее важны. Стандартизация настроек таймера BGP, списков префиксов и карт маршрутов позволяет минимизировать ошибки конфигурации и упростить устранение неполадок. Хорошо документированный и стандартизированный подход не только облегчает первоначальное развертывание, но и повышает эффективность текущего обслуживания. Такой уровень готовности укрепляет основу для надежной интеграции сети и хостинга.
Использование хостинговых решений для обеспечения высокой доступности
Чтобы дополнить вашу стратегию отказоустойчивости MPLS, интегрируйте надежные хостинговые решения может дополнительно повысить высокую доступность. Сеть глобальных центров обработки данных Serverion отлично сочетается с MPLS-сетями, предлагая варианты географически распределенного хостинга, соответствующие архитектуре вашей сети.
Услуги колокейшн Они особенно эффективны при использовании с MPLS. Размещая инфраструктуру на нескольких площадках, подключенных через вашу отказоустойчивую сеть, вы можете сократить задержки при нормальной работе и обеспечить непрерывность обслуживания в случае простоя основной площадки.
Для организаций, полагающихся на виртуализированные рабочие нагрузки, развертывание VPS и выделенные серверы В нескольких центрах обработки данных обеспечивается стабильная связь между площадками. Сочетание отказоустойчивости на уровне сети с резервированием инфраструктуры обеспечивает дополнительную защиту от непредвиденных сбоев.
Кроме того, управляемые услуги Может оптимизировать координацию обновлений сети и хостинга. Это гарантирует оптимизацию механизмов отказоустойчивости и ресурсов хостинга и соответствие вашим меняющимся потребностям.
Инвестиции в отказоустойчивость MPLS в сочетании с надежной инфраструктурой хостинга обеспечивают очевидные преимущества, в том числе: минимизация затрат на простои и улучшение пользовательского опыта. Вместе эти технологии обеспечивают постоянную доступность сети, помогая вам оставаться конкурентоспособными и устойчивыми.
Часто задаваемые вопросы
Каковы основные преимущества использования отказоустойчивости MPLS для обеспечения высокой доступности в бизнес-сетях?
Обеспечение отказоустойчивость MPLS Обеспечивает бесперебойную работу вашей корпоративной сети, автоматически перенаправляя трафик во время сбоев. Это сокращает время простоя, позволяя продолжать работу без перебоев и обеспечивая стабильный пользовательский опыт.
Благодаря встроенным функциям резервирования и отказоустойчивости MPLS способствует высокая доступность и повышает надежность сети. Это также повышает Качество обслуживания (QoS), что делает его отличным выбором для предприятий, которым требуется стабильное подключение для основных приложений.
Как убедиться, что мой резервный канал MPLS сможет обрабатывать тот же трафик, что и основной, во время переключения при отказе?
Чтобы убедиться, что ваш резервный канал MPLS может обрабатывать тот же трафик, что и основной, во время аварийного переключения, вам необходимо настроить балансировка нагрузки а также транспортная инженерия по обоим каналам. Это подразумевает внедрение систем, равномерно распределяющих трафик, и выделение полосы пропускания в соответствии с пропускной способностью основного канала.
Также крайне важно следить за динамикой трафика и при необходимости корректировать настройки. Это гарантирует, что ваш резервный канал связи будет работать так же хорошо, как и основной. Контролируя управление трафиком, вы сможете поддерживать высокая доступность и сократить время простоя в ситуациях отказа, обеспечивая бесперебойную и надежную работу вашей сети.
Каких ошибок следует избегать при настройке атрибутов BGP для отказоустойчивости MPLS?
Распространенные ошибки при настройке атрибутов BGP для отказоустойчивости MPLS
При настройке атрибутов BGP для аварийного переключения MPLS существует несколько распространённых ошибок, которые могут привести к проблемам. Вот на что следует обратить внимание:
- Неправильно настроенные параметры маршрута: Установка таких атрибутов, как местные предпочтения или же МЕД (Многовыходной дискриминатор) может привести к неэффективной маршрутизации, плохим путям переключения при отказе или даже к образованию петель маршрутизации.
- Неправильная фильтрация маршрутов: Если резервные маршруты не отфильтрованы или не приоритизированы должным образом, аварийное переключение может задержаться, а также может возникнуть непредвиденное поведение маршрутизации. Всегда проверяйте, правильно ли настроены резервные маршруты и назначены ли им правильные приоритеты.
- Неправильные настройки отражателя маршрута: Ошибки при настройке отражателей маршрутов могут нарушить процесс переключения при сбое и поставить под угрозу стабильность маршрутизации.
Для поддержания высокой доступности вам необходимо хорошо понимать такие атрибуты BGP, как масса, местные предпочтения, и МЕДТщательная настройка, тщательное планирование и тщательное тестирование помогут вам обойти эти проблемы и обеспечить плавное переключение MPLS при отказе.