联系我们

info@serverion.com

给我们打电话

+1 (302) 380 3902

如何配置 MPLS 故障转移以实现高可用性

如何配置 MPLS 故障转移以实现高可用性

停机每分钟都会给企业造成数千美元的损失,因此可靠的网络至关重要。MPLS 故障转移功能可在主路径发生故障时自动重新路由流量,从而确保连接不中断。以下是简要分析:

  • MPLS:一种使用标签引导流量沿预定义路径传输的技术,可确保更快、更可预测的性能。
  • 故障转移:停电期间自动切换到备用系统,最大限度地减少中断。
  • 高可用性:保持系统正常运行,停机时间最短,通常以“九”来衡量(例如,99.99% 正常运行时间 = 每年停机时间 52.56 分钟)。

设置 MPLS 故障转移的关键步骤

  1. 冗余电路:使用不同的物理路径配置主 MPLS 电路和备份 MPLS 电路。
  2. 故障转移检测:使用 ICMP ping 监控在几秒钟内检测到中断。
  3. 路由策略:微调 BGP 属性(如本地首选项和 AS 路径前置),实现无缝流量重定向。
  4. 测试:模拟故障、监控响应时间并验证路由更新以确保可靠性。

常见问题及修复

  • BGP 属性不匹配:标准化整个电路的偏好。
  • 不正确的前缀列表:确保包含所有必需的路线。
  • 计时器不匹配:对齐 BGP 保持活动和保持计时器。
  • 产能缺口:将备用电路容量与主要流量负载相匹配。

监控和测试工具

  • SNMP:跟踪界面统计数据和警报。
  • 跟踪路由:验证故障转移期间的流量路径。
  • 系统日志:通过路由器日志识别问题。

可靠的 MPLS 故障转移系统可以减少停机时间并保持服务质量,尤其是与适当的测试和监控工具配合使用时。

MPLS + Internet 双 WAN 企业设计和配置 | 具有 Internet 故障转移功能的 MPLS 设置

先决条件和网络要求

在设置 MPLS 故障转移之前,务必确认您的网络基础架构已准备好支持高可用性和顺畅的故障转移流程。这些基础步骤是构建可靠的 MPLS 故障转移系统的关键。

硬件和软件要求

从...开始 企业级路由器 经过 MPLS 认证且设计为高可用性。确保硬件至少包含两个 WAN 接口以支持 MPLS 冗余。设备应能够高效处理 MPLS 流量,且不影响性能或稳定性。

网络设置和 ISP 要求

为了获得最佳可靠性,请确保主电路和备用电路遵循 多样化的物理路径此外,还可以通过混合使用宽带、蜂窝或卫星连接等 WAN 链路来补充 MPLS 冗余。这种多层方法可以最大限度地降低运营商网络中断导致的连接问题风险。

与您的 ISP 紧密合作,确认您的网络设置支持故障转移协议。强大的 ISP 合作关系可确保您的故障转移机制无缝运行,从而增强网络的整体弹性。

电源和环境要求

稳定的电源和受控的环境与网络冗余同样重要。将所有路由器、交换机和防火墙连接到 不间断电源(UPS) 防止断电。使用冗余电源消除单点故障,并将UPS系统与应急发电机配对,以应对长时间断电。

对于对 MPLS 至关重要的系统,维护 冗余冷却系统 防止过热。在易受自然灾害影响的地区,可以考虑在网络基础设施中增加地理多样性,以提供额外的保护。例如, 全球托管解决方案 就像那些提供的 服务器 即使在局部中断期间也能保持关键服务的运行。

在确保高可用性和不间断连接方面,可靠的电源和环境设置与冗余 MPLS 电路同样重要。

逐步 MPLS 故障转移配置

设置 MPLS 故障转移涉及创建冗余电路、实施检测机制以及定义路由策略。以下是配置 MPLS 故障转移系统各个部分的详细指南。

设置冗余 MPLS 电路

为了确保可靠性,请建立多条电路路径。配置 主 MPLS 电路 作为首选路线和 二次电路 作为备份。每个电路应连接到单独的提供商边缘 (PE) 路由器,以最大限度地降低单点故障的风险。

  • 使用 BGP 社区 确定路由优先级:为主电路分配本地优先级 100,为备份电路分配本地优先级 90。
  • 选择物理上不同的路线以增强弹性。
  • 如果您的组织使用混合连接类型(例如宽带或蜂窝备份),请在 WAN 设备上配置静态路由。分配不同的管理距离,确保 MPLS 连接优先于其他选项。

配置故障转移检测

要检测电路故障,请设置 ICMP ping 监控配置路由器,使其通过每条 MPLS 电路持续 ping 关键目的地。如果系统检测到连续 ping 失败次数达到一定值(通常为 3-5 次),则会将该电路标记为不可用,并启动故障转移程序。

配置故障转移的路由策略

微调路由决策 BGP 社区 控制 MPLS 网络中的路径选择。配置路由策略的方法如下:

  1. 启用 BGP 社区格式 在您的客户边缘路由器上:
    ip bgp-community 新格式 
  2. 定义 IP 前缀列表 对于需要故障转移的网络:
    ip 前缀列表 PFX-LIST-TO-CTL 允许 10.10.10.0/24 
  3. 创建路线图 与您的前缀列表匹配并分配所需的 BGP 社区值:
    路由图 SEND-COMM-TO-CTL 允许 10 匹配 IP 地址前缀列表 PFX-LIST-TO-CTL 设置社区 209:90 路由图 SEND-COMM-TO-CTL 允许 20 
    • 社区价值 209:90 将本地首选项设置为 90,使该路径的优先级低于默认值 100。
    • 第二个许可语句确保其他路线照常通告。
  4. 使用 AS 路径前置 在备用电路上,使其路由在正常情况下不那么有吸引力。如果主电路发生故障,则前置路径将成为下一个最佳可用路由。

测试和验证 MPLS 故障转移

配置 MPLS 故障转移系统后,下一个关键步骤是对其进行测试,以确保在网络中断期间能够可靠地运行。此过程可确认您的冗余电路、检测机制和路由策略在发生故障时能够按预期协同工作。

模拟故障并监控响应

测试 MPLS 故障转移的最佳方法是 模拟故障场景 在受控设置中。例如,您可以物理断开主电路,或者使用 关掉 命令模拟整个电路故障。这样您就可以观察网络切换到备份路径的速度。

测量 检测时间在测试期间跟踪 ICMP ping 响应。理想情况下,系统应在 15 到 45 秒内检测到故障,具体取决于您的 ping 间隔和故障阈值设置。记录流量重新路由到备份电路所需的时间。

您还可以测试 部分退化情景 通过在主电路上引入丢包或延迟来实现。例如,模拟 10 到 15% 的丢包,可以了解系统如何反应。许多设置配置为在 30 秒内丢包超过 5% 时进行故障转移。

为了进行更详细的分析, BGP收敛测试 查看路由表在网络中的更新速度。在故障转移期间,BGP 应该撤回与故障电路关联的路由,并改为通告备份路径。使用 显示 IP BGP 命令验证路由通告是否在 30 到 60 秒内更新。确保本地优先级值自动调整,使备份电路成为首选路径。

最后,杠杆 网络监控 验证故障转移性能的工具。

使用网络监控工具

SNMP监控 提供 MPLS 故障转移的实时洞察。配置您的网络管理系统,每 30 秒轮询一次接口统计信息,密切关注接口状态、数据包丢失和错误率等指标。设置警报,当备用电路上的接口利用率出现峰值时通知您,从而发出故障转移事件的信号。

系统日志分析 是另一个有助于理解故障转移触发条件和时间安排的有用工具。配置路由器,将关键日志(例如 BGP 和接口事件)发送到集中式系统日志服务器。查找指示 BGP 邻居关系中断并在备用电路上重新建立的日志条目。

跑步 跟踪路由测试 在模拟故障之前、期间和之后进行测试,以确认流量是否遵循预期路径。例如,在故障转移期间,您应该会看到流量在配置的检测时间范围内从主 PE 路由器重新路由到备份 PE 路由器。

带宽监控工具 对于确保备用电路能够处理流量负载至关重要。如果您的主电路通常承载 80 Mbps 的流量,而备用电路仅支持 50 Mbps,则在故障转移期间可能会遇到性能问题。请监控利用率水平并根据需要调整容量规划。

测试完成后,重点记录和分析结果。

记录测试结果

使用精确的日期和时间戳 (MM/DD/YYYY HH:MM:SS AM/PM) 记录测试结果。记录内容需包含故障类型、检测时间和影响持续时间等详细信息。

首先创建一个 绩效基线 在测试开始前捕获正常的网络行为。记录主电路和备用电路在正常运行期间的平均延迟、数据包丢失和吞吐率。此基准将帮助您识别故障转移期间的任何性能变化。

记录任何 配置问题 测试过程中发现的问题。例如,记录未按预期工作的特定路由器命令以及已采取的纠正措施。如果您调整了 ping 间隔、BGP 计时器或路由通告延迟,也请记录这些更改。

追踪 业务影响指标 在故障转移测试期间,例如应用程序响应时间、用户投诉和服务可用性百分比。例如,如果您的 VoIP 系统在故障转移期间通话质量不佳超过两分钟,请记录此问题以便进一步调查和优化。

最后,设置一个 定期测试计划 确保持续的可靠性。许多组织每月或每季度进行一次故障转移测试,通常在计划的维护时段进行,以最大程度地减少中断。在一天中的不同时间进行测试,以了解不同的流量负载如何影响故障转移性能。保留详细的记录,以跟踪随时间推移的改进,例如更快的检测率和服务中断的减少。

排除常见 MPLS 故障转移问题

即使做好了充分的准备,MPLS 故障转移系统有时仍会遇到问题,导致网络中断期间的平稳运行。识别这些问题并了解如何解决它们,有助于确保您的网络保持可靠的高可用性。

常见配置错误

MPLS 故障转移设置中经常出现的一个错误是 BGP 属性不匹配例如,如果您的主电路通告的路由本地优先级为 200,而备份电路使用默认值 100,则系统将始终优先使用主路径,即使主路径性能不佳。要解决此问题,请确认两条电路共享一致的 BGP 属性。使用 显示 IP BGP 命令比较主 PE 路由器和备份 PE 路由器上的路由通告。根据需要调整本地优先级值,通常将主电路设置为 150,将备份电路设置为 100。

另一个常见问题是 前缀列表配置不正确,这可能会阻止路由通告。过于严格的前缀列表可能会忽略后续添加的必要子网或 /32 主机路由。请使用以下方法检查您的前缀列表: 显示 IP 前缀列表 以确保包含所有相关的网络范围。

计时器不匹配 BGP 保持定时器和保活定时器之间的差异也可能导致问题。例如,如果一条线路使用 60 秒的保持定时器,而另一条线路使用 180 秒,故障转移行为可能会不一致。应在所有线路上统一这些定时器——大多数网络使用 60 秒的保持定时器和 20 秒的保活定时器间隔。

最后, 路线图错误 可能会干扰流量。配置错误的路由图可能无法修改 MED 值或 AS 路径前缀等属性。使用 显示路线图 验证您的配置是否符合预期的故障转移行为。

诊断故障转移问题

验证配置设置后,请关注实时网络行为以查明问题。首先检查 接口状态 使用 显示接口备份电路应显示“up/up”状态。当备份接口处于关闭状态或存在物理层问题时,通常会出现问题。

下一个, 验证路由表显示 IP 路由备份路由应具有更高的管理距离或更低的优先级值。如果缺少这些路由,请使用以下方式检查您的 BGP 邻居关系: 显示 IP BGP 摘要.

检查 BGP 路径选择显示 IP BGP 识别优先级问题。BGP 的决策过程会考虑本地优先级、AS 路径长度、源类型和 MED 值等因素。即使主路由出现问题,具有较长 AS 路径的备份路由也可能无法启动。

查看 MPLS标签交换显示 mpls 转发表 确保标签在线路上正确分配。即使路由表看起来没有问题,标签问题也可能会阻塞备份路径上的流量。

使用 谨慎调试命令 在实际环境中。命令如下 调试 IP BGP 更新 可以揭示为什么路由通告没有传播,但只能在维护窗口期间启用调试并在之后立即禁用它。

最后,测试 路由循环 使用来自多个位置的 traceroute。当备份电路创建意外的路径依赖关系时,可能会发生环路,导致流量在路由器之间无休止地跳转。

解决延迟和性能问题

当发生故障转移时, 确保备用电路在容量和 QoS 策略上与主电路匹配如果主服务器支持 100 Mbps,但备份服务器仅支持 50 Mbps,性能就会受到影响。使用 SNMP 轮询来监控接口利用率,并 显示策略图接口 确认 QoS 设置一致。

路径 MTU 发现问题 如果备用电路的最大传输单元 (MTU) 较小,则可能会出现这种情况。例如,如果主电路支持 1,500 字节的帧,但备用电路将数据包分片为 1,400 字节,则应用程序可能会出现超时。可以通过设置“不分片”位进行 ping 来测试 MTU 大小: ping -f -l 1472 目标IP地址.

非对称路由 是导致延迟增加的另一个元凶。这种情况发生在流量在每个方向上通过不同的路径传输时,通常是由于主电路和备用电路连接到不同的位置。使用来自源和目标的 traceroute 来发现不对称,然后调整 BGP 属性以确保对称路由。

备用电路上的缓冲区溢出 在高流量时段会导致数据包丢失。使用以下方式检查接口统计信息: 显示接口 识别输入/输出丢包或缓冲区故障。调整缓冲区大小或实施流量整形,以更有效地处理突发流量。

DNS解析延迟 会使故障转移看起来比实际更慢。即使路由已切换到备份线路,应用程序仍可能继续尝试缓存的 IP 地址。将关键服务的 DNS TTL 值降低至 300 秒或更短,以便应用程序能够快速适应新的路径。

最后,地址 TCP 连接超时 通过调整应用程序的 Keepalive 设置来实现。许多应用程序默认的 TCP Keepalive 计时器为 2 小时,这会延迟路径变更的检测。请将这些间隔缩短至 60-120 秒,以加快故障转移响应速度。

结论

关键点

设置 MPLS 故障转移需要周密的规划、精准的执行和持续的维护。首先,部署冗余 MPLS 线路,确保主路径和备用路径都能无缝处理网络流量。此外,保持一致的 BGP 设置对于实现平稳的故障转移也至关重要。

定期测试是必须的。 运行故障转移模拟有助于发现任何配置问题,避免它们导致实际问题。网络监控工具在这方面发挥着至关重要的作用,它们能够洞察性能指标,并帮助您及早发现潜在问题。当问题确实出现时,系统性的故障排除(例如检查接口状态和路由表)可以快速恢复服务。

从一开始, 故障转移期间的性能 应优先考虑。备份路径必须提供可接受的性能,以确保服务质量在中断期间不会受到影响。

文档和标准化 同等重要。通过标准化 BGP 计时器设置、前缀列表和路由映射,您可以最大限度地减少配置错误并简化故障排除。完善的标准化方法不仅支持初始部署,还能提高后续维护的效率。这种程度的准备工作为强大的网络和托管集成奠定了坚实的基础。

使用托管解决方案实现高可用性

为了补充您的 MPLS 故障转移策略,集成可靠的 托管解决方案 可以进一步增强高可用性。Serverion 的全球数据中心网络与 MPLS 设置完美匹配,提供与您的网络架构相符的地理分布托管选项。

主机托管服务 与 MPLS 结合使用时尤其有效。通过将基础设施部署在通过支持故障转移的网络连接的多个站点,您可以减少正常运行期间的延迟,并在主站点发生故障时确保服务的连续性。

对于依赖 虚拟化工作负载,部署 VPS 和专用服务器 跨多个数据中心的部署可确保站点之间连接一致。将网络级故障转移与基础设施冗余相结合,可有效防范意外中断。

此外, 托管服务 可以简化网络和主机更新之间的协调。这可确保故障转移机制和主机资源保持优化,并满足您不断变化的需求。

投资 MPLS 故障转移以及可靠的托管基础设施可带来明显的好处,包括 最大限度地减少停机成本 以及更佳的用户体验。这些技术共同作用,可保持一致的网络可用性,帮助您保持竞争力和弹性。

常见问题解答

使用 MPLS 故障转移来确保业务网络的高可用性的主要优势是什么?

确保 MPLS 故障转移 通过在中断期间自动重定向流量,您的业务网络可保持平稳运行。这可以减少停机时间,确保业务不间断地继续运行,并保持稳定的用户体验。

由于其内置的冗余和故障转移功能,MPLS 促进 高可用性 并增强了网络可靠性。它还提高了 服务质量(QoS)这使得它非常适合依赖稳定连接来运行基本应用程序的企业。

如何确保我的备份 MPLS 电路在故障转移期间能够处理与主电路相同的流量?

为了确保备份 MPLS 电路在故障转移期间能够处理与主电路相同的流量,您需要设置 负载均衡交通工程 跨越两个电路。这意味着要实施能够均匀分配流量的系统,并分配与主电路容量相匹配的带宽。

密切关注流量模式并根据需要调整配置也至关重要。这可确保您的备用链路性能与主链路一样好。通过保持流量管理的领先地位,您可以维护 高可用性 并减少故障转移期间的停机时间,使您的网络保持平稳可靠地运行。

设置 MPLS 故障转移的 BGP 属性时应避免哪些错误?

配置 MPLS 故障转移的 BGP 属性的常见错误

在设置用于 MPLS 故障转移的 BGP 属性时,一些常见的错误步骤可能会导致问题。以下是需要注意的事项:

  • 路线偏好配置错误:设置属性,例如 当地偏好 要么 地中海 (多出口鉴别器)错误会导致路由效率低下、故障转移路径不佳,甚至路由循环。
  • 路由过滤不当:如果备份路由未正确过滤或优先级设置,故障转移可能会延迟,或者可能会出现意外的路由行为。请务必确保备份路由配置正确并设置了正确的优先级。
  • 路由反射器设置不正确:配置路由反射器时的错误步骤可能会破坏故障转移过程并危及路由稳定性。

为了保持高可用性,您需要牢牢掌握 BGP 属性,例如 重量, 当地偏好, 和 地中海。仔细的配置、周密的规划和严格的测试可以帮助您避开这些问题并确保顺利的 MPLS 故障转移。

相关博客文章

zh_CN