在企业园区网或数据中心接入层,单台交换机往往面临着“单点故障”的风险。一旦设备宕机,整个下联业务将全面中断。为了解决这一痛点,H3C 的 IRF2(Intelligent Resilient Framework 2,智能弹性架构) 技术应运而生。

今天,我们将结合一个典型的堆叠型可靠网络设计案例,手把手教大家如何配置两台 H3C 交换机进行 IRF2 堆叠。通过本方案,我们将实现控制平面的统一、链路的高可用性以及业务的无缝切换。同时,我们还将重点讲解 MAD(多 Active 检测) 机制的配置,这是保障堆叠系统不出现“双主冲突”的关键安全防线。


一、网络拓扑与设计思路

本次实验基于以下拓扑结构,旨在构建一个高可用的接入/汇聚层网络:

  • 核心设备:两台 H3C 交换机(SW1 和 SW2)通过 40G 高速链路组建 IRF2 堆叠系统。
  • 上行链路:堆叠系统与上层路由器(Router)通过 GE_0/0 接口互联,运行 OSPF 或静态路由,并配置 NAT 出口。
  • 下行链路
    • VLAN 10 (10.1.1.0/24):连接左侧终端,通过跨设备的链路聚合上联至堆叠系统。
    • VLAN 20 (10.1.2.0/24):连接右侧终端,同样采用双归属冗余连接。
  • 关键特性
    • MAD 多主检测:防止堆叠分裂导致的 IP 冲突和路由混乱。
    • 优先级选举:确保指定的设备成为 Master,便于管理。

二、部署前准备与注意事项

在开始敲命令之前,请务必注意以下工程细节,这往往是新手容易踩坑的地方:

  1. 物理链路要求:堆叠链路(Stack Port)对带宽和延迟极其敏感。强烈建议使用 40G (FortyGigE) 或 100G 接口。虽然部分低端型号支持 10G 堆叠,但在高负载下极易导致堆叠分裂。本例中使用 FortyGigE 接口。
  2. 版本一致性:确保两台交换机的软件版本完全一致,否则可能导致堆叠失败。
  3. 配置顺序:先配置 Member ID 和 Priority,再配置物理堆叠端口,最后激活。

三、SW1(Master)配置详解

SW1 将被规划为堆叠系统中的 Master 设备。我们通过设置较高的优先级来确保它在选举中胜出。

1. 基础环境清理与优先级设置

首先关闭不必要的日志提示,保持控制台清爽,然后设置优先级。默认优先级为 1,数值越大越优先,这里我们设置为 5。

<H3C> system-view
[H3C] sysname SW1
[SW1] undo info-center enable        # 关闭日志弹窗干扰
[SW1] irf member 1 priority 5        # 设置优先级为5,确保成为Master
2. 配置堆叠物理端口

为了防止配置过程中出现环路或错误,建议先 Shutdown 端口,配置完 Port Group 后再开启。

# 进入40G接口视图,先关闭端口
[SW1] interface range FortyGigE 1/0/53 FortyGigE 1/0/54
[SW1-if-range] shutdown
[SW1-if-range] quit

# 创建堆叠逻辑端口组 1/1
[SW1] irf-port 1/1
[SW1-irf-port1/1] port group interface FortyGigE 1/0/53
[SW1-irf-port1/1] port group interface FortyGigE 1/0/54
[SW1-irf-port1/1] quit

# 重新开启物理端口
[SW1] interface range FortyGigE 1/0/53 FortyGigE 1/0/54
[SW1-if-range] undo shutdown
[SW1-if-range] quit

# 保存当前配置(重要!)
[SW1] save force

四、SW2(Slave)配置详解

SW2 需要修改成员编号(Member ID)为 2,因为 IRF 系统中每个成员的 ID 必须唯一。

1. 修改成员编号并重启

这一步会改变设备的逻辑身份,必须重启生效。

<H3C> system-view
[H3C] sysname SW2
[SW2] undo info-center enable

# 将成员编号从默认的1改为2
[SW2] irf member 1 renumber 2
[SW2] save force
[SW2] reboot   # 必须重启才能生效
2. 配置堆叠物理端口

重启后,设备的接口名称会变为 2/0/xx 格式。

# 进入40G接口视图(注意接口号变成了2开头),先关闭
[SW2] interface range FortyGigE 2/0/53 FortyGigE 2/0/54
[SW2-if-range] shutdown
[SW2-if-range] quit

# 创建堆叠逻辑端口组 2/2
[SW2] irf-port 2/2
[SW2-irf-port2/2] port group interface FortyGigE 2/0/53
[SW2-irf-port2/2] port group interface FortyGigE 2/0/54
[SW2-irf-port2/2] quit

# 重新开启物理端口
[SW2] interface range FortyGigE 2/0/53 FortyGigE 2/0/54
[SW2-if-range] undo shutdown
[SW2-if-range] quit

# 保存当前配置
[SW2] save force

五、激活堆叠与验证(关键步骤)

这是最重要的一步。我们需要在两台设备上分别执行激活命令,使逻辑拓扑生效。

操作顺序:

  1. 先在 SW1 上输入激活命令。
  2. 紧接着在 SW2 上输入激活命令。
  3. 等待几秒钟,两台设备会自动进行选举和合并。此时你的终端可能会断开连接,这是正常的,请重新连接到新的 Master 设备(原 SW1)。

激活命令:

# 在 SW1 和 SW2 上分别执行
[SW1] irf-port-configuration active
[SW2] irf-port-configuration active

验证堆叠状态:

重新登录后,使用以下命令检查堆叠是否成功:

# 查看堆叠成员状态
display irf

# 查看堆叠拓扑
display irf topology

如果看到 MemberID 分别为 1 和 2,且角色分别为 Master 和 Standby,说明堆叠建立成功。


六、配置 LACP MAD 防裂(关键安全机制)

MAD(多 Active 检测)是 IRF2 堆叠的“保命符”。如果堆叠链路发生故障导致系统分裂,而没有 MAD 机制,网络中就会出现两台拥有相同 IP 和 MAC 地址的“Master”,引发严重的数据冲突和网络瘫痪。

最推荐且最常用的方式是 LACP MAD 检测。它利用下行连接终端或接入交换机的聚合链路来传递检测报文,不需要额外占用接口或部署专用中间设备。

1. 原理简述

当 IRF 系统分裂后,原备交换机(Standby)会升级为 Master。此时网络中存在两个 Master。它们会通过下行的聚合链路发送 LACP 协议报文。一旦检测到对方也是 Master(通过 TLV 字段),优先级较低(或 Member ID 较大)的一方会自动进入 Recovery 状态,关闭除保留端口外的所有业务端口,从而避免冲突。

2. 配置步骤

请在 IRF 堆叠建立成功后的 Master 设备上统一进行以下配置(配置会自动同步到 Standby)。

第一步:创建专门的 MAD VLAN

为了避免业务流量干扰检测报文,建议创建一个专用的 VLAN 用于 MAD 检测。

# 进入系统视图
system-view

# 创建 VLAN 99 (作为 MAD 专用 VLAN)
vlan 99
 description MAD_VLAN
 quit

第二步:在聚合接口上开启 MAD 功能

假设你的下行链路聚合接口为 Bridge-Aggregation 1(对应图中的 XGE_0/50 等物理口组成的 Eth-Trunk)。

# 进入聚合接口视图
interface Bridge-Aggregation 1

# 开启 LACP MAD 功能
mad enable

# 将接口加入 MAD 专用 VLAN 
# 推荐使用 Hybrid 模式,允许 MAD VLAN 不带标签通过
port link-type hybrid
port hybrid vlan 99 untagged
quit

第三步:配置 MAD 域(Domain)

确保同一个 IRF 系统中的所有成员使用相同的 MAD 域值。

# 进入 MAD VLAN 接口
interface Vlan-interface 99
 mad bridge-domain 10
 quit

注:mad bridge-domain 的值需要在同一网络中唯一,通常设置为一个整数即可。


七、后续业务配置建议

堆叠建立并配置好 MAD 后,两台交换机在逻辑上变为一台设备。接下来你可以按照你实际的设计需求继续配置业务,比如我图中的业务:

  1. VLAN Trunk:在下行接口配置 port link-type trunk 并允许 VLAN 10 和 20 通过。
  2. 链路聚合:由于现在是一个逻辑设备,你可以直接将 SW1 的 XGE_0/50 和 SW2 的 XGE_0/50 加入同一个 Eth-Trunk 接口,实现跨设备链路聚合,彻底消除二层环路风险。
  3. 网关与路由:在 IRF 虚接口(Vlan-interface)上配置 VLAN 10 和 20 的网关 IP,并配置上行静态路由或动态路由协议。

通过以上步骤,你就拥有了一个既具备高性能转发,又拥有可靠性的高可用网络架构。希望这篇实战指南对你的工作有所帮助!

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐