传统数据中心带外管理网络部署繁琐,需运维人员逐台登录设备配置IP与VLAN,耗时长且难以统一维护。星融元基于SONiC交换机推出的零配置上线方案,正推动运维模式向自动化、智能化转型。

该方案允许设备上电即联网,自动获取预规划地址与配置,并基于物理连接位置实现IP与设备绑定,极大简化了开局与扩容流程。运维人员无需再手动维护地址表,通过Option 82信息即可快速定位设备,提升了故障排查效率。双DHCP服务器冗余机制也增强了管理网络的可靠性,确保在设备或链路异常时管理通道不中断,真正实现了“无人值守”式运维。

数据中心带外管理网架构

基于SONiC的开放网络操作系统AsterNOS的方案核心在于,将管理意图(规划)预先部署在中心化的策略服务器中,而非每台设备上。其自动上线流程从根本上改变了运维人员的工作模式。

  • 交换机自动上线并分配到不同 VLAN 用于标识和区分

  • 终端主机根据DHCP请求包 option 携带的主机位置自动获取到预先规划的IP地址,完成上线(比如按照设备物理安装和连接位置按序分配,后续管理时可轻松定位)

  • 双活DHCP服务器,高可靠设计保障业务

数据中心管理网的零配置上线方案

本例所用到的设备为:

  • CX202P-24Y-M,2x100GE + 24x25GE QSFP28,作为管理网的Spine /核心交换机,运行TFTP server 和 DHCP server,支持 DHCP option82/66/671;

  • CX206Y-48GT-M,6x10GE+48x1GE RJ45,作为管理网的 Leaf/接入交换机,下连各类被管理设备;

  • 以上交换机均搭载基于SONiC的 AsterNOS 网络操作系统,容器化架构,支持完备的数据中心/云化园区网络特性。

网络设备零配置上线

  1. 被管理交换机通过发起DHCP请求获取IP地址、配置文件所在的TFTP服务器地址和开局文件名称

  2. 被管理交换机根据 DHCP 服务器给出的地址与TFTP Server 建立联系,获取开局文件(Smart_config.ini)并解析,开局文件中包含与此设备MAC匹配的唯一配置文件名称(MACn.cfg)

  3. 被管理交换机根据解析出的配置文件名称再次向TFTP Server 获取对应的配置文件并应用

配置文件为每台交换机分配了 VLAN,并配置好 DHCP Relay使其下接入的终端也能顺利通过 DHCP 过程获取到 IP 地址。

终端主机/服务器的零配置上线

终端设备(服务器或其他主机)接入网络后,通过以下流程获得地址:

  • 步骤1:终端发起DHCP Discovery广播请求。

  • 步骤2:接入交换机(Leaf)在转发请求时,在报文Option 82字段中插入自身MAC地址、终端所连端口号及VLAN ID,形成唯一的“位置指纹”。

  • 步骤3:Spine上的DHCP Server解析Option 82信息,从预定义的地址池中匹配并分配一个与该物理位置绑定的固定IP地址。

  • 步骤4:终端获得IP,实现即插即用上线。此机制确保了IP地址的可追溯性,便于运维定位

DHCP server 的高可靠设计

上述方案中,管理交换机和上行链路之外,DHCP server 也支持双活部署以提升业务可靠性:两台Spine交换机上都分别运行了DHCP服务器,并进行地址分配等相关信息的同步,当其中一台服务器出现故障,另一台服务器将继续从地址池中续订租约

正常情况下:两台DHCP服务器均收到DHCP请求,并向客户端发送IP地址,客户端挑选一条回复,收到回复的服务器并向对端设备同步地址信息,客户端到达任一个服务器均可以续租。

若某台DHCP服务器出现故障:客户端获取地址时由当前存活的DHCP服务器响应请求,根据客户端信息和地址池状态分配地址,交互完成后,本地更新租约信息,客户端的续租请求仅向存活服务器发起。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐