防伪码:没有相当程度的孤独是不可能有内心的平和。

1、概述

随着技术的发展,四张及以上的千兆以太网卡(NIC)已经变成了服务器的标配。而在生产环境中,为了保证Linux服务器的网络稳定,会对服务器的多张网卡通过绑定一个IP的方式来实现网卡的热备冗余,增强网络的高可用和提升网络吞吐,避免业务中断。

Linux的多网卡绑定功能使用的是内核中的"bonding"模块,主流Linux发行版本的内核均包含此模块。

网卡绑定的模式(mode)共有七种(0~6) :bond0、bond1、bond2、bond3、bond4、bond5、bond6

其中常用的有三种:

mode=0round robin平衡负载模式,有自动备援,且增加了带宽,能够大幅提升服务器的网络吞吐(I/O),但需要交换机支持

mode=1:active-backup,主-备份策略,一张网卡处于活动状态 ,另一张处于备份状态所有流量都在主链路上处理。而且该模式下的网卡MAC地址是外部可见得,从外面看来,bond的MAC地址是唯一的,从而避免交换机发生混乱。该模式只提供了容错能力,而没有负载功能。优点是可以提供高网络连接的可用性,但是它的资源利用率较低,只有一个接口处于工作状态,在有 N 个网络接口的情况下,资源利用率为1/N。

mode=6:平衡负载模式,有自动备援,且增加了带宽不需要交换机支持。接收负载均衡是通过ARP协商实现的。bonding驱动截获本机发送的ARP应答,并把源硬件地址改写为bond中某个slave的唯一硬件地址,从而使得不同的对端使用不同的硬件地址进行通信。

2、mode=1测试

2.1 测试环境

主机名 IP 系统
test-01 192.168.10.51 CentOS release 6.9 (Final)

本次测试通过VMware Workstation模拟。

2.2 添加网卡

在【虚拟机设置】中添加网络适配器。

查看网卡是否添加:

[root@test-01 ~]#ifconfig -aeth0      Link encap:Ethernet  HWaddr 00:0C:29:66:30:36inet addr:192.168.10.51  Bcast:192.168.10.255  Mask:255.255.255.0inet6 addr: fe80::20c:29ff:fe66:3036/64 Scope:LinkUP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1RX packets:91 errors:0 dropped:0 overruns:0 frame:0TX packets:76 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:9813 (9.5 KiB)  TX bytes:11278 (11.0 KiB)eth1      Link encap:Ethernet  HWaddr 00:0C:29:66:30:40BROADCAST MULTICAST  MTU:1500  Metric:1RX packets:0 errors:0 dropped:0 overruns:0 frame:0TX packets:0 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:0 (0.0 b)  TX bytes:0 (0.0 b)lo        Link encap:Local Loopbackinet addr:127.0.0.1  Mask:255.0.0.0inet6 addr: ::1/128 Scope:HostUP LOOPBACK RUNNING  MTU:65536  Metric:1RX packets:80 errors:0 dropped:0 overruns:0 frame:0TX packets:80 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:5360 (5.2 KiB)  TX bytes:5360 (5.2 KiB)

2.3 创建bond

[root@test-01 ~]#cd /etc/sysconfig/network-scripts/[root@test-01 network-scripts]#cp ifcfg-eth0 ifcfg-bond0[root@test-01 network-scripts]#vim ifcfg-bond0DEVICE=bond0TYPE=EthernetONBOOT=onNM_CONTROLLED=yesBOOTPROTO=staticIPADDR=192.168.10.51GATEWAY=192.168.10.2NETMASK=255.255.255.0DNS1=223.5.5.5

修改eth0:

[root@test-01 network-scripts]#vim ifcfg-eth0DEVICE=eth0TYPE=EthernetONBOOT=onBOOTPROTO=noneMASTER=bond0SLAVE=yes

修改eth1:

[root@test-01 network-scripts]#vim ifcfg-eth1DEVICE=eth1TYPE=EthernetONBOOT=onBOOTPROTO=noneMASTER=bond0SLAVE=yes

说明:MASTER=bond0和SLAVE=yes这两行参数主要是用于系统service network restart后自动启用。

2.4 模块加载

[root@test-01 network-scripts]#echo "alias bond0 bonding" >>/etc/modprobe.d/dist.conf[root@test-01 network-scripts]#echo "options bond0 mode=1 miimon=100" >>/etc/modprobe.d/dist.conf

说明:miimon是用来监测链路的,单位是ms(毫秒),即系统每100ms监测一次链路连接状态,若有一条链路不通就转入另一条链路。mode=1表示fault-tolerance (提供冗余功能)。

2.5 重启网卡

[root@test-01 ~]#service network restart

bond0、eth0和eth1的MAC地址均变成之前eth0的MAC地址。

[root@test-01 network-scripts]#ifconfigbond0     Link encap:Ethernet  HWaddr 00:0C:29:66:30:36inet addr:192.168.10.51  Bcast:192.168.10.255  Mask:255.255.255.0inet6 addr: fe80::20c:29ff:fe66:3036/64 Scope:LinkUP BROADCAST RUNNING MASTER MULTICAST  MTU:1500  Metric:1RX packets:33 errors:0 dropped:0 overruns:0 frame:0TX packets:31 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:2508 (2.4 KiB)  TX bytes:3486 (3.4 KiB)eth0      Link encap:Ethernet  HWaddr 00:0C:29:66:30:36UP BROADCAST RUNNING SLAVE MULTICAST  MTU:1500  Metric:1RX packets:971 errors:0 dropped:0 overruns:0 frame:0TX packets:686 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:91772 (89.6 KiB)  TX bytes:103730 (101.2 KiB)eth1      Link encap:Ethernet  HWaddr 00:0C:29:66:30:36UP BROADCAST RUNNING SLAVE MULTICAST  MTU:1500  Metric:1RX packets:14 errors:0 dropped:0 overruns:0 frame:0TX packets:0 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:872 (872.0 b)  TX bytes:0 (0.0 b)lo        Link encap:Local Loopbackinet addr:127.0.0.1  Mask:255.0.0.0inet6 addr: ::1/128 Scope:HostUP LOOPBACK RUNNING  MTU:65536  Metric:1RX packets:80 errors:0 dropped:0 overruns:0 frame:0TX packets:80 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:5360 (5.2 KiB)  TX bytes:5360 (5.2 KiB)

3、mode=1验证

3.1 断开eth0测试

宿主机ping192.168.10.51测试:

ping -t 192.168.10.51

默认连接的Slave是eth0,当断开eth0,观察到bond已经切换到eth1:

[root@test-01 ~]#cat /proc/net/bonding/bond0Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)Bonding Mode: fault-tolerance (active-backup)Primary Slave: NoneCurrently Active Slave: eth1MII Status: upMII Polling Interval (ms): 100Up Delay (ms): 0Down Delay (ms): 0Slave Interface: eth0MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 1Permanent HW addr: 00:0c:29:66:30:36Slave queue ID: 0Slave Interface: eth1MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 1Permanent HW addr: 00:0c:29:66:30:40Slave queue ID: 0

在宿主机上观察到ping有一次丢包:

正在 Ping 192.168.10.51 具有 32 字节的数据:来自 192.168.10.51 的回复: 字节=32 时间=1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64请求超时。来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64

3.2 断开eth1测试

同理,重新连接eth0,断开eth1,bond切换到eth0:

[root@test-01 ~]#cat /proc/net/bonding/bond0Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)Bonding Mode: fault-tolerance (active-backup)Primary Slave: NoneCurrently Active Slave: eth0MII Status: upMII Polling Interval (ms): 100Up Delay (ms): 0Down Delay (ms): 0Slave Interface: eth0MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 1Permanent HW addr: 00:0c:29:66:30:36Slave queue ID: 0Slave Interface: eth1MII Status: downSpeed: UnknownDuplex: UnknownLink Failure Count: 2Permanent HW addr: 00:0c:29:66:30:40Slave queue ID: 0

切换的时候也丢了一次包:

来自 192.168.10.51 的回复: 字节=32 时间=1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64请求超时。来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64请求超时。来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64来自 192.168.10.51 的回复: 字节=32 时间<1ms TTL=64

4、mode=6测试

4.1 配置

配置方法和mode=1差不多。

在mode=1的基础上修改/etc/sysconfig/network-scripts/ifcfg-bond0

echo "BONDING_OPTS='miimon=100 mode=6'" >>/etc/sysconfig/network-scripts/ifcfg-bond0

将mode=1改为mode=6:

sed -i 's#mode=1#mode=6#g' /etc/modprobe.d/dist.conf

重启网卡:

service network restart

4.2 验证

再次查看网卡信息,eth1网卡的MAC地址都变成了原来的了:

[root@test-01 ~]#ifconfigbond0     Link encap:Ethernet  HWaddr 00:0C:29:66:30:36inet addr:192.168.10.51  Bcast:192.168.10.255  Mask:255.255.255.0inet6 addr: fe80::20c:29ff:fe66:3036/64 Scope:LinkUP BROADCAST RUNNING MASTER MULTICAST  MTU:1500  Metric:1RX packets:3922 errors:0 dropped:0 overruns:0 frame:0TX packets:3710 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:354254 (345.9 KiB)  TX bytes:288643 (281.8 KiB)eth0      Link encap:Ethernet  HWaddr 00:0C:29:66:30:36UP BROADCAST RUNNING SLAVE MULTICAST  MTU:1500  Metric:1RX packets:3734 errors:0 dropped:0 overruns:0 frame:0TX packets:3517 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:337074 (329.1 KiB)  TX bytes:270629 (264.2 KiB)eth1      Link encap:Ethernet  HWaddr 00:0C:29:66:30:40UP BROADCAST SLAVE MULTICAST  MTU:1500  Metric:1RX packets:188 errors:0 dropped:0 overruns:0 frame:0TX packets:193 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:17180 (16.7 KiB)  TX bytes:18014 (17.5 KiB)lo        Link encap:Local Loopbackinet addr:127.0.0.1  Mask:255.0.0.0inet6 addr: ::1/128 Scope:HostUP LOOPBACK RUNNING  MTU:65536  Metric:1RX packets:83 errors:0 dropped:0 overruns:0 frame:0TX packets:83 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:5646 (5.5 KiB)  TX bytes:5646 (5.5 KiB)

Bonding Mode也变成了adaptive load balancing:

[root@test-01 ~]#cat /proc/net/bonding/bond0Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)Bonding Mode: adaptive load balancingPrimary Slave: NoneCurrently Active Slave: eth0MII Status: upMII Polling Interval (ms): 100Up Delay (ms): 0Down Delay (ms): 0Slave Interface: eth0MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 0Permanent HW addr: 00:0c:29:66:30:36Slave queue ID: 0Slave Interface: eth1MII Status: downSpeed: UnknownDuplex: UnknownLink Failure Count: 0Permanent HW addr: 00:0c:29:66:30:40Slave queue ID: 0

mode=6的主备冗余功能和mode=1一样,就不重复验证了。

mode=6负载均衡的工作机制是先占满eth0网卡的网络,再使用eth1的网络。