
Linux内核分析 - 网络[五]:网桥.doc
8页看完了路由表,重新回到netif_receive_skb ()函数,在提交给上层协议处理前,会执行下面一句,这就是网桥的相关操作,也是这篇要讲解的内容view plaincopy to clipboardprint?1. skb = handle_bridge(skb, &pt_prev, &ret, orig_dev); skb = handle_bridge(skb, &pt_prev, &ret, orig_dev); 网桥可以简单理解为交换机,以下图为例,一台linux机器可以看作网桥和路由的结合,网桥将物理上的两个局域网LAN1、LAN2当作一个局域网处理,路由连接了两个子网1.0和2.0从eth0和eth1网卡收到的报文在Bridge模块中会被处理成是由Bridge收到的,因此Bridge也相当于一个虚拟网卡 STP五种状态 DISABLED BLOCKING LISTENING LEARNING FORWARDING创建新的网桥br_add_bridge [net\bridge\br_if.c]当使用SIOCBRADDBR调用ioctl时,会创建新的网桥br_add_bridge。
首先是创建新的网桥:view plaincopy to clipboardprint?1. dev = new_bridge_dev(net, name); dev = new_bridge_dev(net, name); 然后设置dev->dev.type为br_type,而br_type是个全局变量,只初始化了一个名字变量view plaincopy to clipboardprint?1. SET_NETDEV_DEVTYPE(dev, &br_type); 2. static struct device_type br_type = { 3. .name = "bridge", 4. }; SET_NETDEV_DEVTYPE(dev, &br_type);static struct device_type br_type = { .name = "bridge",}; 然后注册新创建的设备dev,网桥就相当一个虚拟网卡设备,注册过的设备用ifconfig就可查看到:view plaincopy to clipboardprint?1. ret = register_netdevice(dev); ret = register_netdevice(dev); 最后在sysfs文件系统中也创建相应项,便于查看和管理:view plaincopy to clipboardprint?1. ret = br_sysfs_addbr(dev); ret = br_sysfs_addbr(dev);将端口加入网桥br_add_if() [net\bridge\br_if.c]当使用SIOCBRADDIF调用ioctl时,会向网卡加入新的端口br_add_if。
创建新的net_bridge_port p,会从br->port_list中分配一个未用的port_no,p->br会指向br,p->state设为BR_STATE_DISABLED这里的p实际代表的就是网卡设备view plaincopy to clipboardprint?1. p = new_nbp(br, dev); p = new_nbp(br, dev); 将新创建的p加入CAM表中,CAM表是用来记录mac地址与物理端口的对应关系;而刚刚创建了p,因此也要加入CAM表中,并且该表项应是local的[关系如下图],可以看到,CAM表在实现中作为net_bridge的hash表,以addr作为hash值,链入net_bridge_fdb_entry,再由它的dst指向net_bridge_portview plaincopy to clipboardprint?1. err = br_fdb_insert(br, p, dev->dev_addr); err = br_fdb_insert(br, p, dev->dev_addr); 设备的br_port指向p。
这里要明白的是,net_bridge可以看作全局量,是网桥,而net_bridge_port则是与网卡相对应的端口,因此每个设备dev有个指针br_port指向该端口view plaincopy to clipboardprint?1. rcu_assign_pointer(dev->br_port, p); rcu_assign_pointer(dev->br_port, p); 将新创建的net_bridge_port加入br的链表port_list中,在创建新的net_bridge_port时,会分配一个未用的port_no,而这个port_no就是根据br->port_list中的已经添加的net_bridge_port来找到未用的port_no的[具体如下图] view plaincopy to clipboardprint?1. list_add_rcu(&p->list, &br->port_list); list_add_rcu(&p->list, &br->port_list); 重新计算网桥的ID,这里根据br->port_list链表中的net_bridge_port的最小的addr来作为网桥的ID。
view plaincopy to clipboardprint?1. br_stp_recalculate_bridge_id(br); br_stp_recalculate_bridge_id(br); 网卡设备的删除br_del_bridge()与端口的移除add_del_if()与添加差不多,不再详述熟悉了网桥的创建与添加,再来看下网桥是如何工作的 当收到数据包,通过netif_receive_skb()->handle_bridge()处理网桥:view plaincopy to clipboardprint?1. static inline struct sk_buff *handle_bridge(struct sk_buff *skb, 2. struct packet_type **pt_prev, int *ret, 3. struct net_device *orig_dev) 4. { 5. struct net_bridge_port *port; 6. 7. if (skb->pkt_type == PACKET_LOOPBACK || 8. (port = rcu_dereference(skb->dev->br_port)) == NULL) 9. return skb; 10. 11. if (*pt_prev) { 12. *ret = deliver_skb(skb, *pt_prev, orig_dev); 13. *pt_prev = NULL; 14. } 15. 16. return br_handle_frame_hook(port, skb); 17. } static inline struct sk_buff *handle_bridge(struct sk_buff *skb, struct packet_type **pt_prev, int *ret, struct net_device *orig_dev){ struct net_bridge_port *port; if (skb->pkt_type == PACKET_LOOPBACK || (port = rcu_dereference(skb->dev->br_port)) == NULL) return skb; if (*pt_prev) { *ret = deliver_skb(skb, *pt_prev, orig_dev); *pt_prev = NULL; } return br_handle_frame_hook(port, skb);} 1. 如果报文来自lo设备,或者dev->br_port为空(skb->dev是收到报文的网卡设备,而在向网桥添加端口时,dev->br_port被赋予了创建的与网卡相对应的端口p),此时不需要网桥处理,直接返回报文; 2. 如果报文匹配了之前的ptype_all中的协议,则pt_prev不为空,此时要先进行ptype_all中协议的处理,再进行网桥的处理; 3. br_handle_frame_hook是网桥处理钩子函数,在br_init() [net\bridge\br.c]中 br_handle_frame_hook = br_handle_frame; br_handle_frame() [net\bridge\br_input.c]是真正的网桥处理函数, 下面进入br_handle_frame()开始网桥部分的处理: 与前面802.1q讲的一样,首先检查users来决定是否复制报文:view plaincopy to clipboardprint?1. skb = skb_share_check(skb, GFP_ATOMIC); skb = skb_share_check(skb, GFP_ATOMIC); 如果报文的目的地址是01:80:c2:00:00:0X,则是发往STP的多播地址,此时调用br_handle_local_finish()来完成报文的进一步处理:view plaincopy to clipboardprint?1. if (unlikely(is_link_local(dest))){ 2. …… 3. if (NF_HOOK(PF_BRIDGE, NF_BR_LOCAL_IN, skb, skb->dev, 4. NULL, br_handle_local_finish)) 5. return NULL; /* frame consumed by filter */ 6. else 7. return skb; 8. } if (unlikely(is_link_local(dest))){……if (NF_HOOK(PF_BRIDGE, NF_BR_LOCAL_IN, skb, skb->dev, NULL, br_handle_local_finish)) return NULL; /* frame consumed by filter */ else return skb;} 而br_handle_local_finish()所做。












