Linux网络 - 数据包在内核中接收和发送的过程（转）_系统运维

本文将介绍在Linux系统中， 数据包是如何一步一步从网卡传到进程手中的 以及 数据包是如何一步一步从应用程序到网卡并最终发送出去的 。

如果英文没有问题，强烈建议阅读后面参考里的文章，里面介绍的更详细。

本文只讨论以太网的物理网卡，不涉及虚拟设备，并且以一个UDP包的接收过程作为示例.

网卡需要有驱动才能工作，驱动是加载到内核中的模块，负责衔接网卡和内核的网络模块，驱动在加载的时候将自己注册进网络模块，当相应的网卡收到数据包时，网络模块会调用相应的驱动程序处理数据。

下图展示了数据包（packet）如何进入内存，并被内核的网络模块开始处理：

软中断会触发内核网络模块中的软中断处理函数，后续流程如下

由于是UDP包，所以第一步会进入IP层，然后一级一级的函数往下调：

应用层一般有两种方式接收数据，一种是recvfrom函数阻塞在那里等着数据来，这种情况下当socket收到通知后，recvfrom就会被唤醒，然后读取接收队列的数据；另一种是通过epoll或者select监听相应的socket，当收到通知后，再调用recvfrom函数去读取接收队列的数据。两种情况都能正常的接收到相应的数据包。

了解数据包的接收流程有助于帮助我们搞清楚我们可以在哪些地方监控和修改数据包，哪些情况下数据包可能被丢弃，为我们处理网络问题提供了一些参考，同时了解netfilter中相应钩子的位置，对于了解iptables的用法有一定的帮助，同时也会帮助我们后续更好的理解Linux下的网络虚拟设备。

ndo_start_xmit会绑定到具体网卡驱动的相应函数，到这步之后，就归网卡驱动管了，不同的网卡驱动有不同的处理方式，这里不做详细介绍，其大概流程如下：

在网卡驱动发送数据包过程中，会有一些地方需要和netdevice子系统打交道，比如网卡的队列满了，需要告诉上层不要再发了，等队列有空闲的时候，再通知上层接着发数据。

使用虚拟ip最多的场景可能是双机，往往结合着keepalived使用。其实没有双机软件也可以使用虚拟ip，下面介绍两种方法ip addr和ifconfig进行增删查虚拟ip。增加虚拟ip ： ip addr add ip/netmask dev 网口名称，比如ip addr add 192.168.88.0/24 dev eth0查看虚拟ip : ip addr show device_name或ip addr | grep eth0 ip addr =ip a= ip add list 查看网卡的ip和mac等，即使网卡处于down状态，也能显示出网卡状态，但是ifconfig查看就看不到。删除虚拟ip：ip addr del ip/netmask dev 网口名称，比如ip addr del 192.168.88.0/24 dev eth0清空指定网卡的所有ip： ip addr flush dev 接口ip addr *** 作时的注意事项：说明：网卡配置的ip一般为Primary ip，虚拟ip一般为Secondary ip，当删除Primary ip时Secondary ip也有可能同时被删除。先查看ipv4或ipv6相应网卡开启提升参数promote_secondaries为1，当Primary ip被删除后，它的第1个Secondary ip将继承为Primary ip。 # cat /etc/sysctl.conf | grep promote_secondariesnet.ipv4.conf.eth0.promote_secondaries=1 默认不开启，查不到结果则表明未开启。 Secondary ip和Primary ip标注如下[root@localhost ~]# ip addr show eth0 2: eth0: mtu 1500 qdisc pfifo_fast qlen 1000 link/ether 00:19:b9:ef:44:8b brd ff:ff:ff:ff:ff:ff # Primary ip inet 172.16.0.230/24 brd 172.16.0.255 scope global eth0 inet 10.1.1.230/24 scope global eth0 # Secondary ip inet 10.1.1.231/24 scope global secondary eth0在linux中在一个网卡上配置的同一个网段的ip有Primary IP和Secondary address之分，如果不是同一个网段的ip总有一个是Primary IP，一条链上的吊链结构中上面的那条主链中的IP是Primary IP，Secondary address是主链结点的子链结点中的IP，一旦主链上一个节点被删除了，那么它的子链也将不复存在，随之被删除。可以通过调整一个参数来实现，当一个primary ip被删除时，如果它有secondary ip的话，那么它的第1个secondary地址(长子)成为primary地址，这样就显得很合理了，要不然在删除 primary地址的时候，如果有程序用secondary地址，要么延迟删除，要么程序崩溃。开启的方法(主机重启后仍然生效的)echo "net.ipv4.conf.eth0.promote_secondaries=1" >>/etc/sysctl.confifconfig eth1:1 192.168.5.10/24 up：起别名 ifconfig eth0:1 192.168.8.5 netmask 255.255.255.0 up ifconfig eth1:1 192.168.5.10/24 down ：删别名 ifconfig eth0:1 192.168.8.5 netmask 255.255.255.0 downifconfig eth1 up ：启用eth1网卡 ifconfig eth1 down ：禁用eth1网卡，这种禁用是从数据链路层断掉，但是网络层ip还在，有时候能ping 通，大概率是缓存表没有更新 ifdown eth0 ：禁用网卡，删除了网络层ip 二者本质上没有什么区别，只是表述方式不同。如果你非常理解网络协议的原理以及网络的分层架构那么我想你就不会有这个问题，实际上每一个网卡设备都有一个mac地址，但是却可以有多个网络层地址，比如IP地址，然而这个事实无法很好地像用户提供 *** 作接口，所以就引出了ip别名(IP aliases)和辅助ip(secondary IP addresses)的概念。其实很容易理解这个事实，按照分层的思想，下层总是为上层服务，也就是为上层提供舞台，上层利用下层的服务，而不必让下层知道自己的情况，如果一个拥有合理mac地址的网卡没有配置网络层地址(比如IP地址)这件事合理的话，那么为这个设备配置多个IP地址也是合理的，好比一个ip可以对应多个应用层端口一样，也就是说，下层对上层总是一对多的关系，在分层架构中这种关系是合理的。比如一台机器上运行着一个代理服务器或者负载均衡服务，代理服务器或者负载均衡服务和主服务器要监听相同的端口，那么就可以用secondary ip来解决，只要需要在同一网段监听同一个端口的应用都是吊链中子链存在的原因，因此可以说，主链对外部或者说对下面链路层虚拟了多块网卡，而子链向上层虚拟了多台机器，配置了吊链结构的linux主机如果说只有一块网卡，那么外部会认为它有多块网卡，对于内部，应用层会认为彼此在不同的主机上，这就是效果。添加地址可以通过2个用户空间程序搞定，一个是ifconfig，另一个是ip addr add，ifconfig是基于ioctl进行添加地址的，而ip是基于netlink进行添加地址的，不管哪一种方式都可以达到目的。但为何用ip addr add添加的ip地址用ifconfig看不到，而ifconfig设置的地址ip addr show却是可以看到?这个问题先放一放。 ip addr增加的虚拟ip在物理主机或虚拟机重启后失效。方法1：把命令加到/etc/rc.local里面 ip addr add 192.168.26.74/32 dev eth1 方法2：高可用双机倒换后进行虚拟ip的增加方法3：在/etc/sysconfig/network-scripts添加网卡名字，比如ifcfg-eth0:0，DEVICE=eth0:1 ---->子接口名 ONBOOT=yes BOOTPROTO=static IPADDR=192.168.109.108 NETMASK=255.255.255.0ip addr *** 作ip时需要注意 ip addr和ifconfig的区别

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/6255995.html

Linux网络 - 数据包在内核中接收和发送的过程（转）

发表评论

评论列表（0条）