📄 -

📁 linux informations
💻
📖 第 1 页 / 共 3 页
字号:
上一页 1 23
    应用程序交换数据时要传输包，否则由网络协议在建立连接或支持一个已建立的连接时来生成。无论数据 是由哪种方法生成的，都要建立一个 sk_buff 来包含数据，当通过协议层时，这些协议层会加上各种头。

    sk_buff 需要通过网络设备传输。首先协议，如IP，需要确定是哪个网络设备在用。这有赖于包的最佳路 由。对于通过modem连入一个简单网络，如通过PPP协议，的计算机来说，路由的选择是很简单的。包应该通过 本地环路设备发送给本地主机，或发送给PPP modem连接的网关。对于连在以在网上的计算机来说，连接在网 络上的计算机越多，路由越复杂。

    对于每一个被传输的IP包，IP用路由表来为目的IP地址解析路由。从路由表中成功地找到目的IP时将返回一个描述了要使用的路由的 rtable 结构。这包括要用到的源IP地址，网络 device 结构的地址，有时还有预建立的硬件头。这些硬件头是网络设备特定的，包含了源和目的的物理地址和其它的特定媒体信息。如果网络设备是一个以太网设备，硬件头则应如图  10.1 所示，并且源和目的地址应是物理的以太网地址。硬件头在路由的时候会缓存起来，因为必须将它加到每一个要传输的IP包中。硬件头包含的物理地址要用ARP协议来解析。传出的包在地址被解析后才会发出。解析了地址后，硬件头被缓存起来以便以后的IP包在使用这一接口时不需要再使用ARP。

10.5.4  数据分块

    每个网络设备都有一个包大小的最大值，发送或接收数据包不能比这一值大。IP协议允许将数据分成更小单元以便网络设备能处理。IP协议头有分块字段，它里面包含了一个标志和分割偏移量。 

    当IP包准备要传输时，IP找到网络设备来将IP包发送出去。这个设备是从IP路由表中找到的。每一 device 结构中有一项 mtu ，用来描述最大传输单元（以字节为单位）。如果设备的 mtu 比要传输的IP包的包大小要小，则IP包必须被分割成更小的单元。每一单元用一个 sk_buff 结构来表征；它的IP头会被做上标记以标识它是一个分块了的包，其中还包含分割偏移量。最后一个包被标识为最后IP单元。如果在分块过程中，IP不能分配 sk_buff ，则传输失败。 

    接收IP分块单元要比发送它们要麻烦一些，因为这些IP单元可能以任何顺序到达，必须所有的单元都接收 到了以后才能重新将它们组装起来。每接收一个IP包都要检查其是否是IP分割单元。在第一个IP分割单元到达 时，IP会建立一个新的 ipq 结构，这一结构与用于IP单元重组的 ipqueue 列表相连。当接收到更多的IP单元时，先找到正确的 ipq 结构，并为每个单元新建立一个 ipfrag 结构。每个 ipq 结构唯一地描述一个接收IP分割单元的，包括它的源和目的IP地址，上层协议标识和本IP帧的标识。当接收到所有的IP分割单元后，将它们重新组成一个 sk_buff ，然后交给上层协议处理。每个 ipq 中包含一个定时器，它在每接收到一个合法的单元后重新时。如果定时器到时， ipq 结构和它的一些 ipfrag 结构将被丢弃，传送的信息则被假定为丢失。然后提交给层协议来重传该信息。 

10.6  地址解析协议 (ARP)
    地址解析协议担当了一个把IP地址翻译成物理硬件地址如以太网地址的角色。IP在将数据（以 sk_buff 的形式)通过设备驱动传送时需要这一转换。

    它执行各种检查，来看是否这一设备需要硬件头，是否需要重建包的硬件头。Linux缓存了硬件头，这样可以避频繁重建。如果需要重建硬件头，则调用设备指定的硬件头重建例程。所有的以太网设备使用相同的头重例程，这些例程将目的IP地址转换成物理地址。

    ARP协议本身是很简单的，它包括两个消息类型，ARP请求与ARP应答。ARP请求包含了需要解析的IP地址，ARP应答（希望它）包含被解析的IP地址，硬件地址。ARP请求向连接在网络上的所有主机广播，因此，对于以网，所有连在网上的机器都能看到ARP请求。拥有ARP请求中的IP地址的机器将发出包含了它自己的物理地址ARP应答。

    ARP协议在Linux中是围绕 arp_table 结构表来建立的，每个结构描述一个IP到物理地址的转换。这些表项 在需要进行IP地址解析时生成，在随时间变旧时被删除。每个 arp_table 结构有如下字段: 

  last used  本ARP项最近一次使用的时间  
last updated  本ARP项最近一次更新的时间  
flags  描述本项的状态，如是否完成等  
IP address  本项描述的IP地址  
hardware address  要解析的硬件地址  
hardware header  指向缓存硬件头的指针  
timer  是个 timer_list 项，用于ARP请求没有响应时的超时  
retries  ARP请求重试的次数  
sk_buff queue  等待IP地址解析的sk_buff项列表  


    ARP表包括了指向 arp_table 链的指针（ arp_table 向量）。缓存这些表项可以加速对它们的访问，每个表项用IP地址的最后两个字节来生成索引，然后就可以查找表链以找到正确的表项。Linux也以 hh_cache 结构的形式来缓存 arp_table 项的预建的硬件头。 

    请求一个IP地址解析并且没有相应的 arp_table 项时，ARP必须发送一个ARP请求。它在表和sk_buff队列中 生成一个新的 arp_table 项， sk_buff 包含了需要进行地址解析的网络包。发送ARP请求时运行ARP定时器。如果没有响应，ARP将重试几次，如果仍然没有响应，ARP将删除该 arp_table 项。同时会通知队列中等待IP地址解析的 sk_buff 结构，传送它们的上层协议将处理这一失败。UDP不关心丢包，而TCP则会建立TCP连接进行重传。如果IP地址的所有者返回了它的硬件地址，则 arp_table 项被标记为完成，队列中的sk_buff将被删除，传输动作继续。硬件地址被写到每个sk_buff的硬件头中。 

    ARP协议层必须响应ARP请求。它注册它的协议类型(ETH_P_ARP)，生成一个 packet_type 结构。这表示它将检查网络设备收到的所有ARP包。与ARP应答一样，这包括ARP请求。用保存在接收设备的 device 结构中的硬件地址来生成ARP应答。 

    网络拓扑结构会随时间改变，IP地址会被重新分配不同的硬件地址。例如，一些拨号服务为每一次新建的连接分配一个IP地址。为了使ARP表包含这些数据项，ARP运行一个周期性的定时器，用来查看所有的 arp_table 项中哪一个超时。要注意不要移除包含一个或多个缓存硬件头的项。移除这些项是很危险的，因为其它的数据结构要用到它们。一些 arp_table 项被标记为永久的，它们不会被释放。ARP表不能太大；每个 arp_table 项会消耗一些核心内存。要分配一个新的表项而ARP表的大小已经到达它的最大值时，就要查找并删除最老的表项。 

10.7  IP 路由
    IP路由函数决定了将预定的有指定IP地址的IP包送到哪。在传送IP包时有很多种选择。能最终到达目标吗？如果能，要用到哪个网络设备呢？如果有多于一个的网络设备可被使用，哪一个是较好的呢？IP路由数据库里存的信息给出了这些问题的答案。有两个数据库，最重要的一个是Forwarding Information Database。这是一个有关已知的目的IP和它们的最佳路由的祥细列表，route cache则用来快速找到目的IP的路由。和其它的缓一样，它包含的只是常用的路由；它的内容来自Forwarding Information Database。 

    通过IOCTL请求可将路由加入到BSD socket接口或从中删除。这些是通过协议来实现的。INET协议层只允许 处理有超级用户权限的IP路由的添加与删除。这些路由可以是固定的，也可以随时间而动态改变。大多数系统使用固定路由。路由器运行路由协议，路由协议持续地检查所有已知目的IP的可得到的路由。没有路由器的系统是端系统。路由协议是作为一个守护进程来实现的，如GATED，它们也用IOCTL来向BSD socket接口添加和删除路由。 

10.7.1  路由缓存
    无论什么时候查找IP路由，首先都要在路由缓存中检查是否有匹配的路由。如果路由缓存里没有匹配的路由，则要从Forwarding Information Database中查找路由。如果那里也没有找到路由，则IP包发送失败并通知应用程序。如果在路由缓存中没有而在Forwarding Information Database中找到路由，则会为些路由生成一个新项，并添加到路由缓存中。路由缓存是一个表(ip_rt_hash_table)，它包括指向rtable数据结构链的指针。hash函数利用IP地址中最小最重要的两个字节来从路由表中进行索引。这两个字节是在目的与提供的最佳hash值间是不同的。第个rtable项包含路由信息，目的IP地址，用于到达那个IP地址的网络设备，信息大小的最大值等等。它还有一个reference count，一个usage count和一个最近一次被用的时间信息（在 jiffies 里）。reference count在每次路由后增加，用于显示该次路由的网络连接数。它在应用程序停止使用路由时减小。useage count在每次查找路由时增加，用于将 rtable 项在它的hash链中排序。路由缓存中的对于所有项的最后被用时间信息将被周期性地检查，以确定是否 rtable 已经旧了。如果某一路由最近没有被使用，则从路由缓存中将之丢弃。由于路由缓存中的路由在有序的，所以常用的路由会排在hash链的前面。这意味着能更快地找到这些路由。 


10.7.2  The Forwarding Information Database





图 10.5: The Forwarding Information Database 
    Forwarding Information Database（如图  10.5 所示）包含对当前系统当前时间可得到的IP路由。它是一个 很复杂的数据结构，尽管进行了合理有效的安排，它仍然不是一个快速的数据库。特别是要在这个数据库中为每一要传送的IP包查找目的地时将会非常慢。这就是要用路由缓存的原因：可以用已知的好的路由来加速IP包的传送。路由缓存中的路由来源于Forwarding Information Database。 

    每个IP子网用一个 fib_zone 结构来描述。 fib_zone hash表指向着这些结构。hash索引来源于IP子网掩码。所有通向同一子网的路由由 fib_node 和 fib_info 结构来描述，这两结构在每个 fib_zone 结构的 fz_list 中排队。如果这个子网中的路由数增大，则生成一个hash表，以使查找 fib_node 结构更加容易。 

    通向同一子网可以有多个路由，这些路由可能通过多个网关中的一个。IP路由层不允许用同一个网关对一个子网有多于一个的路由。换言之，如果通向同一子网有多个路由，则每个路由要保证使用一个不同的网关。与每个路由相关的有一个 metric 结构。它用来测量该路由有多优。一个路由的 metric 实质上是它在到达目的子网前所经过的IP子网数。 metric 越大，路由越差。 

  


--------------------------------------------------------------------------------

脚注:
1 National Science Foundation 

2 Synchronous Read Only Memory 

3 duh? What used for? 



--------------------------------------------------------------------------------
File translated from TEX by TTH, version 1.0.
--------------------------------------------------------------------------------
 
Top of Chapter, Table of Contents, Show Frames, No Frames
?1996-1999 David A Rusling copyright notice.
上一页 1 23
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -