⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 -

📁 linux informations
💻
📖 第 1 页 / 共 3 页
字号:
    应用程序交换数据时要传输包,否则由网络协议在建立连接或支持一个已建立的连接时来生成。无论数据 是由哪种方法生成的,都要建立一个 sk_buff 来包含数据,当通过协议层时,这些协议层会加上各种头。

    sk_buff 需要通过网络设备传输。首先协议,如IP,需要确定是哪个网络设备在用。这有赖于包的最佳路 由。对于通过modem连入一个简单网络,如通过PPP协议,的计算机来说,路由的选择是很简单的。包应该通过 本地环路设备发送给本地主机,或发送给PPP modem连接的网关。对于连在以在网上的计算机来说,连接在网 络上的计算机越多,路由越复杂。

    对于每一个被传输的IP包,IP用路由表来为目的IP地址解析路由。从路由表中成功地找到目的IP时将返回一个描述了要使用的路由的 rtable 结构。这包括要用到的源IP地址,网络 device 结构的地址,有时还有预建立的硬件头。这些硬件头是网络设备特定的,包含了源和目的的物理地址和其它的特定媒体信息。如果网络设备是一个以太网设备,硬件头则应如图  10.1 所示,并且源和目的地址应是物理的以太网地址。硬件头在路由的时候会缓存起来,因为必须将它加到每一个要传输的IP包中。硬件头包含的物理地址要用ARP协议来解析。传出的包在地址被解析后才会发出。解析了地址后,硬件头被缓存起来以便以后的IP包在使用这一接口时不需要再使用ARP。

10.5.4  数据分块

    每个网络设备都有一个包大小的最大值,发送或接收数据包不能比这一值大。IP协议允许将数据分成更小单元以便网络设备能处理。IP协议头有分块字段,它里面包含了一个标志和分割偏移量。 

    当IP包准备要传输时,IP找到网络设备来将IP包发送出去。这个设备是从IP路由表中找到的。每一 device 结构中有一项 mtu ,用来描述最大传输单元(以字节为单位)。如果设备的 mtu 比要传输的IP包的包大小要小,则IP包必须被分割成更小的单元。每一单元用一个 sk_buff 结构来表征;它的IP头会被做上标记以标识它是一个分块了的包,其中还包含分割偏移量。最后一个包被标识为最后IP单元。如果在分块过程中,IP不能分配 sk_buff ,则传输失败。 

    接收IP分块单元要比发送它们要麻烦一些,因为这些IP单元可能以任何顺序到达,必须所有的单元都接收 到了以后才能重新将它们组装起来。每接收一个IP包都要检查其是否是IP分割单元。在第一个IP分割单元到达 时,IP会建立一个新的 ipq 结构,这一结构与用于IP单元重组的 ipqueue 列表相连。当接收到更多的IP单元时,先找到正确的 ipq 结构,并为每个单元新建立一个 ipfrag 结构。每个 ipq 结构唯一地描述一个接收IP分割单元的,包括它的源和目的IP地址,上层协议标识和本IP帧的标识。当接收到所有的IP分割单元后,将它们重新组成一个 sk_buff ,然后交给上层协议处理。每个 ipq 中包含一个定时器,它在每接收到一个合法的单元后重新时。如果定时器到时, ipq 结构和它的一些 ipfrag 结构将被丢弃,传送的信息则被假定为丢失。然后提交给层协议来重传该信息。 

10.6  地址解析协议 (ARP)
    地址解析协议担当了一个把IP地址翻译成物理硬件地址如以太网地址的角色。IP在将数据(以 sk_buff 的形式)通过设备驱动传送时需要这一转换。

    它执行各种检查,来看是否这一设备需要硬件头,是否需要重建包的硬件头。Linux缓存了硬件头,这样可以避频繁重建。如果需要重建硬件头,则调用设备指定的硬件头重建例程。所有的以太网设备使用相同的头重例程,这些例程将目的IP地址转换成物理地址。

    ARP协议本身是很简单的,它包括两个消息类型,ARP请求与ARP应答。ARP请求包含了需要解析的IP地址,ARP应答(希望它)包含被解析的IP地址,硬件地址。ARP请求向连接在网络上的所有主机广播,因此,对于以网,所有连在网上的机器都能看到ARP请求。拥有ARP请求中的IP地址的机器将发出包含了它自己的物理地址ARP应答。

    ARP协议在Linux中是围绕 arp_table 结构表来建立的,每个结构描述一个IP到物理地址的转换。这些表项 在需要进行IP地址解析时生成,在随时间变旧时被删除。每个 arp_table 结构有如下字段: 

  last used  本ARP项最近一次使用的时间  
last updated  本ARP项最近一次更新的时间  
flags  描述本项的状态,如是否完成等  
IP address  本项描述的IP地址  
hardware address  要解析的硬件地址  
hardware header  指向缓存硬件头的指针  
timer  是个 timer_list 项,用于ARP请求没有响应时的超时  
retries  ARP请求重试的次数  
sk_buff queue  等待IP地址解析的sk_buff项列表  


    ARP表包括了指向 arp_table 链的指针( arp_table 向量)。缓存这些表项可以加速对它们的访问,每个表项用IP地址的最后两个字节来生成索引,然后就可以查找表链以找到正确的表项。Linux也以 hh_cache 结构的形式来缓存 arp_table 项的预建的硬件头。 

    请求一个IP地址解析并且没有相应的 arp_table 项时,ARP必须发送一个ARP请求。它在表和sk_buff队列中 生成一个新的 arp_table 项, sk_buff 包含了需要进行地址解析的网络包。发送ARP请求时运行ARP定时器。如果没有响应,ARP将重试几次,如果仍然没有响应,ARP将删除该 arp_table 项。同时会通知队列中等待IP地址解析的 sk_buff 结构,传送它们的上层协议将处理这一失败。UDP不关心丢包,而TCP则会建立TCP连接进行重传。如果IP地址的所有者返回了它的硬件地址,则 arp_table 项被标记为完成,队列中的sk_buff将被删除,传输动作继续。硬件地址被写到每个sk_buff的硬件头中。 

    ARP协议层必须响应ARP请求。它注册它的协议类型(ETH_P_ARP),生成一个 packet_type 结构。这表示它将检查网络设备收到的所有ARP包。与ARP应答一样,这包括ARP请求。用保存在接收设备的 device 结构中的硬件地址来生成ARP应答。 

    网络拓扑结构会随时间改变,IP地址会被重新分配不同的硬件地址。例如,一些拨号服务为每一次新建的连接分配一个IP地址。为了使ARP表包含这些数据项,ARP运行一个周期性的定时器,用来查看所有的 arp_table 项中哪一个超时。要注意不要移除包含一个或多个缓存硬件头的项。移除这些项是很危险的,因为其它的数据结构要用到它们。一些 arp_table 项被标记为永久的,它们不会被释放。ARP表不能太大;每个 arp_table 项会消耗一些核心内存。要分配一个新的表项而ARP表的大小已经到达它的最大值时,就要查找并删除最老的表项。 

10.7  IP 路由
    IP路由函数决定了将预定的有指定IP地址的IP包送到哪。在传送IP包时有很多种选择。能最终到达目标吗?如果能,要用到哪个网络设备呢?如果有多于一个的网络设备可被使用,哪一个是较好的呢?IP路由数据库里存的信息给出了这些问题的答案。有两个数据库,最重要的一个是Forwarding Information Database。这是一个有关已知的目的IP和它们的最佳路由的祥细列表,route cache则用来快速找到目的IP的路由。和其它的缓一样,它包含的只是常用的路由;它的内容来自Forwarding Information Database。 

    通过IOCTL请求可将路由加入到BSD socket接口或从中删除。这些是通过协议来实现的。INET协议层只允许 处理有超级用户权限的IP路由的添加与删除。这些路由可以是固定的,也可以随时间而动态改变。大多数系统使用固定路由。路由器运行路由协议,路由协议持续地检查所有已知目的IP的可得到的路由。没有路由器的系统是端系统。路由协议是作为一个守护进程来实现的,如GATED,它们也用IOCTL来向BSD socket接口添加和删除路由。 

10.7.1  路由缓存
    无论什么时候查找IP路由,首先都要在路由缓存中检查是否有匹配的路由。如果路由缓存里没有匹配的路由,则要从Forwarding Information Database中查找路由。如果那里也没有找到路由,则IP包发送失败并通知应用程序。如果在路由缓存中没有而在Forwarding Information Database中找到路由,则会为些路由生成一个新项,并添加到路由缓存中。路由缓存是一个表(ip_rt_hash_table),它包括指向rtable数据结构链的指针。hash函数利用IP地址中最小最重要的两个字节来从路由表中进行索引。这两个字节是在目的与提供的最佳hash值间是不同的。第个rtable项包含路由信息,目的IP地址,用于到达那个IP地址的网络设备,信息大小的最大值等等。它还有一个reference count,一个usage count和一个最近一次被用的时间信息(在 jiffies 里)。reference count在每次路由后增加,用于显示该次路由的网络连接数。它在应用程序停止使用路由时减小。useage count在每次查找路由时增加,用于将 rtable 项在它的hash链中排序。路由缓存中的对于所有项的最后被用时间信息将被周期性地检查,以确定是否 rtable 已经旧了。如果某一路由最近没有被使用,则从路由缓存中将之丢弃。由于路由缓存中的路由在有序的,所以常用的路由会排在hash链的前面。这意味着能更快地找到这些路由。 


10.7.2  The Forwarding Information Database





图 10.5: The Forwarding Information Database 
    Forwarding Information Database(如图  10.5 所示)包含对当前系统当前时间可得到的IP路由。它是一个 很复杂的数据结构,尽管进行了合理有效的安排,它仍然不是一个快速的数据库。特别是要在这个数据库中为每一要传送的IP包查找目的地时将会非常慢。这就是要用路由缓存的原因:可以用已知的好的路由来加速IP包的传送。路由缓存中的路由来源于Forwarding Information Database。 

    每个IP子网用一个 fib_zone 结构来描述。 fib_zone hash表指向着这些结构。hash索引来源于IP子网掩码。所有通向同一子网的路由由 fib_node 和 fib_info 结构来描述,这两结构在每个 fib_zone 结构的 fz_list 中排队。如果这个子网中的路由数增大,则生成一个hash表,以使查找 fib_node 结构更加容易。 

    通向同一子网可以有多个路由,这些路由可能通过多个网关中的一个。IP路由层不允许用同一个网关对一个子网有多于一个的路由。换言之,如果通向同一子网有多个路由,则每个路由要保证使用一个不同的网关。与每个路由相关的有一个 metric 结构。它用来测量该路由有多优。一个路由的 metric 实质上是它在到达目的子网前所经过的IP子网数。 metric 越大,路由越差。 

  


--------------------------------------------------------------------------------

脚注:
1 National Science Foundation 

2 Synchronous Read Only Memory 

3 duh? What used for? 



--------------------------------------------------------------------------------
File translated from TEX by TTH, version 1.0.
--------------------------------------------------------------------------------
 
Top of Chapter, Table of Contents, Show Frames, No Frames
?1996-1999 David A Rusling copyright notice. 

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -