⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 (ldd) ch10-合理使用数据类型(转载).txt

📁 献给ARM初学者
💻 TXT
📖 第 1 页 / 共 2 页
字号:
(LDD) Ch10-合理使用数据类型(转载)
       
      第10章 合理使用数据类型
       
       
          在进一步讨论更深的主题之前,我们需要先停一停,快速地回顾一下可移植问题。L
      inux1.2版本和2.0版本之间的不同就在于额外的多平台能力;结果是,大多数源代码级
      的移植问题已经被排除了。这意味着一个规范的Linux驱动程序也应该是多平台的。
       
       
       
          但是,与内核代码相关的一个核心问题是,能够同时存取各种长度已知的数据项(例
      如,文件系统数据类型或者设备卡上的寄存器)和利用不同处理器的能力(32位和64位的体
      系结构,也有可能是16位的)。
       
       

       
       
      当把x86的代码移植到新的体系结构上时,核心开发者遇到的好几个问题都和不正确的数
      据类型相关。坚持强数据类型以及编译时使用-Wall -Wstrict-prototypes选项能够防止
      大部分的臭虫。
       
       
       
      内核使用的数据类型划分为三种主要类型:象int这样的标准C语言类型,象u32这样的确
      定数据大小的类型和象pid_t这样的接口特定类型。我们将看一下这三种类型在何时使用
      和如何使用。本章的最后一节将讨论把驱动器代码从x86移植到其它平台上可能碰到的其
      它一些典型问题。
       
       
       
      如果你遵循我提供的这些准则,你的驱动程序甚至可能在那些你未能进行测试的平台上
      编译并运行。
       
      使用标准C类型
      大部分程序员习惯于自由的使用诸如int和long这样的标准类型,而编写设备驱动程序就
      必须细心地避免类型冲突和潜在的臭虫。
       
       

       
       
      问题是,当你需要“2个字节填充单位(filler)”或“表示4个字节字符串的某个东西”
      时,你不能使用标准类型,因为通常的C数据类型在不同的体系结构上所占空间大小并不
      相同。例如,长整数和指针类型在Alpha上和x86上所占空间大小就不一样,下面的屏幕
      快照表明了这一点:
       
       
       
      morgana% ./datasize
       
      system/machine: Linux i486
       
      sizeof(char) =     1
       
      sizeof(short) =    2
       
      sizeof(int) =      4
       
      sizeof(long) =     4
       
      sizeof(longlong) = 8
       

       
      sizeof(pointer) =  4
       
       
       
      wolf% ./datasize
       
      system/machine: Linux alpha
       
      sizeof(char) =     1
       
      sizeof(short) =    2
       
      sizeof(int) =      4
       
      sizeof(long) =     8
       
      sizeof(longlong) = 8
       
      sizeof(pointer) =  8
       
       
       

       
      sandra% ./datasize
       
      system/machine: Linux sparc
       
      sizeof(char) =     1
       
      sizeof(short) =    2
       
      sizeof(int) =      4
       
      sizeof(long) =     4
       
      sizeof(longlong) = 8
       
      sizeof(pointer) =  4
       
       
       
      datasize程序是一个可以从在O'Reilly FTP站点的misc-progs目录下获得的小程序。
       
       
       

       
      在混合使用int和long类型时,你必须小心,有时有很好的理由这样做,一种情形就是内
      存地址,一涉及到内核,内存地址就变得很特殊。虽然概念上地址是指针,但是通过使
      用整数类型,可以更好地实现内存管理;内核把物理内存看做一个巨大的数组,内存地
      址就是这个数组的索引。而且,一个指针很容易被取地址(deference),而使用整数表示
      内存地址可以防止它们被取地址,这正是人们所希望的(比使用指针更安全)。因而,内
      核中的地址属于unsigned long类型,这是利用了指针和长整数类型大小总是相同这一事
      实,至少在所有Linux当前支持的平台上是这样的。我们等着看看将来把Linux移植到不
      符合这一规则的平台上的时候,会发生些什么。
       
      分配确定的空间大小给数据项
      有时内核代码需要指定大小的数据项,或者用来匹配二进制结构*或者用来在结构中插入
      填充字段对齐数据。
       
       
       
      为此目的,内核提供如下的数据类型,它们都在头文件<asm/types.h>中声明,这个文件
      又被头文件<linux/types.h>所包含:
       
       
       
      u8;    /* 无符号字节(8位) */
       

       
      u16;   /* 无符号字(16 位) */
       
      u32;   /* 无符号32位数值 */
       
      u64;   /* 无符号64位数值 */
       
       
       
      这些数据类型只能被内核代码所访问(也即,在包含头文件<linux/types.h>之前必须先
      定义__KERNEL__)。相应的有符号类型也是存在的,但一般不用;如果你需要使用它们的
      话,只要把名字中的u替换为s就可以了。
       
       
       
      如果用户空间的程序需要使用这些类型,可以在这些名字前面添加2个下划线:__u8和其
      它类型是独立于__KERNEL__定义的。例如,如果一个驱动程序需要通过ioctl系统调用与
      一个运行在用户空间内的程序交换二进制结构的话,头文件必须将结构中的32位字段定
      义为__u32。
       
       
       
      重要的是要记住这些类型特定于Linux,使用它们就会防碍软件向其他Unix变体的移植。

      重要的是要记住这些类型特定于Linux,使用它们就会防碍软件向其他Unix变体的移植。
      但是,有些情况下也需要明确说明数据大小,而标准头文件(在每个Unix系统上都能找到
      的)并未声明较合适的数据类型。
       
       
       
      你也许注意到,有时内核也使用一般的数据类型,象unsigned int,用于那些大小与体
      系结构无关的项。这通常是为了向后兼容。当u32及其相关类型在1.1.67版本引入时开发
      者没办法把存在的数据类型改成新类型,因为当结构字段和赋予的值之间类型不匹配时
      ,编译器会发出警告+。Linus当初可没预料到为自己使用而编写的这个操作系统会发展
      成为多平台的;因此,一些旧的结构的数据类型定义上不是很严格。
       
      接口特定的类型
      内核中最常使用的数据类型有它们自己的typedef声明,这样就防止了任何移植上的问题
      。例如,进程号(pid)通常使用pid_t,而不是int。使用pid_t屏蔽了任何实际数据类型
      之间可能的差别。我使用“接口特定”这种表述来指代特定数据项的编程接口。
       
       
       
      属于指定“标准”类型的其它数据项也可以认为是接口特定的。比如,一个jiffy计数总
      是属于unsigned long类型的,独立于它的实际大小-你喜欢那么频繁地使用jiffy_t类
      型么?这里我关注的是接口特定类型的第一类,那些以_t结尾的类型。
       

       
       
       
      _t类型完整的列表在头文件<linux/types.h>中,但是该列表几乎没什么用。当需要一个
      特定类型时,你可以在你要调用的函数原型或者使用的数据结构中找到它。
       
       
       
      只要你的驱动程序使用了需要这种“定制”类型的函数,又不遵循惯例的时候,编译器
      都会发出一个警告;如果你打开-Wall编译开关并且细心地去除了所有警告,你就可以自
      信你的代码是可移植的了。
       
       
       
      _t数据项的主要问题是当你需要打印它们的时候,并不总是容易选择正确的printk或者p
      rintf格式,并且你在一种体系结构上排除了的警告,在另一种体系结构上可能又会出现
      。例如,当size_t在一些平台上是unsigned long,而在另外一些平台上却是unsigned
      int时,你怎么打印它呢?
       
       
       
      任何时候,当你需要打印一些特定接口的数据的时候,最行之有效的方法就是,把它强
      制转换成最可能的类型(通常是long或unsigned long类型),然后把它用相应的格式打印

      制转换成最可能的类型(通常是long或unsigned long类型),然后把它用相应的格式打印
      出来。这种做法不会产生错误或者警告,因为格式和类型相符,而且你也不会丢失数据
      位,因为强制类型转换要么是个空操作,要么是将该数据项向更大数据类型的扩展。
       
       
       
      实际上,通常我们并不会去打印我们讨论的这些数据项,因此只有显示调试信息时才会
      碰到这些问题。更经常的,除了把接口特定的类型作为参数传递给库或内核函数以外,
      代码仅仅只会对它们进行些储存和比较。
       
       
       
      虽然大多数情形下,_t类型都是正确的解决方案,但有时候正确的类型也可能并不存在
      。这会发生在一些还没被抛弃的旧接口上。
       
       
       
      在内核头文件中我发现一处疑点,为 I/O函数声明数据类型时不是很严格(参见第8章“
      硬件管理”中的“平台相关性”一节)。这种不严格的类型定义主要是出于历史上的原因
      ,但在编写代码时却会带来问题。就我而言,我经常在把参数交换给out函数时遇上麻烦
      ;而如果定义了port_t,编译器将会指出这些错误。
       
      其它与移植有关的问题

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -