📄 (ldd) ch10-合理使用数据类型(转载).txt
字号:
(LDD) Ch10-合理使用数据类型(转载)
第10章 合理使用数据类型
在进一步讨论更深的主题之前,我们需要先停一停,快速地回顾一下可移植问题。L
inux1.2版本和2.0版本之间的不同就在于额外的多平台能力;结果是,大多数源代码级
的移植问题已经被排除了。这意味着一个规范的Linux驱动程序也应该是多平台的。
但是,与内核代码相关的一个核心问题是,能够同时存取各种长度已知的数据项(例
如,文件系统数据类型或者设备卡上的寄存器)和利用不同处理器的能力(32位和64位的体
系结构,也有可能是16位的)。
当把x86的代码移植到新的体系结构上时,核心开发者遇到的好几个问题都和不正确的数
据类型相关。坚持强数据类型以及编译时使用-Wall -Wstrict-prototypes选项能够防止
大部分的臭虫。
内核使用的数据类型划分为三种主要类型:象int这样的标准C语言类型,象u32这样的确
定数据大小的类型和象pid_t这样的接口特定类型。我们将看一下这三种类型在何时使用
和如何使用。本章的最后一节将讨论把驱动器代码从x86移植到其它平台上可能碰到的其
它一些典型问题。
如果你遵循我提供的这些准则,你的驱动程序甚至可能在那些你未能进行测试的平台上
编译并运行。
使用标准C类型
大部分程序员习惯于自由的使用诸如int和long这样的标准类型,而编写设备驱动程序就
必须细心地避免类型冲突和潜在的臭虫。
问题是,当你需要“2个字节填充单位(filler)”或“表示4个字节字符串的某个东西”
时,你不能使用标准类型,因为通常的C数据类型在不同的体系结构上所占空间大小并不
相同。例如,长整数和指针类型在Alpha上和x86上所占空间大小就不一样,下面的屏幕
快照表明了这一点:
morgana% ./datasize
system/machine: Linux i486
sizeof(char) = 1
sizeof(short) = 2
sizeof(int) = 4
sizeof(long) = 4
sizeof(longlong) = 8
sizeof(pointer) = 4
wolf% ./datasize
system/machine: Linux alpha
sizeof(char) = 1
sizeof(short) = 2
sizeof(int) = 4
sizeof(long) = 8
sizeof(longlong) = 8
sizeof(pointer) = 8
sandra% ./datasize
system/machine: Linux sparc
sizeof(char) = 1
sizeof(short) = 2
sizeof(int) = 4
sizeof(long) = 4
sizeof(longlong) = 8
sizeof(pointer) = 4
datasize程序是一个可以从在O'Reilly FTP站点的misc-progs目录下获得的小程序。
在混合使用int和long类型时,你必须小心,有时有很好的理由这样做,一种情形就是内
存地址,一涉及到内核,内存地址就变得很特殊。虽然概念上地址是指针,但是通过使
用整数类型,可以更好地实现内存管理;内核把物理内存看做一个巨大的数组,内存地
址就是这个数组的索引。而且,一个指针很容易被取地址(deference),而使用整数表示
内存地址可以防止它们被取地址,这正是人们所希望的(比使用指针更安全)。因而,内
核中的地址属于unsigned long类型,这是利用了指针和长整数类型大小总是相同这一事
实,至少在所有Linux当前支持的平台上是这样的。我们等着看看将来把Linux移植到不
符合这一规则的平台上的时候,会发生些什么。
分配确定的空间大小给数据项
有时内核代码需要指定大小的数据项,或者用来匹配二进制结构*或者用来在结构中插入
填充字段对齐数据。
为此目的,内核提供如下的数据类型,它们都在头文件<asm/types.h>中声明,这个文件
又被头文件<linux/types.h>所包含:
u8; /* 无符号字节(8位) */
u16; /* 无符号字(16 位) */
u32; /* 无符号32位数值 */
u64; /* 无符号64位数值 */
这些数据类型只能被内核代码所访问(也即,在包含头文件<linux/types.h>之前必须先
定义__KERNEL__)。相应的有符号类型也是存在的,但一般不用;如果你需要使用它们的
话,只要把名字中的u替换为s就可以了。
如果用户空间的程序需要使用这些类型,可以在这些名字前面添加2个下划线:__u8和其
它类型是独立于__KERNEL__定义的。例如,如果一个驱动程序需要通过ioctl系统调用与
一个运行在用户空间内的程序交换二进制结构的话,头文件必须将结构中的32位字段定
义为__u32。
重要的是要记住这些类型特定于Linux,使用它们就会防碍软件向其他Unix变体的移植。
重要的是要记住这些类型特定于Linux,使用它们就会防碍软件向其他Unix变体的移植。
但是,有些情况下也需要明确说明数据大小,而标准头文件(在每个Unix系统上都能找到
的)并未声明较合适的数据类型。
你也许注意到,有时内核也使用一般的数据类型,象unsigned int,用于那些大小与体
系结构无关的项。这通常是为了向后兼容。当u32及其相关类型在1.1.67版本引入时开发
者没办法把存在的数据类型改成新类型,因为当结构字段和赋予的值之间类型不匹配时
,编译器会发出警告+。Linus当初可没预料到为自己使用而编写的这个操作系统会发展
成为多平台的;因此,一些旧的结构的数据类型定义上不是很严格。
接口特定的类型
内核中最常使用的数据类型有它们自己的typedef声明,这样就防止了任何移植上的问题
。例如,进程号(pid)通常使用pid_t,而不是int。使用pid_t屏蔽了任何实际数据类型
之间可能的差别。我使用“接口特定”这种表述来指代特定数据项的编程接口。
属于指定“标准”类型的其它数据项也可以认为是接口特定的。比如,一个jiffy计数总
是属于unsigned long类型的,独立于它的实际大小-你喜欢那么频繁地使用jiffy_t类
型么?这里我关注的是接口特定类型的第一类,那些以_t结尾的类型。
_t类型完整的列表在头文件<linux/types.h>中,但是该列表几乎没什么用。当需要一个
特定类型时,你可以在你要调用的函数原型或者使用的数据结构中找到它。
只要你的驱动程序使用了需要这种“定制”类型的函数,又不遵循惯例的时候,编译器
都会发出一个警告;如果你打开-Wall编译开关并且细心地去除了所有警告,你就可以自
信你的代码是可移植的了。
_t数据项的主要问题是当你需要打印它们的时候,并不总是容易选择正确的printk或者p
rintf格式,并且你在一种体系结构上排除了的警告,在另一种体系结构上可能又会出现
。例如,当size_t在一些平台上是unsigned long,而在另外一些平台上却是unsigned
int时,你怎么打印它呢?
任何时候,当你需要打印一些特定接口的数据的时候,最行之有效的方法就是,把它强
制转换成最可能的类型(通常是long或unsigned long类型),然后把它用相应的格式打印
制转换成最可能的类型(通常是long或unsigned long类型),然后把它用相应的格式打印
出来。这种做法不会产生错误或者警告,因为格式和类型相符,而且你也不会丢失数据
位,因为强制类型转换要么是个空操作,要么是将该数据项向更大数据类型的扩展。
实际上,通常我们并不会去打印我们讨论的这些数据项,因此只有显示调试信息时才会
碰到这些问题。更经常的,除了把接口特定的类型作为参数传递给库或内核函数以外,
代码仅仅只会对它们进行些储存和比较。
虽然大多数情形下,_t类型都是正确的解决方案,但有时候正确的类型也可能并不存在
。这会发生在一些还没被抛弃的旧接口上。
在内核头文件中我发现一处疑点,为 I/O函数声明数据类型时不是很严格(参见第8章“
硬件管理”中的“平台相关性”一节)。这种不严格的类型定义主要是出于历史上的原因
,但在编写代码时却会带来问题。就我而言,我经常在把参数交换给out函数时遇上麻烦
;而如果定义了port_t,编译器将会指出这些错误。
其它与移植有关的问题
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -