003.txt

来自「会变语言实现的一些程序」· 文本代码 · 共 1,354 行 · 第 1/5 页
TXT
1,354 行
 3.1 Win32汇编源程序的结构
经过第2章的准备工作，相信大家都已经建好了Win32汇编的工作环境，并已经可以编译程序了，现在让我们来编译所带光盘的Chapter03\HelloWorld目录下的Hello World程序。这是一个相当小的程序，就和DOS时代下经典的Hello World程序一样，并没有涉及系统中很多的东西，甚至连Windows系统中基本的消息驱动机制也没有看到，它只是简单地弹出一个消息框，在上面显示了一句“Hello，World！”，并在文字的下面显示了一个“确定”按钮，就停在那里了，当用户按下“确定”按钮，程序就退出了，同时消息框消失。这个程序运行的结果如图3.1所示。 


但这样一个小程序从结构来看，却“麻雀虽小，五脏俱全”，用它来举例说明Win32汇编源程序的框架是最合适不过的了，本章将从这个程序出发，探讨MASM在Win32汇编中的用法，由于篇幅所限，内容只涉及MASM在Win32编程中常用的部分。

3.1  Win32汇编源程序的结构

任何种类的语言，总是有基本的源程序结构规范，在讨论C语言的书中，大家都会记得这个非常经典的Hello World程序：

#include 

main()

{

printf("Hello, world\n");

}

像这样一个程序，就说明了C语言中最基本的格式，main()中的括号和下面的花括号说明了一个函数的定义方法，printf语句说明了一个函数的调用方法，调用函数语句后面的分号也是基本的格式。C是一种高级语言，在C源程序中，不必为堆栈段、数据段和代码段的定义而担心，编译器会把程序中的字符串和语句代码分别放到它们该去的地方，程序开始执行的时候也会自己找到main()函数。而汇编是低级语言，必须为所有的东西找到它们该去的地方，所以在DOS的汇编中，Hello World又长成了这样一副模样：

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

; 堆栈段

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

stack   segment stack

db   100 dup (?)

stack   ends

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

; 数据段

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

data   segment

szHello   db   ~Hello, world~,0dh,0ah,~$~

data ends

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

; 代码段

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

code segment

assume   cs:code,ds:data,ss:stack

start:

mov ax,data

mov ds,ax

 

mov ah,9

mov dx,offset szHello

int 21h

 

mov ah,4ch

int 21h

code ends

    end start

在这个源程序中，stack段为堆栈找了个家，hello world字符串则跑到数据段中去了，代码则放在代码段中，程序的开始语句必须由最后一句end start来说明应该从start这个标号开始执行，整个程序在使用过DOS汇编的程序员眼里是非常的熟悉。

到了Win32汇编的时候，程序的基本结构还是如此，先来看一看这个看起来很新鲜的Win32的Hello world程序：

  .386

  .model flat,stdcall

  option casemap:none

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

; Include 文件定义

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

include windows.inc

include user32.inc

includelib   user32.lib

include kernel32.inc

includelib   kernel32.lib

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

; 数据段

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

  .data

 

szCaption db   ~A MessageBox !~,0

szText   db   ~Hello, World !~,0

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

; 代码段

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

  .code

start:

  invoke  MessageBox,NULL,offset szText,offset szCaption,MB_OK

  invoke  ExitProcess,NULL

;>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

  end start

怎么样，看来和上面的C以及DOS汇编又不同了吧！但从include，.data和.code等语句“顾名思义”也能看出一点苗头来，include应该就是包含别的文件，.data想必是数据段，.code应该就是代码段了吧！接下来通过这个例了程序逐段介绍Win32汇编程序的结构。

3.1.1  模式定义

程序的第一部分是模式和源程序格式的定义语句：

  .386

  .model flat,stdcall

  option casemap:none

这些指令定义了程序使用的指令集、工作模式和格式。

1. 指定使用的指令集

.386语句是汇编语言的伪指令，它在低版本的宏汇编中就已经存在，类似的指令还有：.8086，.186，.286，.386/.386p，.486/.486p和 .586/.586p等，用于告诉编译器在本程序中使用的指令集。在DOS的汇编中默认使用的是8086指令集，那时候如果在源程序中写入80386所特有的指令或使用32位的寄存器就会报错，为了在DOS环境下进行保护模式编程或仅为了使用32位寄存器，常在DOS的汇编中使用 .386来定义。Win32环境工作在80386及以上的处理器中，所以这一句 .386是必不可少的。

后面带p的伪指令则表示程序中可以使用特权指令，如：

  mov cr0,eax

这一类指令必须在特权级0上运行，如果只指定 .386，那么使用普通的指令是可以的，编译时到这一句就会报错，如果我们要写的程序是VxD等驱动程序，中间要用到特权指令，那么必须定义 .386p，在应用程序级别的Win32编程中，程序都是运行在优先级3上，不会用到特权指令，只需定义 .386就够了。80486和Pentium处理器指令是80386处理器指令的超集，同样道理，如果程序中要用80486处理器或Pentium处理器的指令，则必须定义 .486或 .586。另外，Intel公司的80x86系列处理器从Pentium MMX开始增加了MMX指令集，为了使用MMX指令，除了定义 .586之外，还要加上一句 .mmx伪指令：

  .586

  .mmx

 


2. .model语句

.model语句在低版本的宏汇编中已经存在，用来定义程序工作的模式，它的使用方法是：

.model 内存模式[，语言模式][，其他模式]

内存模式的定义影响最后生成的可执行文件，可执行文件的规模从小到大，可以有很多种类型，在DOS的可执行程序中，有只用到64 KB的 .com文件，也有大大小小的 .exe文件。到了Win32环境下，又有了可以用4 GB内存的PE格式可执行文件，编写不同类型的可执行文件要用 .model语句定义不同的参数，具体如表3.1所示。

表3.1  内存模式

模   式
 内 存 使 用 方 式
 
tiny

small

medium

compact

large

huge

flat
 用来建立 .com文件，所有的代码、数据和堆栈都在同一个64 KB段内

建立代码和数据分别用一个64 KB段的 .exe文件

代码段可以有多个64 KB段，数据段只有一个64 KB段

代码段只有一个64 KB段，数据段可以有多个64 KB段

代码段和数据段都可以有多个64 KB段

同large，并且数据段中的一个数组也可以超过64 KB

Win32程序使用的模式，代码和数据段使用同一个4 GB段
 

在前面章节中已经提到过：Windows程序运行在保护模式下，系统把每一个Win32应用程序都放到分开的虚拟地址空间中去运行，也就是说，每一个应用程序都拥有其相互独立的4 GB 地址空间，对Win32程序来说，只有一种内存模式，即flat（平坦）模式，意思是内存是很“平坦”地从0延伸到 4 GB，再没有64 KB段大小限制。对比一下DOS的Hello World和Win32的Hello World开始部分的不同，DOS程序中有这样两句：

mov ax,data

mov ds,ax

意思是把数据段寄存器DS指向data数据段，data数据段在前面已经用 data segment 语句定义，只要DS不重新设置，那么从此以后指令中涉及的数据默认将从data数据段中取得，所以下面的语句是从data数据段取出szHello字符串的地址后再显示：

mov ah,9

mov dx,offset szHello

int 21h

纵观Win32汇编的源程序，没有一处可以找到ds或es等段寄存器的使用，因为所有的4 GB空间用32位的寄存器全部都能访问到了，不必在头脑中随时记着当前使用的是哪个数据段，这就是“平坦”内存模式带来的好处。

如果定义了 .model flat，MASM自动为各种段寄存器做了如下定义：

ASSUME  cs:FLAT, ds:FLAT, ss:FLAT, es:FLAT, fs:ERROR, gs:ERROR

也就是说，CS，DS，ES和SS段全部使用平坦模式，FS和GS寄存器默认不使用，这时若在源程序中使用FS或GS，在编译时会报错。如果有必要使用它们，只需在使用前用下面的语句声明一下就可以了：

assume  fs:nothing, gs:nothing 或者 assume fs:flat, gs:flat

在Win32汇编中，.model语句中还应该指定语言模式，即子程序的调用方式，例子中用的是stdcall，它指出了调用子程序或Win32 API时参数传递的次序和堆栈平衡的方法，相对于stdcall，不同的语言类型还有C，SysCall，BASIC，FORTRAN和PASCAL，虽然各种高级语言在调用子程序时都是使用堆栈来传递参数，但它们的处理方法各有不同。要和别的语言配合，就必须指定相应的语言种类。Windows的API调用使用的是stdcall格式，所以在Win32汇编中没有选择，必须在 .model中加上stdcall参数。关于参数传递的具体细节，在3.4.2节中有详细的描述。

3. option语句

用option语句定义的选项有很多，如option language定义和option segment定义等，在Win32汇编程序中，需要的只是定义option casemap:none，这个语句定义了程序中的变量和子程序名是否对大小写敏感，由于Win32 API中的API名称是区分大小写的，所以必须指定这个选项，否则在调用API的时候会有问题。

3.1.2  段的定义

1. 段的概念

把上面的Win32的Hello World源程序中的语句归纳精简一下，再列在下面：

.386

.model flat,stdcall

option casemap:none

  <一些include语句>

.data

  <一些字符串、变量定义>

.code

  <代码>

  <开始标号>

<其他语句>

end 开始标号

上一节讲到的选项、模式等定义并不会在编译好的可执行程序中产生什么东西，它们只是“说明”，而真正的数据和代码是定义在各个段中的，如上面的 .data段和 .code段，考虑到不同的数据类型，还可以有其他种类的数据段，下面是包含全部段的源程序结构：

.386
003.txt - 源码说明

本页面展示了「会变语言实现的一些程序」中的 003.txt 源码文件，采用文本编程语言编写，共 1,354 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫开发者社区收录了大量与汇编语言相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?