org.txt

来自「会变语言实现的一些程序」· 文本代码 · 共 112 行
TXT
112 行
如何编写能够在内存中任意地址运行的程序(转贴) By andy_wolf(于2003-9-24发表) 

--------------------------------------------------------------------------------
如何编写能够在内存中任意地址运行的程序
作者 : 易水 


--------------------------------------------------------------------------------
　　一般来说，编译连接之后的代码只能在固定的位置（这里的位置是指偏移地址）上执行，如果直接将其拷贝到其他位置（偏移地址跟编译时的地址不同）上运行时会发生不可预料的错误。

　　这是因为在汇编语言中对静态变量的寻址通常是用直接寻址方式，这种方式直接使用变量的绝对偏移地址，如果被使用的变量也随代码一起被移动到目标地址，那对该变量的访问将会是对一个无效数据的访问。比如下面这段代码：

      Org 100H
          Add SI,SI
          Mov AX,Var1[SI]
          Ret
      Var1 DW 0,1,2,3,4,5,6,7,8,9
　　它的作用是从字数组Var1中取出SI所指的那个节点的数据给AX并返回。这段程序编译后的代码如下：

      0F05:0100 03F6       ADD SI,SI 
      0F05:0102 2E8B840801 MOV AX,CS:[SI+0108] 
      0F05:0107 C3         RET
      0F05:0100                        -00 00 01 00 02 00 03 00         ........
      0F05:0110 04 00 05 00 06 00 07 00-08 00 09 00             ............

　　注意红色的数字，它就是数组Var1的绝对偏移地址。此时如果我们把子程序GetData拷贝到偏移地址200H处，可以得到如下代码：

      0F05:0200 03F6       ADD SI,SI 
      0F05:0202 2E8B840801 MOV AX,CS:[SI+0108] 
      0F05:0207 C3         RET
      0F05:0200                        -00 00 01 00 02 00 03 00         ........
      0F05:0210 04 00 05 00 06 00 07 00-08 00 09 00             ............

　　再次注意红色的数字！此时数组Var1已经被移动到偏移地址208H处，而代码中对数组的访问仍然使用的是编译时的偏移地址。如果该处的数据正好被另的模块更改过的话，后果就 ......

　　但是加密软件生成的保护外壳和病毒代码在加到宿主程序中时可以放在任何偏移地址。这就说明编写能够在任何偏移地址运行的代码并不是不可能，只是对代码有一定的要求。要想写出能在任何偏移地址运行的代码必须要满足几个条件中的任意一条：

　　　　1.不引用变量，不使用NEAR/FAR跳转或调用
　　　　2.只使用动态变量
　　　　2.将对静态变量的访问变为相对寻址

　　不使用变量和NEAR/FAR跳转自然不会生成使用直接寻址的代码，当然可以拷贝到任何地址运行了，不过不能用变量限制太大了吧。
　　只使用动态变量是很好的方法，所有的变量都存放在堆栈中，不管代码被移动到什么地址都很方便，而且它还带来一个额外的好处：减小代码尺寸。但它也有缺点：就象C语言的子程序头所做的一样，你需要手工计算所用到的变量的总尺寸，运行时从堆栈中为它们留出同样大小的一块，然后为每一个变量设置一个地址（比如：[ESP+4],{ESP+6]之类）。这些工作在高级语言中由编译器代劳，但在汇编中得自己做，实在是太麻烦了。
　　对静态变量的访问必须用到它的绝对地址，但绝对地址也可以看作是对于偏移地址0000H的相对地址！因此我们就可以利用这一点将对静态变量的访问变为对相对于代码的相对地址的访问，这样一来静态数据跟随代码一起移动就不会访问不到了。我们来看下面这段代码：
  01      Org 100H
  02          Call Stub_Start
  03      Stub_Start:
  04          Pop BX
  05          Sub BX,Offset Stub_Start
  06      GetData:
  07          Add SI,SI
  08          Mov AX,Var1[SI+BX]
  09      Var1 DW 0,1,2,3,4,5,6,7,8,9

　　最前面两条语句Call Sub_Start和Pop BX取得标号Sub_Start在运行时的偏移地址（注意是运行时的偏移地址！如果这段代码被拷贝到内存中的其他地方，那这个地址和用Offset Sub_Start得到的地址是不同的）。然后在下一条语句Sub BX,Offset Sub_Start计算代码被移动了多少字节，然后在后面的内存访问中加上代码被移动的字节数就是变量此时的实际地址了。比如，编译好之后的代码如下：
      0F05:0100 E80000     CALL 0103
      0F05:0103 5B         POP  BX
      0F05:0104 81EB0301   SUB  BX,0103
      0F05:0108 03F6       ADD  SI,SI
      0F05:010A 2E8B800F01 MOV  AX,CS:[BX+SI+010F]
      0F05:0100                                              00                .
      0F05:0110 00 01 00 02 00 03 00 04-00 05 00 06 00 07 00 08 ................
      0F05:0120 00 09 00                                        ...
　　下面是运行记录
      AX=0000 BX=0000 CX=0123 DX=0000 SP=0000 BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0100 NV UP EI PL NZ NA PO NC 
      0F05:0100 E80000     CALL 0103
      AX=0000 BX=0000 CX=0123 DX=0000 SP=FFFE BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0103 NV UP EI PL NZ NA PO NC 
      0F05:0103 5B         POP  BX 
      AX=0000 BX=0103 CX=0123 DX=0000 SP=0000 BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0104 NV UP EI PL NZ NA PO NC 
      0F05:0104 81EB0301 SUB BX,0103 
      AX=0000 BX=0000 CX=0123 DX=0000 SP=0000 BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0108 NV UP EI PL ZR NA PE NC 
      0F05:0108 03F6       ADD  SI,SI 
      AX=0000 BX=0000 CX=0123 DX=0000 SP=0000 BP=0000 SI=0004 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=010A NV UP EI PL NZ NA PO NC 
      0F05:010A 2E8B800F01 MOV  AX,CS:[BX+SI+010F]           CS:0113=0002
      AX=0002 BX=0000 CX=0123 DX=0000 SP=0000 BP=0000 SI=0004 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=010F NV UP EI PL NZ NA PO NC 
      0F05:010F 0000  ADD  [BX+SI],AL                        DS:0004=00
　　在第二条语句得到该语句的当前偏移地址0103H，再减去该语句编译时的偏移地址0103H就得到代码当前地址与编译时地址之差，然后在访问变量时地址加上这个差就能正确地访问到变量。下面再看把代码拷贝到偏移地址0200H处的运行结果。
      AX=0000 BX=0000 CX=0123 DX=0000 SP=0000 BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0200 NV UP EI PL NZ NA PO NC 
      0F05:0200 E80000     CALL 0103
      AX=0000 BX=0000 CX=0123 DX=0000 SP=FFFE BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0203 NV UP EI PL NZ NA PO NC 
      0F05:0203 5B         POP  BX 
      AX=0000 BX=0203 CX=0123 DX=0000 SP=0000 BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0204 NV UP EI PL NZ NA PO NC 
      0F05:0204 81EB0301 SUB BX,0103 
      AX=0000 BX=0100 CX=0123 DX=0000 SP=0000 BP=0000 SI=0002 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=0208 NV UP EI PL ZR NA PE NC 
      0F05:0208 03F6       ADD  SI,SI 
      AX=0000 BX=0100 CX=0123 DX=0000 SP=0000 BP=0000 SI=0004 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=020A NV UP EI PL NZ NA PO NC 
      0F05:020A 2E8B800F01 MOV  AX,CS:[BX+SI+010F]           CS:0213=0002
      AX=0002 BX=0100 CX=0123 DX=0000 SP=0000 BP=0000 SI=0004 DI=0000 
      DS=0EF5 ES=0EF5 SS=0F05 CS=0F05 IP=020F NV UP EI PL NZ NA PO NC 
      0F05:020F 0000  ADD  [BX+SI],AL                        DS:0104=00
　　因为代码被移动了0100H，所以在第二条语句得到的偏移地址是0203H，减去0103H就得到代码当前地址与编译时地址之差0100H，然后在访问变量时地址加上这个差，正确地从Var1的第3个单元中取出了数据。


　　综上所述就是编写可在任意地址执行的代码的技巧了。只要将代码中所有的直接寻址操作按上面的方法修改，产生的代码就可以被拷贝到任何地方使用。
并不是所有的贴子都是原创,此时作者均指发表的人而不是文章的作者,作者会说明是否是转贴 



--------------------------------------------------------------------------------

上一篇::用tsr技术给dos装上黑匣子 下一篇::如何在实模式下直接访问4GB内存(转贴)
org.txt - 源码说明

本页面展示了「会变语言实现的一些程序」中的 org.txt 源码文件，采用文本编程语言编写，共 112 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫开发者社区收录了大量与汇编语言相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?