这一章，讨论如何有效合理地组织数据，以及相关的编程技术。

16.1 描述了单元长度的标号

之前，我们一直在代码段中使用标号来标记指令、数据、段的起始地址。比如，下面的程序将 code 段中的 a 标号处的 8 个数据累加，结果存储到 b 标号处的字中。

assume cs:code
code segment
       a: db 1,2,3,4,5,6,7,8
       b: dw 0
start: mov si,offset a
       mov bx,offset b
       mov cx,8
    s: mov al,cs:[si]
       mov ah,0                    # ax=0001, 0002, ..., 0008
       add cs:[bx],ax            # 直接累加到 cs:[bx] 处
       inc si
       loop s
       mov ax,4c00h
       int 21h
code ends
end start

程序中，code、a、b、start、s都是标号，这些标号仅仅表示了内存单元的地址。

§ 第16章直接定址表 - 图1 使用一种标号，不仅表示内存单元的地址，还表示了内存单元的长度

§ 第16章直接定址表 - 图2

但是，我么们还可以使用一种标号，这种标号不仅表示内存单元的地址，还表示了内存单元的长度，即表示在此标号处的单元，是一个字节单元，还是字单元，还是双字单元。上面的程序还可以写成这样：

assume cs:code
code segment
       a db 1,2,3,4,5,6,7,8            # a而不是a:，它是同时描述内存单元和单元长度的标号
       b dw 0
start: mov si,0
       mov cx,8
    s: mov al,a[si]
       mov ah,0
       add b,ax
       inc si
       loop s
       mov ax,4c00h
       int 21h
code ends
end start

在 code 段中使用的标号 a、b 后面没有 : ，它们是同时描述内存单元和单元长度的标号。

标号 a，描述了地址 code:0，和从这个地址开始，以后的内存单元都是字节单元；
标号 b，描述了地址 code:8，和从这个地址开始，以后的内存单元都是字单元。

§ 第16章直接定址表 - 图3 标号 a, b 表示一个段中的内存单元

§ 第16章直接定址表 - 图4

因为这种标号包含了对单元长度的描述，所以在指令中，它可以代表一个段中的内存单元。比如，对于程序的 b dw 0：

# 下面指令1和指令2是等价的
mov ax,b                    # 指令1
mov ax,cs:[8]                # 指令2
# 下面指令3和指令4是等价的
mov b,2                        # 指令3
mov word ptr cs:[8],2        # 指令4
# 下面指令5和指令6是等价的
inc b                        # 指令5
inc word ptr cs:[8]            # 指令6

在上面的指令中，标号 b 代表了一个内存单元，地址为 code:8，长度为两个字节。

§ 第16章直接定址表 - 图5 引起错误的一些例子

下面的指令都是因为搞错了标号的长度（字、字节）而导致的编译错误

mov al,b            # b 代表的内存单元是字单元，而 al 是8位寄存器。
add b,al            # 同上

对于上面程序中的开辟内存的代码 a db 1,2,3,4,5,6,7,8：

# 指令1和指令2相当
mov al,a[si]            # 指令1
mov al,cs:0[si]            # 指令2
# 指令3和指令4相当
mov al,a[3]                # 指令3
mov al,cs:0[3]            # 指令4
# 指令5和指令6相当
mov al,a[bx+si+3]        # 指令5
mov al,cs:0[bx+si+3]    # 指令6

§ 第16章直接定址表 - 图6

上述代码中的标号 a 代表的就是 cs:0 这个地址。可见，使用这种包含单元长度的标号，可以使得我们以简单的形式访问内存中的数据。以后，我们将这种标号成为数据标号，它标记了存储数据的单元的地址和长度。它不同于仅仅表示地址的地址表好。

§ 第16章直接定址表 - 图7 检测点 16.1

§ 第16章直接定址表 - 图8

16.2 在其他段中使用数据标号

一般来说，我们不在代码段中定义数据，而是将数据定义到其他段中。在其他段中，我们也可以使用数据标号来描述存储数据的单元的地址和长度。

注意：在后面加有 **:** 的地址标号，只能在代码段中使用，不能在其他段中使用。

下面的程序将 data 段中 a 标号处的 8 个数据累加，结果存储到 b 标号处的字中。

assume cs:code,ds:data                        # 让编译器知道 ds→data，实际不一定
data segment
    a db 1,2,3,4,5,6,7,8
    b dw 0
data ends
code segment
    start: mov ax,data
           mov ds,ax                        # 手动设置 ds→data
           mov si,0
           mov cx,8
        s: mov al,a[si]
           mov ah,0
           add b,ax
           inc si
           loop s
           mov ax,4c00h
           int 21h           
code ends
end

下面是对上面代码中值得注意的地方进行讲述

§ 第16章直接定址表 - 图9 使用 assume 将标号所在段和段寄存器联系，让编译器知道

注意：如果想在代码段中直接用数据标号访问数据，则需要用伪指令 assume 将标号所在的段和一个段寄存器联系起来（即，assume cs:code，标号 code 和寄存器 cs 联系起来）。否则编译器在编译的时候，无法确定标号的段地址在哪一个寄存器中。

当然，这种联系是编译器需要的，但绝对不是说，我们因为编译器的工作需要，用 assume 指令将段寄存器和某个段相联系，段寄存器中就会真的存放该段的地址。我们在程序中还要使用指令对段寄存器进行设置。

比如，在上面的程序中，我们要在代码段 code 中用 data 段中的数据标号 a、b访问数据，则必须用 assume 将一个寄存器和 data 段相联。在程序中，我们用 ds 寄存器和 data 段相联，则编译器对相关指令的编译如下。

mov al,a[si]
# 编译为👇
mov al,[si+0]
add b,ax
# 编译为👇
add [8],ax

§ 第16章直接定址表 - 图10 assume 只是让编译器知道，我们必须手动设置正确的的标号和段寄存器关系

因为这些实际编译出的指令，都默认访问单元的段地址在 ds 中，而实际访问的段为 data，所以如果要访问正确，在这些指令执行前，ds 中必须为 data 段的段地址。则我们在程序中使用指令：

# 设置 ds→data段
mov ax,data
mov ds,ax

可以将标号当作数据来定义。此时，编译器将标号所表示的地址当作数据的值。比如：

data segment
    a db 1,2,3,4,5,6,7,8
    b dw 0
    c dw a,b
data ends
# 数据标号c处存储的是两个字型数据为标号a, b的偏移地址。相当于：
data segment
    a db 1,2,3,4,5,6,7,8
    b dw 0
    c dw offset a,offset b
data ends

再比如：

data segment
    a db 1,2,3,4,5,6,7,8
    b dw 0
    c dd a,b
data ends
# 数据标号c处存储的两个字型数据为标号a的偏移地址和段地址、标号b的偏移地址和段地址。相当于：
data segment
    a db 1,2,3,4,5,6,7,8
    b dw 0
    c dw offset a,seg a,offset b,seg b                # seg操作符，取得某一标号处的段地址
data ends

§ 第16章直接定址表 - 图11 检测点 16.2

§ 第16章直接定址表 - 图12

16.3 直接定址表

现在，我们讨论查表的方法编写相关程序的技巧。

§ 第16章直接定址表 - 图13 编写子程序

编写子程序：以 16 进制的形式在屏幕中间显示给定的字节型数据。

§ 第16章直接定址表 - 图14 分析

一个字节需要用两个十六进制数码来表示。所以，子程序需要在屏幕上显示两个 ASCII 字符。我们当然要用“0”、“1”、”2“、”3“、”4“、”5“、”6“、”7“、”8“、 ”9“、”A“、”B“、”C“、”D“、”E“、”F“ 这 16 个字符来显示十六进制数码。

我们可以将一个字节的高 4 位和低 4 位分开，分别用它们的值得到对应的数码字符。比如 2Bh，可以得到高 4 位的值为2，低 4 位的值为11，那么如何用这两个数值得到对应的数码字符 ”2“ 和 ”B“ 呢？

最简单的办法就是一个个比较，如下：

如果数值为 0，则显示 ”0“；
如果数值为 1，则显示 ”1“；
…
如果数值为 11，则显示 ”B“；
…

但是，我么可以看到，这样做的话程序中要使用多条比较、转移指令。程序比较长和混乱。

显然，我们希望能够在数值 0~15 和字符 ”0“~”F“ 之间找到一种映射关系。

数值 0~9 和字符 "0"~"9"之间的映射关系为：数值+30h=对应字符的ASCII值
0+30h="0"的ASCII值
1+30h="1"的ASCII值
2+30h="2"的ASCII值
...
9+30h="9"的ASCII值
10~15 和字符 "A"~"F"之间的映射关系为：数值+37h=对应字符的ASCII值
10+37h="A"的ASCII值
11+37h="B"的ASCII值
12+37h="C"的ASCII值
...
15+37h="F"的ASCII值

因为数值 0~15 和字符 “0”~”F” 之间没有一致的映射关系存在，所以，我们应该在它们之间建立新的映射关系。

具体的做法是：建立一张表，表中依次存储字符 “0”~”F”，我们可以通过数值 0~15 直接查找到对应的字符。

§ 第16章直接定址表 - 图15 子程序如下：

§ 第16章直接定址表 - 图16

; 用 al 传送要显示的数据
showbyte: jmp short show
          table db '0123456789ABCDEF'                ; 字符表
    show: push bx
          push es
          mov ah,al
          shr ah,1
          shr ah,1
          shr ah,1
          shr ah,1
          and al,00001111b                            ; 右移4位，ah中得到高4位的值, al中为低4位的值
          mov bl,ah
          mov bh,0
          mov ah,table [bx]                            ; 用高4位的值作为相对于table的偏移，取得对应的字符
          mov bx,0b800h
          mov es,bx
          mov es:[160*12+40*2],ah
          mov bl,al
          mov bh,0
          mov al,table [bx]                            ; 用低4位的值作为相对于table的偏移，取得对应的字符
          mov es:[160*12+40*2+2],al
          pop es
          pop bx
          ret

可以看出，在子程序中，我们在数值 0~15 和字符 “0”~”F 之间建立的映射关系为：以数值 N 为 table 表中的偏移，可以找到对应的字符。

利用表，在两个数据集合之间建立一种映射关系，是我们可以用查表的方法根据给出的数据得到其在另一集合中的对应数据。这样做的目的一般来说有以下几个。

为了算法的清晰和简洁；
为了加快运算速度；
为了使程序易于扩充。

§ 第16章直接定址表 - 图17 在上面的子程序中，我们更多的是为了算法的清晰和简洁，而采用了查表的方法。下面我们来看一下，为了加快运算速度而采用查表的方法的情况。

§ 第16章直接定址表 - 图18 编写一个子程序，计算 $§ 第16章直接定址表 - 图19$ %2Cx%5Cin%5C%7B%200%5Cdegree%2C30%5Cdegree%2C60%5Cdegree%2C90%5Cdegree%2C120%5Cdegree%2C150%5Cdegree%2C180%5Cdegree%5C%7D#card=math&code=%5Csin%28x%29%2Cx%5Cin%5C%7B%200%5Cdegree%2C30%5Cdegree%2C60%5Cdegree%2C90%5Cdegree%2C120%5Cdegree%2C150%5Cdegree%2C180%5Cdegree%5C%7D&id=Nuf7C)，并在屏幕中间显示计算结果。比如， $§ 第16章直接定址表 - 图20$ #card=math&code=%5Csin%2830%5Cdegree%29&id=hsOCf)的结果显示为 “0.5”。

我们可以利用麦克劳林公式来计算 $§ 第16章直接定址表 - 图21$ #card=math&code=%5Csin%28x%29&id=VewRe)。 $§ 第16章直接定址表 - 图22$ 为角度，麦克劳林公式中需要代入弧度，则：

$§ 第16章直接定址表 - 图23$ %20%26%3D%20%5Csin(y)%5Capprox%20y-%5Cfrac%7B1%7D%7B3!%7D%2B%5Cfrac%7B1%7D%7B5!%7Dy%5E5%20%5C%5C%0Ay%20%26%3D%20%5Cfrac%7Bx%7D%7B180%7D*3.1415926%0A%5Cend%7Baligned%7D%0A#card=math&code=%5Cbegin%7Baligned%7D%0A%5Csin%28x%29%20%26%3D%20%5Csin%28y%29%5Capprox%20y-%5Cfrac%7B1%7D%7B3%21%7D%2B%5Cfrac%7B1%7D%7B5%21%7Dy%5E5%20%5C%5C%0Ay%20%26%3D%20%5Cfrac%7Bx%7D%7B180%7D%2A3.1415926%0A%5Cend%7Baligned%7D%0A&id=WB6SU)

可以看出，计算 $§ 第16章直接定址表 - 图24$ #card=math&code=%5Csin%28x%29&id=kNy9M)需要进行多次乘法和除法。乘法是非常费时的运算，它们的执行时间大约是加法、比较等指令的 5 倍。如何才能够不做乘除而计算 $§ 第16章直接定址表 - 图25$ #card=math&code=%5Csin%28x%29&id=desh8)呢？我们看一下需要计算的 $§ 第16章直接定址表 - 图26$ #card=math&code=%5Csin%28x%29&id=KDdeQ)的结果：

$§ 第16章直接定址表 - 图27$ %3D0#card=math&code=%5Csin%280%5Cdegree%29%3D0&id=l8T1A)
$§ 第16章直接定址表 - 图28$ %3D0.5#card=math&code=%5Csin%2830%5Cdegree%29%3D0.5&id=n5W0y)
$§ 第16章直接定址表 - 图29$ %3D0.866#card=math&code=%5Csin%2860%5Cdegree%29%3D0.866&id=lDZxf)
$§ 第16章直接定址表 - 图30$ %3D1#card=math&code=%5Csin%2890%5Cdegree%29%3D1&id=pbCzk)
$§ 第16章直接定址表 - 图31$ %3D0.866#card=math&code=%5Csin%28120%5Cdegree%29%3D0.866&id=ipkb9)
$§ 第16章直接定址表 - 图32$ %3D0.5#card=math&code=%5Csin%28150%5Cdegree%29%3D0.5&id=Y0geu)
$§ 第16章直接定址表 - 图33$ %3D0#card=math&code=%5Csin%28180%5Cdegree%29%3D0&id=IJIt0)

我们可以看出，其实用不着计算，可以占用一些内存空间来换取运算的速度。将所要计算的 $§ 第16章直接定址表 - 图34$ #card=math&code=%5Csin%28x%29&id=xdzLh)的结果存储到一张表中；然后用角度值来查表，找到对应的 $§ 第16章直接定址表 - 图35$ #card=math&code=%5Csin%28x%29&id=wBgSN) 的值。

§ 第16章直接定址表 - 图36 用 ax 向子程序传递角度，程序如下：

showsin:   jmp short show
           table dw ag0,ag30,ag60,ag90,ag120,ag150,ag180                        ; 字符串偏移地址表
           ag0   db '0',0                                                        ; sin(0)对应的字符串"0"
           ag30  db '0.5',0                                                        ; sin(30)对应的字符串"0.5"
           ag60  db '0.866',0                                                    ; sin(60)对应的字符串"0.866"
           ag90  db '1',0                                                        ; sin(90)对应的字符串"0.866"
           ag120  db '0.866',0                                                    ; sin(120)对应的字符串"0.866"
           ag150  db '0.5',0                                                    ; sin(150)对应的字符串"0.866"
           ag180  db '0',0                                                        ; sin(180)对应的字符串"0.866"
show: push ax 
      push es 
      push si
      mov bx,0b800h
      mov es,bx
; 以下用 角度值/30 作为相对于table的偏移，取得对应的字符串的偏移地址，放在bx中
mov ah,0
mov bl,30
div bl
mov bl,al
mov bh,0
add bx,bx
mov bx,table[bx]
; 以下显示sin(x)对应的字符串
        mov si,160*12+40*2
 shows: mov ah,cs:[bx]
         cmp ah,0
         je showret
         mov es:[si],ah
         inc bx
         add si,2
         jmp short shows
showret: pop si
         pop es
         pop bx
         ret

在上面的子程序中，我们在角度值 X 和表示 $§ 第16章直接定址表 - 图37$ #card=math&code=%5Csin%28x%29&id=BLtzA)的字符串集合 table 之间建立的映射关系为：以角度值/30 为 table 表中的偏移，可以找到对应的字符串的首地址。

编程的时候要注意程序的容错性，即对于错误的输入要有处理能力。在上面的子程序中，我们还应该再加上对提供的角度值是否超范围的检测。如果提供的角度值不在合法的集合中，程序将定位不到正确的字符串，出现错误。

上面的两个子程序中，我们将通过给定的数据进行计算或比较而得到结果的问题，转化为用给出的数据作为查表的依据，通过查表得到结果的问题。具体的查表方法，是用来查表的依据数据，直接计算出所要查找的元素在表中的位置。像这种可以通过依据数据，直接计算出所要找的元素的位置的表，我们称其为直接定址表。

16.4 程序入口地址的直接定址表

我们可以在直接定址表中存储子程序的地址，从而方便地实现不同子程序的调用。我们看下面的问题。

实现一个子程序 setscreen，为显示输出提供如下功能。

清屏；
设置前景色；
设置背景色；
向上滚动一行。

入口参数说明如下

用 ah 寄存器传递功能号：0 表示清屏、1 表示设置前景色、2 表示设置背景色、3 表示向上滚动一行
对于 1、2 号功能，用 al 传送颜色值， $§ 第16章直接定址表 - 图38$ 。

下面我们讨论一下各种功能如何实现：

清屏：将显存中当前屏幕中的字符设为空格符；
设置前景色：设置现存中当前屏幕中处于奇地址的属性字节的第 0、1、2 位；
设置背景色：设置显存中当前屏幕中处于奇地址的属性字节的第 4、5、6位；
向上滚动一行：依次将第n+1 行的内容复制到第 n 行处；最后一行为空。

下面将这 4 种功能分别写为 4 个子程序，如下所示

    sub1: push bx
          push cx
          push es
          mov bx,0b800h
          mov es,bx
          mov bx,0
          mov cx,2000
   sub1s: mov byte ptr es:[bx],''
             add bx,2
             loop sub1s
             pop es
             pop cx
             pop bx
             ret
    sub2: push bx
          push cx
          push es
          mov bx,0b800h
          mov es,bx
          mov bx,1
          mov cx,2000
   sub2s: and byte ptr es:[bx],11111000b
             or es:[bx],al
             add bx,2
             loop sub2s
             pop es
             pop cx
             pop bx
             ret
       sub3: push bx
              push cx
              push es
              mov cl,4
              shl al,cl
              mov bx,0b800h
              mov es,bx
              mov bx,1
              mov cx,2000
   sub3s: and byte ptr es:[bx],10001111b
             or es:[bx],al
             add bx,2
             loop sub3s
             pop es
             pop cx
             pop bx
             ret
       sub4: push cx
             push si
             push di
             push es
             push ds
             mov si,0b800h
             mov es,si
             mov ds,si
             mov si,160                    ; ds:si 指向第n+1行
             mov di,0                        ; es:di 指向第n行
             cld
             mov cx,24                        ; 共复制24行
   sub4s: push cx
             mov cx,160
             rep movsb                        ; 复制
             pop cx
             loop sub4s
             mov cx,80
             mov si,0
  sub4s1: mov byte ptr [160*24+si],''    ; 最后一行清空
            add si,2
            loop sub4s1
            pop ds
            pop es
            pop di
            pop si
            pop cx
            ret

§ 第16章直接定址表 - 图39 实现方式1

我们可以将这些功能子程序的入口地址存储在一个表中，它们在表中的位置和功能号相对应。对应关系为：功能号*2=对应的功能子程序在地址表中的偏移。程序如下：

setscreen: jmp short set
     table dw sub1,sub2,sub3,sub4
      set: push bx
             cmp ah,3                                            ; 判断功能号是否大于3
             ja sret
             mov bl,ah
             mov bh,0
             add bx,bx                                        ; 根据ah中的功能号计算对应子程序在table表中的偏移
             call word ptr table[bx]                            ; 调用对应的功能子程序
     sret: pop bx
            ret

根据功能号查找地址表的方法，程序的结构清晰，便于扩充。如果加入一个新的功能子程序，只需要在地址表中加入它的入口地址即可。

§ 第16章直接定址表 - 图40 实现方式2

我们可以将子程序 setscreen 如下实现

setscreen: cmp ah,0
           je do1
           cmp ah,1
           je do2
           cmp ah,2
           je do3
           cmp ah,3
           je do4
           jmp short sret
      do1: call sub1
             jmp short sret
      do2: call sub2
             jmp short sret
      do3: call sub3
           jmp short sret
      do4: call sub4
      sret: ret

显然，通过上述比较功能号进行转移的方法，使得程序结构很混乱并且不利于功能的扩充。

§ 第16章 直接定址表

16.1 描述了单元长度的标号

16.2 在其他段中使用数据标号

16.3 直接定址表

16.4 程序入口地址的直接定址表

§ 第16章直接定址表