在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。
伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。
在ARM的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。
符号定义伪指令:
符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。
常见的符号定义伪指令有如下几种:
定义全局变量的GBLA、GBLL和GBLS
定义局部变量的LCLA、LCLL和LCLS
对变量赋值的SETA、SETL、SETS
为通用寄存器列表定义名称的RLIST
GBLA/GBLL/GBLS
语法格式:
GBLA(GBLL或GBLS) 全局变量名
GBLA、GBLL和GBLS伪指令用于定义一个ARM程序中的全局变量,并将其初始化。其中:
GBLA: 定义一个全局的数字变量,并初始化为0;
GBLL:定义一个全局的逻辑变量,并初始化为F(假);
GBLS:定义一个全局的字符串变量,并初始化为空;
以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。
使用示例:
GBLA Test1
定义一个全局的数字变量,变量名为Test1
Test1 SETA 0xaa
将该变量赋值为0xaa
GBLL Test2
定义一个全局的逻辑变量,变量名为Test2
Test2 SETL {TRUE}
将该变量赋值为真
GBLS Test3
定义一个全局的字符串变量,变量名为Test3
Test3 SETS “Testing”
将该变量赋值为“Testing”
RLIST指令:
语法格式:
名称 RLIST {寄存器列表}
RLIST伪指令用于对一个通用寄存器列表定义名称,使用该伪指令定义的列表名称可在ARM指令LDM/STM中使用。在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。
使用示例:
RegList RLIST {R0-R5,R8,R10} ;将寄存器列表名称定义为RegList,可在ARM指令LDM/STM中通过该名称访问寄存器列表。
数据定义伪指令:
数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。常见的数据定义伪指令有如下几种:
DCB DCW DCD DCFD
DCFS DCQ SPACE MAP FIELD
DCB指令
语法格式:
标号 DCB 表达式
DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。其中,表达式可以为0~255的数字或字符串。DCB也可用“=”代替。
使用示例:
Str DCB “This is a test!” ;分配一片连续的字节存储单元并初始化。
SPACE指令
语法格式:
标号 SPACE 表达式
SPACE伪指令用于分配一片连续的存储区域并初始化为0。 其中,表达式为要分配的字节数。SPACE也可用“%”代替。
使用示例:
DataSpace SPACE 100 ;分配连续100字节的存储单元并初始化为0。
MAP指令
语法格式:
MAP 表达式{,基址寄存器}
MAP 伪指令用于定义一个结构化的内存表的首地址。MAP也可用“^”代替。表达式可以为程序中的标号或数学表达式,基址寄存器为可选项,当基址寄存器选项不存 在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。MAP伪指令通常与FIELD伪指令配合使用来定义 结构化的内存表。
使用示例:
MAP 0x100,R0
定义结构化内存表首地址的值为0x100+R0。
FILED指令
语法格式:
标号 FIELD 表达式
FIELD 伪指令用于定义一个结构化内存表中的数据域。FILED也可用“#”代替。表达式的值为当前数据域在内存表中所占的字节数。FIELD伪指令常与MAP伪 指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址,FIELD伪指令定义内存表中的各个数据域,并可以为每个数据域指定一个标号供其他 的指令引用。
使用示例:
MAP 0x100 ;定义结构化内存表首地址的值为0x100。
A FIELD 16 ;定义A的长度为16字节,位置为0x100
B FIELD 32 ;定义B的长度为32字节,位置为0x110
S FIELD 256 ;定义S的长度为256字节,位置为0x130
汇编控制伪指令
汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条:
IF、ELSE、ENDIF
WHILE、WEND
MACRO、MEND
MEXIT
IF指令:
语法格式:
IF逻辑表达式
指令序列1
ELSE
指令序列2
ENDIF
IF、ELSE、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。当IF后面的逻辑表达式为真,则执行指令序列1,否则执行指令序列2。其中,ELSE及指令序列2可以没有。IF、ELSE、ENDIF伪指令可以嵌套使用。
使用示例:
GBLL Test ;声明一个全局的逻辑变量,变量名为Test
……
IF Test = TRUE
指令序列1
ELSE
指令序列2
ENDIF
WHILE指令
语法格式:
WHILE 逻辑表达式
指令序列
WEND
WHILE、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。当WHILE后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。WHILE、WEND伪指令可以嵌套使用。
使用示例:
GBLA Counter ;声明一个全局的数学变量,变量名为Counter
Counter SETA 3 ;由变量Counter控制循环次数
……
WHILE Counter < 10
指令序列
WEND
其他伪指令
还有一些其他的伪指令,在汇编程序中经常会被使用,包
括以下几条:
AREA
ALIGN
CODE16、CODE32
ENTRY
END
EQU
EXPORT(或GLOBAL)
IMPORT
EXTERN
GET(或INCLUDE)
AREA指令
语法格式:
AREA 段名 属性1,属性2,……
AREA伪指令用于定义一个代码段或数据段。其中,段名若以数字开头,则该段名需用“|”括起来,如|1_test|。属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。
常用的属性如下:
CODE属性:用于定义代码段,默认为READONLY。
DATA属性:用于定义数据段,默认为READWRITE。
READONLY属性:指定本段为只读,代码段默认为READONLY。
READWRITE属性:指定本段为可读可写,数据段的默认属性为READWRITE。
AREA指令
ALIGN属性,使用方式为
ALIGN 表达式
在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的。
一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。
使用示例:
AREA Init,CODE,READONLY
该伪指令定义了一个代码段,段名为Init,属性为只读
混合编程
在 应用系统的程序设计中,若所有的编程任务均用汇编语言来完成,其工作量是可想而知的,同时,不利于系统升级或应用软件移植,事实上,ARM体系结构支持 C/C+以及与汇编语言的混合编程,在一个完整的程序设计的中,除了初始化部分用汇编语言完成以外,其主要的编程任务一般都用C/C++ 完成。汇编语言与C/C++\的混合编程通常有以下几种方式:
1.在C/C++代码中嵌入汇编指令。
2.在汇编程序和C/C++的程序之间进行变量的互访。
3.汇编程序、C/C++程序间的相互调用。
在实际的编程中,使用较多的方式是:程序的初始化部分用汇编语言完成,然后用
C/C++完成主要的编程任务,程序在执行时首先完成初始化过程,然后跳转到C/C++程
序代码中,汇编程序和C/C++程序之间一般没有参数的传递,也没有频繁的相互调用,因此,整个程序的结构显得相对简单,容易理解。