1. asm格式

GNU的C编译器使用asm关键字:asm段格式如下:
asm ("assembly code"); 一些汇编器使用制表符字符缩进指令以便区分和标签。GNU编译器不需要这样做,单为保持一致使用这样方式。
asm("mov $1, %eax\n\tmov $0, %ebx\n\tint $0x80"); 这样格式有些混乱,下面这样方式书写:

asm("mov $1, %eax\n\t"
    "mov $0, %ebx\n\t"
    "int $0x80");

将asm放入到代码中例如:

#include <stdio.h>
int main()
{
    int a = 10;
    int b = 20, result;
    result = a * b;
    asm ("nop");
    printf("The result is %d\n", result);
    return 0;
}

C源代码中生成的汇编代码,其中#APP#NO_APP符号表示是asm生成的段落 内容。

1.1 使用全局变量

基本内联汇编代码,可以使用程序定义的全局C变量

#include <stdio.h>
int a = 10;
int b = 20;
int result
int main()
{
    asm ("pusha\n\t"
         "movl a, %eax\n\t"
         "movl b, %ebx\n\t"
         "imull %ebx, %eax\n\t"
         "movl %eax, result\n\t"
         "popa");
   printf("the answer is %d\n", result);
   return 0;
}

注意:数据变量必须被声明为全局的,不能在asm段中使用局部变量。

1.2 使用volatile修饰符

使用volatile修饰符的添加不希望优化这个代码段。
asm volatile("assembly code");

1.3 使用替换的关键字

ANSI C规范把关键字asm用于其他用途,不能用于内联汇编。ANSI C想使用内联汇编,则使用__asm__关键字替代asm
__asm__("assembly code");

2.扩展asm

基本asm有其局限性:

  • 1.输入和输出都必须是全局变量
  • 2.内联汇编不能改变任何寄存器的值。

GNU汇编器提供asm段的扩展格式来帮助解决这些问题。asm扩展版的格式如下:

asm("assembly code"
  :ouput locations
  :input operands
  :changed registers);

有4个部分组成,使用冒号组成:

  • 汇编代码:使用基本asm格式相同的语法内联汇编代码
  • 输出位置:包含内联汇编输出值的寄存器和内存位置的列表
  • 输入操作数:包含内联汇编代码的输入值的寄存器和内存位置的列表
  • 改动的寄存器:内联代码改变的任何其他寄存器的列表

其中,输入和输出可以为空,只有最后一个冒号可以省略。

2.1 指定输入和输出值

扩展格式,可以从寄存器内存位置输入值和输出值赋值。输入值和输出值列表的格式是:
"constraint" (variable) 其中:

  • variable是程序中C变量。注意:扩展asm格式中,局部和全局变量都可以使用。
  • constraint定义把变量存放到哪里(输入来说)或从哪里传送变量(输出来说)。
  • 使用它定义变量存放在寄存器中还是在内存位置中。
    约束constraint是单一字符的代码,约束代码中:

约束

描述

a

使用%eax,%ax或者%al寄存器

b

使用%ebx,%bx或者%bl寄存器

c

使用%ecx,%cx或者%cl寄存器

d

使用%edx,%dx或者%dl寄存器

S

使用%esi或者%si寄存器

D

使用%edi或者%di寄存器

r

使用任何通用的寄存器

q

使用%eax,%ebx,%ecx,或者%edx寄存器之一

A

对于64位值使用%eax和%ebx寄存器

f

使用浮点寄存器

t

使用第一个(顶部的)浮点寄存器

u

使用第二个浮点寄存器

m

使用变量的内存位置

o

使用偏移内存位置

V

只是用直接内存位置

i

使用立即整数值

n

使用值已知的立即整数值

g

使用任何可用的寄存器或者内存位置

除了约束之外,输出值包含约束修饰符,指示编译器如何处理输出值,可以使用如下来修饰输出值:

输出修饰符

描述

+

可以读取和写入操作数

=

只能写入操作数

%

如果必要,操作数可以和下一个操作数切换

&

在内联函数完成之前,可以删除或者重新使用操作数

例如:asm("assembly code" : "=a"(result) :"d"(data1), "c"(data2));

  • 把C变量data1放入到EDX寄存器中
  • 把data2存放到ECX寄存器中
  • 内联汇编的结果放入到EAX中,然后传递给变量result

注意:输入是C变量给寄存器,而输出是寄存器给C变量。

2.2 使用寄存器

如果输入和输出都给寄存器,几乎和平常一样使用寄存器,需注意的是扩展asm中,在汇编代码中引用寄存器,必须使用两个百分号符号

#include <stdio.h>
int main()
{
    int data1 = 10;
    int data2 = 20;
    int result;
    // edx为data1,ecx为data2
    // eax赋值给result
    asm ("imull %%edx, %%ecx\n\t"
         "movl %%ecx, %%eax"
         : "=a"(result)
         : "d"(data1), "c"(data2));
    printf("The result is %d\n", result);
    return 0;
}

MOVS指令输入值包含输出位置,volatile很重要,编译器因为没有输出值,认为这个asm没有必要而删除asm段:

#include <stdio.h>
int main()
{
    char input[30] = {"This is a test message.\n"};
    char output[30];
    int length = 25;
    asm volatile (
      "cld\n\t"
      "rep movsb"
      :
      :"S"(input), "D"(output), "c"(length)  
    );
    printf("%s", output)
    return 0;
}

2.3 使用占位符

很多输入和输出的情况,可以使用占位符(placeholder)。占位符是前面加上百分号的数字。按照内联汇编代码中列出的每个输入值和输出值在列表中的位置。每个值被赋予一个从开始的数字。然后可以在汇编代码中使用占位符表示值。

asm("assembly code"
    :"=r"(result)
    :"r"(data1), "r"(data2));

其中:

  • %0将表示包含变量值result的寄存器
  • %1将表示包含变量值data1的寄存器
  • %2将表示包含变量值data2的寄存器

注意:占位符提供在内联汇编代码中利用寄存器和内存位置的方法。汇编代码中使用占位符只作为原始的数据:

imull %1, %2
movl %2, %0

示例如下:

#include <stdio.h>
int main()
{
    int data1 = 10;
    int data2 = 20;
    int result;
    asm ("imull %1, %2\n\t"
         "movl %2, %0"
         :"=r"(result)
         :"r"(data1),"r"(data2));
   printf("The result is %d\n", result)
   return 0;
}

gdb调试:info reg 整个asm被看作为一条语句,使用stepi来调试asm汇编

2.4 引用占位符

如果内联汇编代码中的输入值和输出值共享程序中相同的C变量,可以指定使用占位符作为约束值。

修改上面个汇编代码如下:

asm("imull %1, %0"
    :"=r"(data2)
    :"r"(data1),"0"(data2));

2.5 替换占位符

如果很多占位符,就会混乱。从GNU3.1开始允许声明替换名称作为占位符。格式如下:%[name]"constraint"(variable)

定义的值name成为内联汇编代码中的变量新的占位符标识符,下面例子:

asm("imull %[value1], %[value2]"
    :[value2]"=r"(data2)
    :[value1]"r"(data1),"0"(data2));

使用占位替换占位符名称的方式和使用普通的占位符相同。

2.6 改动的寄存器列表

改动寄存器列表:如果改动了不在输入和输出列表中的寄存器,要进行申明这些寄存器。

#include <stdio.h>
int main()
{
    int data1 = 10;
    int result;
    asm ("imull %1, %2\n\t"
         "movl %2, %0"
         :"=r"(result)
         :"r"(data1),"0"(result)
        :"%eax");
   printf("The result is %d\n", result)
   return 0;
}

让编译器正确避免使用eax寄存器,因为在内联汇编代码中声明了要使用它。

在改动寄存器列表中使用memory,通知编译器这个内存位置在内联汇编代码中被改动。

2.7 使用内存位置

虽然内联汇编代码使用寄存器比较快,但也可以使用C变量的内存位置。约束m用于引用输入和输出值中的内存位置。要求使用寄存器的汇编指令,仍然必须使用寄存器,所以不许不得不定义保存数据的中间寄存器。

#include <stdio.h>
int main()
{
    int dividend = 20;
    int divisor = 5;
    int result;
    asm("divb %2\n\t"
        "movl %%eax, %0"
        :"m"(result)
        :"a"(dividend), "m"(divisor));
   printf("The result is %d\n", result);
   return 0;
}

2.8 处理跳转

内联汇编代码中是使用标签有两个限制。

  • 只能跳转到相同的asm段内的标签。
  • 不同asm不适用相同的标签,不适用C关键字。(局部标签解决)
#include <stdio.h>
int main()
{
    int a= 10;
    int b= 20;
    int result;
    asm ("cmp %1, %2\n\t"
         "jge greater\n\t"
         "movl %1, %0\n\t"
         "jmp end\n"
  "greater:\n\t"
         "movl %2, %0\n"
         "end:"
         :"=r"(result)
         :"r"(a),"r"(b));
       
   printf("The larger value is %d\n", result)
   return 0;
}

使用局部标签方法:条件分支和无条件分支都允许指定一个数字加上方向标志作为标签,方向标志指出处理器应该向那个方向查找数字型标签。第一个遇到的标签会被采用。

#include <stdio.h>
int main()
{
    int a= 10;
    int b= 20;
    int result;
    asm ("cmp %1, %2\n\t"
        "jge 0f\n\t"
        "movl %1, %0\n\t"
        "jmp 1f\n"
       "0:\n\t"
        "movl %2, %0\n"
       "1:"
        :"=r"(result)
        :"r"(a),"r"(b));
      
   printf("The larger value is %d\n", result)
   return 0;
}

backward和forward

3.使用内联汇编代码

和对待C宏函数一样,可以声明包含内联汇编的宏函数。内联汇编代码必须使用扩展asm格式,便于输入正确的输入值和输出值。

定义一个内联汇编宏函数的一个例子:

#define GREATER(a, b, result) ({\
    asm("cmp %1, %2\n\t" \
        "jge 0f\n\t" \
        "movl %1, %0\n\t" \
        "jmp 1f\n" \
        "0:\n\t" \
        "movl %2, %0\n" \
        "1:" \
        :"=r"(result) \
        :"r"(a), "r"(b));})