GNU
汇编器语法
示例
1 2 3 4 5 6 |
#include <unistd.h> int main(void) { write(1, "Hello World\n", 15); return 0; } |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
.file "test.c" .section .rodata .LC0: .string "Hello World\n" .text .globl main .type main, @function main: .LFB0: .cfi_startproc pushq %rbp .cfi_def_cfa_offset 16 .cfi_offset 6, -16 movq %rsp, %rbp .cfi_def_cfa_register 6 movl $15, %edx movl $.LC0, %esi movl $1, %edi call write movl $0, %eax popq %rbp .cfi_def_cfa 7, 8 ret .cfi_endproc .LFE0: .size main, .-main .ident "GCC: (Ubuntu 4.9.1-16ubuntu6) 4.9.1" .section .note.GNU-stack,"",@progbits |
定义数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
.section .data // 1 byte var1: .byte 10 // 2 byte var2: .word 10 // 4 byte var3: .int 10 // 8 byte var4: .quad 10 // 16 byte var5: .octa 10 // assembles each string (with no automatic trailing zero byte) into consecutive addresses str1: .asci "Hello world" // just like .ascii, but each string is followed by a zero byte str2: .asciz "Hello world" // Copy the characters in str to the object file str3: .string "Hello world" |
nasm数据操作
1 |
mov destination, source |
GNU汇编器操作
1 |
mov source, destination |
1 2 3 4 5 6 7 8 9 |
;; ;; nasm syntax ;; mov rax, rcx // // gas syntax // mov %rcx, %rax |
- 使用直接操作数,要用
$
1 |
movb $10, %rax |
- 获取部分内存时,例如 64 寄存器的第一个字节
1 |
mov ax, word [rsi] |
- 不在操作数中定义大小,而是在指令中定义
1 |
movw (%rsi), %ax |
GNU汇编器操作后缀
b
:1个字节操作数w
:2个字节操作数l
:4个字节操作数q
:8个字节操作数t
:10个字节操作数o
:16个字节操作数
内存访问
- nasm用的是
[]
,gnu使用()
1 2 |
movq -8(%rbp),%rdi movq 8(%rbp),%rdi |
跳转
1 |
lcall $section, $offset |
注释
1 2 3 |
# - single line comments // - single line comments /* */ - for multiline comments |
C调用汇编
- c程序
1 2 3 4 5 6 7 8 |
#include <string.h> int main() { char* str = "Hello World\n"; int len = strlen(str); printHelloWorld(str, len); return 0; } |
- 汇编
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
global printHelloWorld section .text printHelloWorld: ;; 1 arg mov r10, rdi ;; 2 arg mov r11, rsi ;; call write syscall mov rax, 1 mov rdi, 1 mov rsi, r10 mov rdx, r11 syscall ret |
- 构建
1 2 3 |
build: nasm -f elf64 -o casm.o casm.asm gcc casm.o casm.c -o casm |
内嵌汇编代码
- 语法
1 |
asm [volatile] ("assembly code" : output operand : input operand : clobbers); |
- 每个操作数由约束字符串描述,后面跟着括号中的 C 表达式
r
:将变量值保存在通用寄存器中g
:允许使用任何寄存器、内存或立即整数操作数,但非通用寄存器的寄存器除外f
:浮点寄存器m
:允许使用内存操作数,可以使用机器通常支持的任何类型的地址- 等等
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
#include <string.h> int main() { char* str = "Hello World\n"; long len = strlen(str); int ret = 0; __asm__("movq $1, %%rax \n\t" "movq $1, %%rdi \n\t" "movq %1, %%rsi \n\t" "movl %2, %%edx \n\t" "syscall" : "=g"(ret) : "g"(str), "g" (len)); return 0; } |
1 2 |
build: gcc casm.c -o casm |
在汇编中调用C
- c代码
1 2 3 4 5 6 7 8 |
#include <stdio.h> extern int print(); int print() { printf("Hello World\n"); return 0; } |
- 汇编
1 2 3 4 5 6 7 8 9 10 11 12 |
global _start extern print section .text _start: call print mov rax, 60 mov rdi, 0 syscall |
- 构建
1 2 3 4 |
build: gcc -c casm.c -o c.o nasm -f elf64 casm.asm -o casm.o ld -dynamic-linker /lib64/ld-linux-x86-64.so.2 -lc casm.o c.o -o casm |
汇编中使用浮点数
类型
- 单精度
- 双精度
- 双精度扩展
单精度浮点数数据在内存中
- 符号-1位
- 0为正数
- 指数-8位
- 指数是从 -128 到 127 的 8 位有符号整数,或者是从 0 到 255 的 8 位无符号整数
- 尾数-23位
- 详细:
- 指数为
00001111b
的十进制是15
。对于单精度位移为127
,这意味着我们需要计算指数-127
或15-127=-112
- 由于尾数的归一化二进制整数部分始终等于 1,因此尾数中仅记录其小数部分:
value = mantissa * 2^-112
- 指数为
1 2 3 |
| sign | exponent | mantissa |-------|----------|------------------------- | 0 | 00001111 | 110000000000000000000000 |
双精度浮点数据在内存中
- 符号-1位
- 0为正数
- 指数-11位
- 指数是从 -128 到 127 的 8 位有符号整数,或者是从 0 到 255 的 8 位无符号整数
- 尾数-52位
- 详细:
value = (-1)^sign * (1 + mantissa / 2 ^ 52) * 2 ^ exponent - 1023)
扩展精度
- 符号 - 1 位
- 指数 - 15 位
- 尾数 - 112 位
本文为原创文章,版权归Aet所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ Linux 高性能服务器编程:TCP二11/24
- ♥ Linux 内存映射与普通文件访问的区别03/31
- ♥ Dump分析:空指针访问二,重复释放堆内存二03/30
- ♥ Windows API11/11
- ♥ Macos编译x86_64相关一04/25
- ♥ Cef:沙盒、CefApp、CefClient02/29