1. 第一段代码：Hello World

DSEG SEGMENT
        MESS DB 'Hello, World!',0DH,0AH,24H
DSEG ENDS

SSEG SEGMENT PARA STACK
             DW 256 DUP(?)
SSEG ENDS

CSEG SEGMENT
              ASSUME CS:CSEG, DS:DSEG
        BEGIN:MOV    AX,DSEG
              MOV    DS,AX
              MOV    DX,OFFSET MESS
              
              MOV    AH,9
              INT    21H
              
              MOV    AH,4CH
              INT    21H
CSEG ENDS
END BEGIN

2. 基础指令

用以下指令可以写一个基础的程序：

段定义+Assume

1 2	XXX SEGMENT(XXX:DATA/STACK/CODE) XXX ENDS

ASSUME CS:CSEG, DS:DSEG, SS:SSEG
MOV AX,DSEG
MOV DS,AX
MOV AX,SSEG
MOV SS,AX

数据定义

(ORG 1000)
(NAME) DB ?/...
(NAME) DB N DUP(?/...)
db:12H/dw:1234H

1
2
3

MOV AX,Y
MOV Y,AX
MOV AX,BX

ADD AX,X;AX+=X
SUB AX,X;
INC AX;AX++
DEC AX;AX--

NEG AX ;取负

程序的终止

1 2	MOV AH,4CH INT 21H

3. 寄存器的使用

在汇编语言中，我们不能对内存中的数据进行直接操作，如果要操作，需要把数据先MOV到寄存器中再进行处理。

8086 CPU 中有14个16位寄存器。16位的存储可以用16进制表示，BeLike：123AH（H表示16进制)在查看内存情况的时候，由于数据从高位到低位存储，BeLike：3A 12

DSEG ...
X DB 12H
Y DB ?
....

CSEG...
...
MOV AH,X
MOV Y,AH ;Y--12H

可以拆分为两个寄存器使用（AH和AL），不过各自有各自的独特作用，用到再提，这和它们的名字是关联的

说到底为什么通用寄存器会有独特的作用？
这是因为一些内置的指令依靠固定的寄存器传递参数，所以这些寄存器也有了独特的作用

一般来说随便用就可以，反正里面的东西不久存，只是用来做中转

3.1 AX：Accumlator 累加器

特殊功能和MUL/DIV有关，后面再说

3.2 BX：Base 基地址寄存器

可以存储地址并访问
说到地址，就得提一下汇编语言里地址的表示方法
在汇编语言里，内存中的地址BeLike：204B:1001 （以16进制表示）
204B是段地址，1001是偏移地址，各需要一个Word进行存储
有两个指令对应的获取内存单元的这两种地址
SEG可以获取段地址（这个段就是指我们程序对应的段Segment），OFFSET可以获取偏移地址
使用这两个词只需要在MOV时加在变量前即可，比如MOV BX offset X
在通过地址找内容这件事方面，一般用BX存储偏移地址
比如：

X DW 1234H
Y DW ?
...
MOV BX, OFFSET X;BX中存储了X的偏移地址
MOV Y, [BX];BX存储的偏移地址对应的内容被存放到y

一般来说，[BX]就是指 DS:[BX]，默认段地址为数据段，当然你也可以指定为CS和SS

3.3 CX：Count 计数器

和循环指令LOOP有关

LOOP指令类似于C语言中的For循环，loop NAME近似于for(cx;;cx--)
关于LOOP的用法，具体到程序结构再说好了~。

3.4 DX：Data 数据寄存器

特殊功能和MUL/DIV有关，后面再说
也有与输入输出的暂存有关的功能（9.10号指令）

3.5 指针变址寄存器：SP，BP，SI，DI

都倾向于用来存地址

3.5.1 SP：Stack Pointer

和堆栈段的使用有关，定义堆栈段要记得手动把SP放在栈顶

3.5.2 BP：Base Pointer

和BX有类似的用法，只是一般更倾向于用在堆栈的数据里，[BP]默认为SS:[BP]

3.5.3 SI：Source Index

3.5.4 DI：Destination Index

和BX有类似的用法，[SI]默认为DS:[SI]
如果要转移数据，倾向于用SI存原地址，DI存新地址

3.6 段寄存器：CS，DS，SS，ES，IP

段的存在方便我们以段地址+偏移地址的方式定位内存单元
刚刚在例子中看到，一般的程序我们定义三个段，Data、Stack和Code，它们的作用和名字是一致的

这些寄存器都和程序段还有程序的运行有关。
在程序启动的时候，操作系统会把IP（Instruction Pointer）指向程序的第一句开始运行，之后IP会一直指向每次要运行的下一条指令

在代码段的开始，我们就用Assume语句声明CS、DS、SS的地址
和CS不同，DS和SS寄存器的值需要我们手动指定，而与SS寄存器绑定的SP指针也需要我们手动设置（SS:SP指向的就是栈顶元素）

ES是Extra Segment，程序有附加段落的时候才用，用法和DS SS差不多

3.7 寄存器合集统计

通用寄存器 (General-Purpose Registers):
- AX, BX, CX, DX: 16位寄存器
- EAX, EBX, ECX, EDX: 32位寄存器
- RAX, RBX, RCX, RDX: 64位寄存器
指针寄存器 (Pointer Registers):
- SI: 源变址寄存器 (Source Index)
- DI: 目的变址寄存器 (Destination Index)
- BP: 基址指针寄存器 (Base Pointer)
- SP: 堆栈指针寄存器 (Stack Pointer)
段寄存器 (Segment Registers):
- CS: 代码段寄存器 (Code Segment)
- DS: 数据段寄存器 (Data Segment)
- SS: 堆栈段寄存器 (Stack Segment)
- ES: 附加段寄存器 (Extra Segment)
- FS, GS: 额外段寄存器 (Additional Segment) [64位模式中常用于TLS]
指令指针寄存器 (Instruction Pointer Register):
- IP: 指令指针 (Instruction Pointer) - 16位
- EIP: 扩展指令指针 (Extended Instruction Pointer) - 32位
- RIP: 64位指令指针寄存器
标志寄存器 (Flags Register):
- FLAGS, EFLAGS, RFLAGS: 包含各种标志位，如零标志、进位标志、溢出标志等。
控制寄存器 (Control Registers) 和 调试寄存器 (Debug Registers): 主要用于系统控制和调试。
- CR0, CR2, CR3, CR4: 控制寄存器
- DR0, DR1, DR2, DR3, DR6, DR7: 调试寄存器
测试寄存器 (Test Registers): TR6, TR7，主要用于处理器内部测试。
浮点寄存器 (Floating-Point Registers): ST0 到 ST7，主要用于浮点运算。
多媒体扩展寄存器 (Multimedia Extension Registers): MM0 到 MM7，主要用于多媒体和SIMD（单指令多数据）操作。

4. 进阶指令

4.1 Label和Jump：跳转

一段代码可以拥有label，Jump NAME 即可跳转至label位置
比如

MAIN：MOV X,AX
JUMP DONE
MOV AX,Y
...
DONE:
	MOV AH, 4CH
	INT 21

在这段程序中，MOV AX,Y就会直接被跳过

4.2 分支和循环

4.2.1 分支 CMP-JGE/…

BeLike:(求abs(AX)保存在AX中)

MAIN:
...
CMP AX,0
JGE DONE; Jump if Greater or Equal
NEG AX
DONE:
...
END MAIN

4.2.2 循环 LOOP

一种简单的循环，类似于for(cx;;cx--)。（事实上，你可以用JUMP和分支结构来实现循环）

LOOP NM过程中：
0. CMP CX,0
1. 如果CX>0，继续执行以下语句，否则跳出
2. DEC CX(CX>0)
3. JUMP NM

1
2
3

MOV CX,6
NM: ...
LOOP NM;这样写一共执行CX次（声明NM时执行1次，LOOP中执行CX-1次）

4.3 堆栈的使用

4.3.1 初始化

两个好用的方法

4.3.1.1 堆栈段中做定义

在堆栈段划分位置，保存栈顶位置
在程序段开始的时候把堆栈段的位置告诉堆栈寄存器SS，把栈顶的位置告诉指针寄存器SP

SSEG SEGMENT
      STACK DW  128 dup(?)
      TOP   DW LENGTH STACK ;划定范围
SSEG ENDS

CSEG SEGMENT
           ASSUME CS:CSEG,DS:DSEG,SS:SSEG
      MAIN:
           MOV    AX,DSEG
           MOV    DS,AX
           MOV    AX,SSEG
           MOV    SS,AX
           MOV    AX,TOP
           MOV    SP,AX                        ;栈顶地址载入

4.3.1.2 程序段中划空间

直接给SP赋值

SSEG SEGMENT
SSEG ENDS
;ss:0000-ss:1000
CSEG SEGMENT
            ASSUME CS:CSEG, DS:DSEG,SS:SSEG
      BEGIN:MOV    AX,DSEG
            MOV    DS,AX
            MOV    AX,SSEG
            MOV    SS,AX
            MOV    SP,1000H                      ;手动规定了1000H的空置空间(OFFSET 0H-1000H)

4.3.2 PUSH和POP

注意：只能操作寄存器，不能直接操作内存单元
PUSH AX：将AX的值入栈（如果AX两个字节，就会入栈两个字节，SP也相应-2）
POP AX：出栈，内容保存在AX（如果AX两个字节，就会入栈两个字节，SP也相应+2）

4.3.3 用SP和BP操作堆栈

在主程序只是暂存数据用的话，一般不用操作指针
但是，由于PROC需要使用到堆栈段，所以这是操作指针就是必要的，接下来在PROC中解释

4.4 函数：PROC和MACRO

PROC&CALL（子程序结构）

4.4.1 定义 PROC-RET-ENDP

(Near 属性是默认值)

MAIN:
CALL NM

NM PROC
...
RET
NM ENDP
...
END MAIN

完整的表达式：
调用：CALL FAR/NEAR PTR NM
定义：NM PROC FAR/NEAR

4.4.2 子程序属性和调用

4.4.2.1 段内调用

只需要Main（主Label调用）的话空置即可（默认Near）

A:...
	CALL B;调用B
	
	PROC B:...;默认为near属性子程序
	RET
	B ENDP
...
END A

4.4.2.2 段间调用

PROC A:CALL FAR PTR B
RET
ENDP

PROC B FAR:...;写明属性
RET ENDP

4.4.3 注意堆栈

PROC的本质是：入栈程序出口指针，RET时从回到出口指针的位置
所以：

第一个出栈元素会是一个偏移地址
如果最后SP的指针位置不对，就无法正确RET

简单的方法：用寄存器BP保护SP，使用BP进行数据的读取

eg: x+y子程序化
…

在堆栈段push任意两个长度为1word的数据

使用子程序，将这两个数据的和存储于AX

SUM PROC ;取两个栈顶元素求和储存到AX中
         MOV    BP,SP
         MOV    AX,[BP+2]
         ADD    AX,[BP+4]
         RET
SUM ENDP

4.4.4 Macro（宏定义）

PROC的使用有调用开销（程序的中断跳转继续），而MACRO没有
MACRO相当于写代码的人把重复写代码的过程交给了汇编器，相比子程序来说，是通过多占程序的内存来提高运行速度（对机器来说，每调用一次Macro，就是把这段指令重复了一次）

NM MACRO R1,R2...(参数)
...
END M

NM MACRO AX,BX...(寄存器取值)

4.5 INT 21H指令：输入/输出

4.5.1 键盘输入

4.5.1.1 1号指令：单个字符输入

1 2	MOV AH,1 INT 21H

(内容会保存在AL)

4.5.1.2 10号指令：从键盘输入字符串

内存里需要划分三个部分：
1.一个字节存放最大长度（你写，溢出会被裁掉）
2.一个字节存放实际长度（指令运行完CPU会写）
3.一些字节用来存字符串

DATA SEGMENT
    MAXLENGTH    DB 100           ;一个字节，用它存最大的长度
    ACTUALLENGTH DB ?             ;一个字节，用它存实际的长度，在指令执行后会被填写
    STRING       DB 100 DUP(?)    ;用来存字符串
DATA ENDS

STACK SEGMENT
STACK ENDS

CODE SEGMENT
         ASSUME DS:DATA,SS:STACK,CS:CODE
    MAIN:
         MOV    AX,DATA
         MOV    DS,AX
         MOV    DX,OFFSET MAXLENGTH         ;把需要用到的内存块（三个部分）的地址存入DX

         MOV    AH,10
         INT    21H

         MOV    AH,4CH
         INT    21H
CODE ENDS
END MAIN

4.5.2 显示器输出

4.5.2.1 2号调用：单个字符输出

1
2
3

MOV DL,'A'
MOV AH,2
INT 21H

4.5.2.2 9号调用：字符串输出

你的字符串必须要以’$‘结尾！不然输出不会结束！（类似于’\0’，’$‘是一种字符串的终止符）
程序会将DS:DX地址开始输出字符到’$‘结尾

1
2
3

MOV DX,OFFSET STRING
MOV AH,9
INT 21H