国产精品亚洲欧美大片在线看 ,亚洲精品午夜在线

簡明x86匯編語言教程（四）

日期： 2017-06-10

關(guān)鍵詞： 匯編

第三章操作內(nèi)存

在前面的章節(jié)中，我們已經(jīng)了解了寄存器的基本使用方法,。而正如結(jié)尾提到的那樣,，僅僅使用寄存器做一點(diǎn)運(yùn)算是沒有什么太大意義的，畢竟它們不能保存太多的數(shù)據(jù),，因此,，對編程人員而言，他肯定迫切地希望訪問內(nèi)存,，以保存更多的數(shù)據(jù),。

我將分別介紹如何在保護(hù)模式和實(shí)模式操作內(nèi)存，然而在此之前,，我們先熟悉一下這兩種模式中內(nèi)存的結(jié)構(gòu),。

3.1 實(shí)模式

事實(shí)上,，在實(shí)模式中，內(nèi)存比保護(hù)模式中的結(jié)構(gòu)更令人困惑,。內(nèi)存被分割成段,，并且，操作內(nèi)存時,，需要指定段和偏移量,。不過，理解這些概念是非常容易的事情,。請看下面的圖：

段-寄存器這種格局是早期硬件電路限制留下的一個傷疤,。地址總線在當(dāng)時有20-bit。

然而20-bit的地址不能放到16-bit的寄存器里,，這意味著有4-bit必須放到別的地方,。因此，為了訪問所有的內(nèi)存,，必須使用兩個16-bit寄存器,。

這一設(shè)計上的折衷方案導(dǎo)致了今天的段-偏移量格局。最初的設(shè)計中,，其中一個寄存器只有4-bit有效,，然而為了簡化程序，兩個寄存器都是16-bit有效,，并在執(zhí)行時求出加權(quán)和來標(biāo)識20-bit地址,。

偏移量是16-bit的，因此,，一個段是64KB,。下面的圖可以幫助你理解20-bit地址是如何形成的：

段-偏移量標(biāo)識的地址通常記做段:偏移量的形式。

由于這樣的結(jié)構(gòu),，一個內(nèi)存有多個對應(yīng)的地址,。例如，0000:0010和0001:0000指的是同一內(nèi)存地址,。又如,，

0000:1234 = 0123:0004 = 0120:0034 = 0100:0234
0001:1234 = 0124:0004 = 0120:0044 = 0100:0244

作為負(fù)面影響之一，在段上加1相當(dāng)于在偏移量上加16,，而不是一個“全新”的段,。反之，在偏移量上加16也和在段上加1等價,。某些時候,，據(jù)此認(rèn)為段的“粒度”是16字節(jié)。

練習(xí)題
嘗試一下將下面的地址轉(zhuǎn)化為20bit的地址：

2EA8:D678 26CF:8D5F 453A:CFAD 2933:31A6 5924:DCCF
694E:175A 2B3C:D218 728F:6578 68E1:A7DC 57EC:AEEA

稍高一些的要求是，寫一個程序?qū)⒍螢锳X,、偏移量為BX的地址轉(zhuǎn)換為20bit的地址,，并保存于EAX中。

[上面習(xí)題的答案]

我們現(xiàn)在可以寫一個真正的程序了,。

經(jīng)典程序：Hello, world

;;; 應(yīng)該得到一個29字節(jié)的.com文件
.MODEL TINY
.CODE
CR equ 13
LF equ 10
TERMINATOR equ '$'
ORG 100h
Main PROC
mov dx,offset sMessage
mov ah,9
int 21h
mov ax,4c00h
int 21h
Main ENDP
sMessage:
　DB 'Hello, World!'
　DB CR,LF,TERMINATOR
END Main
; .COM文件的內(nèi)存模型是‘TINY’
; 代碼段開始
; 回車
; 換行
; DOS字符串結(jié)束符
; 代碼起始地址為CS:0100h
; 令DS:DX指向Message
; int 21h(DOS中斷)功能9 -
; 顯示字符串到標(biāo)準(zhǔn)輸出設(shè)備
; int 21h功能4ch -
; 終止程序并返回AL的錯誤代碼
　

; 程序結(jié)束的同時指定入口點(diǎn)為Main

那么,，我們需要解釋很多東西。

首先,，作為匯編語言的抽象,，C語言擁有“指針”這個數(shù)據(jù)類型。在匯編語言中,，幾乎所有對內(nèi)存的操作都是由對給定地址的內(nèi)存進(jìn)行訪問來完成的,。這樣，在匯編語言中,，絕大多數(shù)操作都要和指針產(chǎn)生或多或少的聯(lián)系,。

這里我想強(qiáng)調(diào)的是，由于這一特性,，匯編語言中同樣會出現(xiàn)C程序中常見的緩沖區(qū)溢出問題,。如果你正在設(shè)計一個與安全有關(guān)的系統(tǒng)，那么最好是仔細(xì)檢查你用到的每一個串,，例如,，它們是否一定能夠以你預(yù)期的方式結(jié)束，以及（如果使用的話）你的緩沖區(qū)是否能保證實(shí)際可能輸入的數(shù)據(jù)不被寫入到它以外的地方,。作為一個匯編語言程序員,，你有義務(wù)檢查每一行代碼的可用性。

程序中的equ偽指令是宏匯編特有的,，它的意思接近于C或Pascal中的const（常量）,。多數(shù)情況下，equ偽指令并不為符號分配空間,。

此外,，匯編程序執(zhí)行一項操作是非常繁瑣的，通常,，在對與效率要求不高的地方，我們習(xí)慣使用系統(tǒng)提供的中斷服務(wù)來完成任務(wù),。例如本例中的中斷21h,，它是DOS時代的中斷服務(wù)，在Windows中,，它也被認(rèn)為是Windows API的一部分（這一點(diǎn)可以在Microsoft的文檔中查到）,。中斷可以被理解為高級語言中的子程序，但又不完全一樣——中斷使用系統(tǒng)棧來保存當(dāng)前的機(jī)器狀態(tài)，可以由硬件發(fā)起,，通過修改機(jī)器狀態(tài)字來反饋信息,，等等。

那么,，最后一段通過DB存放的數(shù)據(jù)到底保存在哪里了呢,？答案是緊挨著代碼存放。在匯編語言中,，DB和普通的指令的地位是相同的,。如果你的匯編程序并不知道新的助記符（例如，新的處理器上的CPUID指令）,，而你很清楚,，那么可以用DB 機(jī)器碼的方式強(qiáng)行寫下指令。這意味著,，你可以超越匯編器的能力撰寫匯編程序,，然而，直接用機(jī)器碼編程是幾乎肯定是一件費(fèi)力不討好的事——匯編器廠商會經(jīng)常更新它所支持的指令集以適應(yīng)市場需要,，而且,，你可以期待你的匯編其能夠產(chǎn)生正確的代碼，因?yàn)闄C(jī)器查表是不會出錯的,。既然機(jī)器能夠幫我們做將程序轉(zhuǎn)換為代碼這件事情,，那么為什么不讓它來做呢？

細(xì)心的讀者不難發(fā)現(xiàn),，在程序中我們沒有對DS進(jìn)行賦值,。那么，這是否意味著程序的結(jié)果將是不可預(yù)測的呢,？答案是否定的,。DOS（或Windows中的MS-DOS VM）在加載.com文件的時候，會對寄存器進(jìn)行很多初始化,。.com文件被限制為小于64KB,，這樣，它的代碼段,、數(shù)據(jù)段都被裝入同樣的數(shù)值（即,，初始狀態(tài)下DS=CS）。

也許會有人說,，“嘿,，這聽起來不太好，一個64KB的程序能做得了什么呢,？還有,，你吹得天花亂墜的堆棧段在什么地方？”那么，我們來看看下面這個新的Hello world程序,，它是一個EXE文件,，在DOS實(shí)模式下運(yùn)行。

;;; 應(yīng)該得到一個561 字節(jié)的EXE文件
.MODEL SMALL
.STACK 200h
CR equ 13
LF equ 10
TERMINATOR equ '$'
.DATA
Message DB 'Hello, World !'
　DB CR,LF,TERMINATOR
.CODE
Main PROC
mov ax, DGROUP
mov ds, ax
mov dx, offset Message
mov ah, 9
int 21h
mov ax, 4c00h
int 21h
Main ENDP
END main 　

; 采用“SMALL”內(nèi)存模型
; 堆棧段

; 回車
; 換行
; DOS字符串結(jié)束符

; 定義數(shù)據(jù)段

; 定義顯示串

; 定義代碼段

; 將數(shù)據(jù)段
; 加載到DS寄存器

; 設(shè)置DX
; 顯示

; 終止程序

561字節(jié),？實(shí)現(xiàn)相同功能的程序大了這么多,！為什么呢？我們看到,，程序擁有了完整的堆棧段,、數(shù)據(jù)段、代碼段,，其中堆棧段足足占掉了512字節(jié),，其余的基本上沒什么變化。

分成多個段有什么好處呢,？首先,，它讓程序顯得更加清晰——你肯定更愿意看一個結(jié)構(gòu)清楚的程序，代碼中hard-coded的字符串,、數(shù)據(jù)讓人覺得費(fèi)解,。比如，mov dx, 0152h肯定不如mov dx, offset Message來的親切,。此外,，通過分段你可以使用更多的內(nèi)存，比如,，代碼段騰出的空間可以做更多的事情,。exe文件另一個吸引人的地方是它能夠?qū)崿F(xiàn)“重定位”。現(xiàn)在你不需要指定程序入口點(diǎn)的地址了,，因?yàn)橄到y(tǒng)會找到你的程序入口點(diǎn),，而不是死板的100h。

程序中的符號也會在系統(tǒng)加載的時候重新賦予新的地址,。exe程序能夠保證你的設(shè)計容易地被實(shí)現(xiàn),，不需要考慮太多的細(xì)節(jié)。

當(dāng)然,，我們的主要目的是將匯編語言作為高級語言的一個有用的補(bǔ)充,。如我在開始提到的那樣，真正完全用匯編語言實(shí)現(xiàn)的程序不一定就好,，因?yàn)樗槐阌诰S護(hù),，而且，由于結(jié)構(gòu)的原因,，你也不太容易確保它是正確的,；匯編語言是一種非結(jié)構(gòu)化的語言，調(diào)試一個精心設(shè)計的匯編語言程序,，即使對于一個老手來說也不啻是一場惡夢,，因?yàn)槟愫芸赡艿舻絼e人預(yù)設(shè)的“陷阱”中——這些技巧確實(shí)提高了代碼性能，然而你很可能不理解它,，于是你把它改掉,，接著就發(fā)現(xiàn)程序徹底敗掉了。使用匯編語言加強(qiáng)高級語言程序時,，你要做的通常只是使用匯編指令,，而不必搭建完整的匯編程序。絕大多數(shù)（也是目前我遇到的全部）C/C++編譯器都支持內(nèi)嵌匯編,，即在程序中使用匯編語言,，而不必撰寫單獨(dú)的匯編語言程序——這可以節(jié)省你的不少精力，因?yàn)榍懊嬷v述的那些偽指令,，如equ等,，都可以用你熟悉的高級語言方式來編寫，編譯器會把它轉(zhuǎn)換為適當(dāng)?shù)男问健?/p>

需要說明的是,，在高級語言中一定要注意編譯結(jié)果,。編譯器會對你的匯編程序做一些修改，這不一定符合你的要求（附帶說一句,，有時編譯器會很聰明地調(diào)整指令順序來提高性能,，這種情況下最好測試一下哪種寫法的效果更好），此時需要做一些更深入的修改,，或者用db來強(qiáng)制編碼,。

3.2 保護(hù)模式

實(shí)模式的東西說得太多了，盡管我已經(jīng)刪掉了許多東西,，并把一些原則性的問題拿到了這一節(jié)討論,。這樣做不是沒有理由的——保護(hù)模式才是現(xiàn)在的程序（除了操作系統(tǒng)的底層啟動代碼）最常用的CPU模式。保護(hù)模式提供了很多令人耳目一新的功能,，包括內(nèi)存保護(hù)（這是保護(hù)模式這個名字的來源）,、進(jìn)程支持、更大的內(nèi)存支持,，等等,。

對于一個編程人員來說，能“偷懶”是一件令人愉快的事情,。這里“偷懶”是說把“應(yīng)該”由系統(tǒng)做的事情做的事情全都交給系統(tǒng),。為什么呢？這出自一個基本思想——人總有犯錯誤的時候,，然而規(guī)則不會,，正確地了解規(guī)則之后,，你可以期待它像你所了解的那樣執(zhí)行。對于C程序來說,，你自己用C語言寫的實(shí)現(xiàn)相同功能的函數(shù)通常沒有系統(tǒng)提供的函數(shù)性能好（除非你用了比函數(shù)庫好很多的算法）,，因?yàn)橄到y(tǒng)的函數(shù)往往使用了更好的優(yōu)化，甚至可能不是用C語言直接編寫的,。

當(dāng)然,，“偷懶”的意思是說，把那些應(yīng)該讓機(jī)器做的事情交給計算機(jī)來做,，因?yàn)樗龅酶?。我們?yīng)該把精力集中到設(shè)計算法，而不是編寫源代碼本身上,，因?yàn)榫幾g器幾乎只能做等價優(yōu)化,，而實(shí)現(xiàn)相同功能，但使用更好算法的程序?qū)崿F(xiàn),，則幾乎只能由人自己完成,。

舉個例子，這樣一個函數(shù)：

int fun(){
　int a=0;
　register int i;
　for(i=0; i<1000; i++) a+=i;
　return a;
}

在某種編譯模式[DEBUG]下被編譯為

push ebp
mov ebp,esp
sub esp,48h
push ebx
push esi
push edi
lea edi,[ebp-48h]
mov ecx,12h
mov eax,0CCCCCCCCh
rep stos dword ptr [edi]
mov dword ptr [ebp-4],0
mov dword ptr [ebp-8],0
jmp fun+31h
mov eax,dword ptr [ebp-8]
add eax,1
mov dword ptr [ebp-8],eax
cmp dword ptr [ebp-8],3E8h
jge fun+45h
mov ecx,dword ptr [ebp-4]
add ecx,dword ptr [ebp-8]
mov dword ptr [ebp-4],ecx
jmp fun+28h
mov eax,dword ptr [ebp-4]
pop edi
pop esi
pop ebx
mov esp,ebp
pop ebp
ret ; 子程序入口

; 保護(hù)現(xiàn)場
; 初始化變量-調(diào)試版本特有,。
; 本質(zhì)是在堆中挖一塊地兒,，存CCCCCCCC。
; 用串操作進(jìn)行,，這將發(fā)揮Intel處理器優(yōu)勢
; ‘a(chǎn)=0’
; ‘i=0’

; 走著
; i++
; i<1000?
; a+=i;
; return a;

; 恢復(fù)現(xiàn)場

; 返回

而在另一種模式[RELEASE/MINSIZE]下卻被編譯為

xor eax,eax
xor ecx,ecx
add eax,ecx
inc ecx
cmp ecx,3E8h
jl fun+4
ret

; a=0;
; i=0;
; a+=i;
; i++;
; i<1000?
; 是->繼續(xù)繼續(xù)
; return a

如果讓我來寫,，多半會寫成

mov eax, 079f2ch
ret

; return 499500

為什么這樣寫呢？我們看到,，i是一個外界不能影響,、也無法獲知的內(nèi)部狀態(tài)量。作為這段程序來說,，對它的計算對于結(jié)果并沒有直接的影響——它的存在不過是方便算法描述而已,。并且我們看到的，這段程序?qū)嶋H上無論執(zhí)行多少次,，其結(jié)果都不會發(fā)生變化,，因此,，直接返回計算結(jié)果就可以了,，計算是多余的（如果說一定要算，那么應(yīng)該是編譯器在編譯過程中完成它）,。

更進(jìn)一步,，我們甚至希望編譯器能夠直接把這個函數(shù)變成一個符號常量，這樣連操作堆棧的過程也省掉了,。

第三種結(jié)果屬于“等效”代碼,，而不是“等價”代碼,。作為用戶，很多時候是希望編譯器這樣做的,，然而由于目前的技術(shù)尚不成熟,，有時這種做法會造成一些問題（gcc和g++的頂級優(yōu)化可以造成編譯出的FreeBSD內(nèi)核行為異常，這是我在FreeBSD上遇到的唯一一次軟件原因的kernel panic）,，因此，并不是所有的編譯器都這樣做（另一方面的原因是,，如果編譯器在這方面做的太過火,，例如自動求解全部“固定”問題，那么如果你的程序是解決固定的問題“很大”,，如求解迷宮,，那么在編譯過程中你就會找錘子來砸計算機(jī)了）。然而,，作為編譯器制造商,，為了提高自己的產(chǎn)品的競爭力，往往會使用第三種代碼來做函數(shù)庫,。正如前面所提到的那樣,，這種優(yōu)化往往不是編譯器本身的作用，盡管現(xiàn)代編譯程序擁有編譯執(zhí)行,、循環(huán)代碼外提,、無用代碼去除等諸多優(yōu)化功能，但它都不能保證程序最優(yōu),。最后一種代碼恐怕很少有編譯器能夠做到,，不信你可以用自己常用的編譯器加上各種優(yōu)化選項試試:)

發(fā)現(xiàn)什么了嗎？三種代碼中,，對于內(nèi)存的訪問一個比一個少,。這樣做的理由是，盡可能地利用寄存器并減少對內(nèi)存的訪問,，可以提高代碼性能,。在某些情況下，使代碼既小又快是可能的,。

書歸正傳,，我們來說說保護(hù)模式的內(nèi)存模型。保護(hù)模式的內(nèi)存和實(shí)模式有很多共同之處,。

毫無疑問,，以'protected mode'(保護(hù)模式), 'global descriptor table'(全局描述符表), 'local descriptor table'(本地描述符表)和'selector'(選擇器)搜索，你會得到完整介紹它們的大量信息,。

保護(hù)模式與實(shí)模式的內(nèi)存類似,，然而,，它們之間最大的區(qū)別就是保護(hù)模式的內(nèi)存是“線性”的。

新的計算機(jī)上,，32-bit的寄存器已經(jīng)不是什么新鮮事（如果你哪天聽說你的CPU的寄存器不是32-bit的，那么它——簡直可以肯定地說——的字長要比32-bit還要多,。新的個人機(jī)上已經(jīng)開始逐步采用64-bit的CPU了）,，換言之，實(shí)際上段/偏移量這一格局已經(jīng)不再需要了,。盡管如此,，在繼續(xù)看保護(hù)模式內(nèi)存結(jié)構(gòu)時，仍請記住段/偏移量的概念,。不妨把段寄存器看作對于保護(hù)模式中的選擇器的一個模擬,。選擇器是全局描述符表(Global Descriptor Table, GDT)或本地描述符表(Local Descriptor Table, LDT)的一個指針,。

如圖所示,，GDT和LDT的每一個項目都描述一塊內(nèi)存,。例如,，一個項目中包含了某塊被描述的內(nèi)存的物理的基地址、長度,，以及其他一些相關(guān)信息。

保護(hù)模式是一個非常重要的概念,，同時也是目前撰寫應(yīng)用程序時,，最常用的CPU模式（運(yùn)行在新的計算機(jī)上的操作系統(tǒng)很少有在實(shí)模式下運(yùn)行的）。

為什么叫保護(hù)模式呢,？它“保護(hù)”了什么,？答案是進(jìn)程的內(nèi)存,。保護(hù)模式的主要目的在于允許多個進(jìn)程同時運(yùn)行,，并保護(hù)它們的內(nèi)存不受其他進(jìn)程的侵犯。這有點(diǎn)類似于C++中的機(jī)制,，然而它的強(qiáng)制力要大得多,。如果你的進(jìn)程在保護(hù)模式下以不恰當(dāng)?shù)姆绞皆L問了內(nèi)存（例如,，寫了“只讀”內(nèi)存,，或讀了不可讀的內(nèi)存，等等）,，那么CPU就會產(chǎn)生一個異常,。這個異常將交給操作系統(tǒng)處理,，而這種處理，假如你的程序沒有特別說明操作系統(tǒng)該如何處理的話,，一般就是殺掉做錯了事情的進(jìn)程,。

我像這樣的對話框大家一定非常熟悉（臨時寫了一個程序故意造成的錯誤）：

好的，只是一個程序崩潰了,，而操作系統(tǒng)的其他進(jìn)程照常運(yùn)行（同樣的程序在DOS中幾乎是板上釘釘?shù)乃罊C(jī),，因?yàn)镹ULL指針的位置恰好是中斷向量表），你甚至還可以調(diào)試它,。

保護(hù)模式還有其他很多好處,，在此就不一一贅述了。實(shí)模式和保護(hù)模式之間的切換問題我打算放在后面的“高級技巧”一章來講,，因?yàn)槎鄶?shù)程序并不涉及這個。

了解了內(nèi)存的格局,，我們就可以進(jìn)入下一節(jié)——操作內(nèi)存了,。

3.3 操作內(nèi)存

前兩節(jié)中，我們介紹了實(shí)模式和保護(hù)模式中使用的不同的內(nèi)存格局?，F(xiàn)在開始解釋如何使用這些知識,。

回憶一下前面我們說過的，寄存器可以用作內(nèi)存指針?，F(xiàn)在,，是他們發(fā)揮作用的時候了,。

可以將內(nèi)存想象為一個順序的字節(jié)流,。使用指針，可以任意地操作（讀寫）內(nèi)存,。

現(xiàn)在我們需要一些其他的指令格式來描述對于內(nèi)存的操作,。操作內(nèi)存時，首先需要的就是它的地址,。

讓我們來看看下面的代碼：

mov ax,[0]

方括號表示,，里面的表達(dá)式指定的不是立即數(shù)，而是偏移量,。在實(shí)模式中,，DS:0中的那個字（16-bit長）將被裝入AX。

然而0是一個常數(shù),，如果需要在運(yùn)行的時候加以改變,，就需要一些特殊的技巧，比如程序自修改,。匯編支持這個特性,，然而我個人并不推薦這種方法——自修改大大降低程序的可讀性,，并且還降低穩(wěn)定性，性能還不一定好,。我們需要另外的技術(shù),。

mov bx,0
mov ax,[bx]

看起來舒服了一些，不是嗎,？BX寄存器的內(nèi)容可以隨時更改,，而不需要用冗長的代碼去修改自身，更不用擔(dān)心由此帶來的不穩(wěn)定問題,。

同樣的,，mov指令也可以把數(shù)據(jù)保存到內(nèi)存中：

mov [0],ax

在存儲器與寄存器之間交換數(shù)據(jù)應(yīng)該足夠清楚了。

有些時候我們會需要操作符來描述內(nèi)存數(shù)據(jù)的寬度：

操作符意義

byte ptr 一個字節(jié)(8-bit, 1 byte)

word ptr 一個字(16-bit)

dword ptr 一個雙字(32-bit)

例如,，在DS:100h處保存1234h,，以字存放：

mov word ptr [100h],01234h

于是我們將mov指令擴(kuò)展為：

mov reg(8,16,32), mem(8,16,32)
mov mem(8,16,32), reg(8,16,32)
mov mem(8,16,32), imm(8,16,32)

需要說明的是，加減同樣也可以在[]中使用,，例如：

mov ax,[bx+10]
mov ax,[bx+si]
mov ax,es:[di+bp]

等等,。我們看到，對于內(nèi)存的操作,，即使使用MOV指令,，也有許多種可能的方式。下一節(jié)中,，我們將介紹如何操作串,。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息,，并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施,，避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話：010-82306118；郵箱：[email protected],。

簡明x86匯編語言教程（四）

日期： 2017-06-10

相關(guān)內(nèi)容