《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 解決方案 > 計算機系統(tǒng)原理(七) 整數(shù)的表示方式精解:無符號與補碼編碼

計算機系統(tǒng)原理(七) 整數(shù)的表示方式精解:無符號與補碼編碼

2017-06-22
關(guān)鍵詞: 匯編語言

上一章我們簡單的介紹了布爾代數(shù)以及C語言的位運算,本次我們主要來看,二進制如何表示整數(shù),這是很重要的一章,希望各位猿友莫要錯過。

C語言中的整數(shù)類型及范圍

我們依然以C語言為例,C語言當中提供了多種整數(shù)類型,一共十種,位數(shù)為1、2、4、8,其中32位機器上,4位的有兩種,在64位機器上,8位的有兩種。不過C語言有它的最小數(shù)值范圍,也就是說C語言要求這些數(shù)據(jù)類型至少要滿足一個標準的范圍。下圖是C語言對整數(shù)類型要求的最小表示范圍。

仔細看的話,可以發(fā)現(xiàn),C語言只要求有符號數(shù)的范圍是對稱的,另外就是int和long類型的位數(shù)要求都比較低,分別是2位和4位。

可以看到以上的表中,每一種整數(shù)類型都可以加unsigned關(guān)鍵字,來表示一個無符號數(shù),即沒有正負之分。在書中,給出了無符號數(shù)的定義,LZ將它簡化一下,對于一個w位的二進制來說,它的無符號表示為以下形式。

對于一個無符號編碼來說,它的最大值和最小值很好確定,對于一個w位的二進制序列來說,當所有位都為0時,則為最小值,即

                               UMinw = 0

而當所有位都為1時,則為最大值,根據(jù)等比數(shù)列的求和公式,即

                               UMaxw = 1 * (1-2w) / 1 - 2 = 2w - 1

如果把上述的定義看成是一個函數(shù)的話,那么這個函數(shù)就是一個雙射。也就是說,對于任意整數(shù)x,當0 =< x < 2w的時候,存在唯一的二進制序列與其對應(yīng)。反過來也是一樣的,對于任意一個w位的二進制序列,都存在唯一一個整數(shù)x滿足0 =< x < 2w,與這個二進制序列對應(yīng)。

無符號編碼屬于相對較簡單的格式,因為它符合我們的慣性思維,上述定義其實就是對二進制轉(zhuǎn)化為十進制的公式而已,只不過在一向嚴格的數(shù)學領(lǐng)域來說,是要給予明確的含義的。

補碼編碼

無符號編碼符合人的慣性思維是沒錯,但是可惜的是,它無法表示負整數(shù)。因此我們需要一種能夠表示負數(shù)的整數(shù)表示方式,這就是補碼編碼。與無符號編碼一樣,書中依然給出了補碼編碼的定義,即對于任意一個w位的二進制來說,它的補碼表示為以下形式。

這里最高位xw-1為符號位,當它為1時,該公式得到的值為負數(shù),當為0時,得到的則為正數(shù)。

我們觀察這個公式,不難看出,補碼格式下,對于一個w位的二進制序列來說,當最高位為1,其余位全為0時,得到的就是補碼格式的最小值,即

                            TMinw = -2w-1

而當最高位為0,其余位全為1時,得到的就是補碼格式的最大值,根據(jù)等比數(shù)列的求和公式,即

                            TMaxw = 1 * (1 - 2w-1) / 1 - 2 = 2w-1-1

與無符號編碼一樣,如果把上述的定義看成是一個函數(shù)的話,那么這個函數(shù)同樣是一個雙射。也就是說,對于任意整數(shù)x,當-2w-1 =< x < 2w-1的時候,存在唯一的二進制序列與其對應(yīng)。反過來,對于任意一個w位的二進制序列,都存在唯一一個整數(shù)x滿足-2w-1 =< x < 2w-1,與這個二進制序列對應(yīng)。

相對于無符號編碼來說,補碼編碼與我們的慣性思維有些不同,因此直觀的理解起來會有些別扭,不過作為一個程序猿,我們應(yīng)該有一顆半機器的腦子,盡量去適應(yīng)機器的習慣。

兩種編碼的轉(zhuǎn)換

在C語言當中,我們經(jīng)常會使用強制類型轉(zhuǎn)換,而在之前的章節(jié)中,LZ也提到過強制類型轉(zhuǎn)換。強制類型轉(zhuǎn)換不會改變二進制序列,但是會改變數(shù)據(jù)類型的大小以及解釋方式,那么考慮相同整數(shù)類型的無符號編碼和補碼編碼,數(shù)據(jù)類型的大小是沒有任何變化的,變化的就是它們的解釋方式。比如1000這個二進制序列,如果用無符號編碼解釋的話就是表示8,而若采用補碼編碼解釋的話,則是表示-8。

考慮到上面我們已經(jīng)說過,無論是無符號編碼還是補碼編碼,其映射方式都是雙射,因此它們都一定存在逆映射。如果我們定義U2Bw(x)為B2Uw(x)的逆映射,則對于任意一個整數(shù)x,如果0 =< x < 2w,經(jīng)過U2Bw(x)的計算之后,將得到唯一一個二進制序列。同樣的,如果我們定義T2Bw(x)為B2Tw(x)的逆映射,則對于任意一個整數(shù)x,如果-2w-1 =< x < 2w-1,經(jīng)過T2Bw(x)的計算之后,也將得到唯一一個二進制序列。

可以很明顯的看出,對于0到2w-1-1這個區(qū)間內(nèi)的整數(shù)來說,兩種編碼得到的二進制序列是一樣的。為了得到其它區(qū)間里的整數(shù)的映射關(guān)系,我們定義

                     T2Uw(x) = B2Uw(T2Bw(x))

這個函數(shù)代表的含義是補碼編碼轉(zhuǎn)換為無符號編碼的時候,先將補碼編碼轉(zhuǎn)換為二進制序列,再將二進制序列轉(zhuǎn)換為無符號編碼,最終也就是補碼編碼轉(zhuǎn)為無符號編碼的計算。

下面我們簡單的推算一下上面的定義,究竟是如何轉(zhuǎn)換的,也就是無符號編碼與補碼編碼的關(guān)系。我們將上面無符號編碼和補碼編碼的公式相減,

即                              B2Uw(x) - B2Tw(x) = xw-12w-1 - (-xw-12w-1) = xw-12w

即                                           B2Uw(x) = xw-12w + B2Tw(x)

此處我們令x為T2Bw(x),則          B2Uw(T2Bw(x)) = xw-12w + B2Tw(T2Bw(x)) = xw-12w + x

即                                            T2Uw(x) = xw-12w + x

此時考慮xw-1的情況,當xw-1為1時,也就是補碼編碼表示負數(shù)的時候,T2Uw(x)則為2w + x 。(LZ小提示:此時x為負數(shù),也就是說2w + x < 2w)

若xw-1為0時,則補碼編碼為正數(shù),此時T2Uw(x) = x 。

綜上可知,有下列式子成立

從這個式子中可以很明顯的看出,最終得到的無符號數(shù)范圍為0 =< x < 2w。

相反,我們用同樣的方式也可以證明從無符號編碼到補碼編碼的公式,這一部分書中省略了,LZ這里還是寫上來,以免有的猿友不知所云。我們依然將無符號編碼和補碼編碼的公式相減

即                              B2Uw(u) - B2Tw(u) = uw-12w-1 - (-uw-12w-1) = uw-12w

即                                           B2Tw(u) = B2Uw(u) - uw-12w

此時我們令u為U2Bw(u),則    B2Tw(U2Bw(u)) = B2Uw(U2Bw(u)) - uw-12w = u - uw-12w

即                                           U2Tw(u) = u - uw-12w

此時考慮uw-1的情況,當uw-1為0時,也就是無符號編碼數(shù)值小于2w-1的時候,U2Tw(u)則為u 。

若uw-1為1時,也就是無符號編碼數(shù)值大于或等于2w-1的時候,此時U2Tw(u)= u - 2w。(LZ小提示:此時U2Tw(u)為負數(shù),因為 u < 2w)

綜上,我們可以得到無符號編碼轉(zhuǎn)換為補碼編碼的公式

同樣的,在0至2w-1-1之間,兩者依然是相等的,而其余區(qū)間則不同。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:[email protected]