Big-Endian Little-Endian
大端模式Big-Endian就是高位字節排放在內存的低地址端,低位字節排放在內存的高地址端。
小端模式Little-Endian就是低位字節排放在內存的低地址端,高位字節排放在內存的高地址端。
?
小端模式 :強制轉換數據不需要調整字節內容。
大端模式 :符號位的判定固定為第一個字節,容易判斷正負。
采用大端方式進行數據存放符合人類的正常思維,而采用小端方式進行數據存放利于計算機處理。
?
例:32bit寬的數0x12345678在Little-endian模式以及Big-endian模式在內存中的存放方式為(假設從地址0x4000開始存放):
| 內存地址 | Little-Endian | Big-Endian |
| 0x4000 | 0x78 | 0x12 |
| 0x4001 | 0x56 | 0x34 |
| 0x4002 | 0x34 | 0x56 |
| 0x4003 | 0x12 | 0x78 |
一般操作系統都是小端,而通訊協議是大端的。
常見CPU的字節序:
Big Endian : PowerPC、IBM、Sun
Little Endian : x86、DEC
ARM既可以工作在大端模式,也可以工作在小端模式。
常見文件的字節序:
Adobe PS – Big Endian
BMP – Little Endian
DXF(AutoCAD) – Variable
GIF – Little Endian
JPEG – Big Endian
MacPaint – Big Endian
RTF – Little Endian
另外,Java和所有的網絡通訊協議都是使用Big-Endian的編碼。
?
判斷字節序的小程序
BOOL IsBigEndian() {int a = 0x1234;char b = *(char *)&a; //通過將int強制類型轉換成char單字節,通過判斷起始存儲位置。即等于 取b等于a的低地址部分if( b == 0x12){return TRUE;}return FALSE; }<span style="font-family: Arial, Verdana, sans-serif; white-space: normal; background-color: rgb(255, 255, 255); ">?</span>聯合體union的存放順序是所有成員都從低地址開始存放,利用該特性可以輕松地獲得了CPU對內存采用Little-endian還是Big-endian模式讀寫:
BOOL IsBigEndian() {union NUM{int a;char b;}num;num.a = 0x1234;if( num.b == 0x12 ){return TRUE;}return FALSE; }?
從軟件的角度理解端模式
進行網絡數據傳遞時,必須要考慮端模式的轉換。x86的CPU使用的是LE(Windows中稱為“主機字節序”),而SocksAddr中使用的則是BE(就是“網絡字節序”),所以在使用網絡編程時需要使用htns,htnl,nths,nthl來倒字節序。
#define ntohs(n) //16位數據類型網絡字節順序到主機字節順序的轉換 #define htons(n) //16位數據類型主機字節順序到網絡字節順序的轉換 #define ntohl(n) //32位數據類型網絡字節順序到主機字節順序的轉換 #define htonl(n) //32位數據類型主機字節順序到網絡字節順序的轉換其中互聯網使用的網絡字節順序采用大端模式進行編址,而主機字節順序根據處理器的不同而不同,如PowerPC處理器使用大端模式,而Pentuim處理器使用小端模式。
? ? ? ?大端模式處理器的字節序到網絡字節序不需要轉換,此時ntohs(n)=n,ntohl = n;而小端模式處理器的字節序到網絡字節必須要進行轉換,此時ntohs(n) = __swab16(n),ntohl = __swab32(n)。__swab16與__swab32函數定義如下所示。
PowerPC處理器提供了lwbrx,lhbrx,stwbrx,sthbrx四條指令用于處理字節序的轉換以優化__swab16和__swap32這類函數。此外PowerPC處理器中的rlwimi指令也可以用來實現__swab16和__swap32這類函數。
? ? ? 在對普通文件進行處理也需要考慮端模式問題。在大端模式的處理器下對文件的32,16位讀寫操作所得到的結果與小端模式的處理器不同。單純從軟件的角度理解上遠遠不能真正理解大小端模式的區別。事實上,真正的理解大小端模式的區別,必須要從系統的角度,從指令集,寄存器和數據總線上深入理解,大小端模式的區別。
?
從系統的角度理解端模式
MSB:MoST Significant Bit ------- 最高有效位
LSB:Least Significant Bit ------- 最低有效位
? ? ? 處理器在硬件上由于端模式問題在設計中有所不同。從系統的角度上看,端模式問題對軟件和硬件的設計帶來了不同的影響,當一個處理器系統中大小端模式同時存在時,必須要對這些不同端模式的訪問進行特殊的處理。
? ? ? PowerPC處理器主導網絡市場,可以說絕大多數的通信設備都使用PowerPC處理器進行協議處理和其他控制信息的處理,這也可能也是在網絡上的絕大多數協議都采用大端編址方式的原因。因此在有關網絡協議的軟件設計中,使用小端方式的處理器需要在軟件中處理端模式的轉變。而Pentium主導個人機市場,因此多數用于個人機的外設都采用小端模式,包括一些在網絡設備中使用的PCI總線,Flash等設備,這也要求在硬件設計中注意端模式的轉換。
? ? ? 本文提到的小端外設是指這種外設中的寄存器以小端方式進行存儲,如PCI設備的配置空間,NOR FLASH中的寄存器等等。對于有些設備,如DDR顆粒,沒有以小端方式存儲的寄存器,因此從邏輯上講并不需要對端模式進行轉換。在設計中,只需要將雙方數據總線進行一一對應的互連,而不需要進行數據總線的轉換。
? ? ? 如果從實際應用的角度說,采用小端模式的處理器需要在軟件中處理端模式的轉換,因為采用小端模式的處理器在與小端外設互連時,不需要任何轉換。而采用大端模式的處理器需要在硬件設計時處理端模式的轉換。大端模式處理器需要在寄存器,指令集,數據總線及數據總線與小端外設的連接等等多個方面進行處理,以解決與小端外設連接時的端模式轉換問題。在寄存器和數據總線的位序定義上,基于大小端模式的處理器有所不同。
? ? ? 一個采用大端模式的32位處理器,如基于E500內核的MPC8541,將其寄存器的最高位msb(most significant bit)定義為0,最低位lsb(lease significant bit)定義為31;而小端模式的32位處理器,將其寄存器的最高位定義為31,低位地址定義為0。與此向對應,采用大端模式的32位處理器數據總線的最高位為0,最高位為31;采用小端模式的32位處理器的數據總線的最高位為31,最低位為0。? ? ? ? ?
? ? ? 大小端模式處理器外部總線的位序也遵循著同樣的規律,根據所采用的數據總線是32位,16位和8位,大小端處理器外部總線的位序有所不同。大端模式下32位數據總線的msb是第0位,MSB是數據總線的第0~7的字段;而lsb是第31位,LSB是第24~31字段。小端模式下32位總線的msb是第31位,MSB是數據總線的第31~24位,lsb是第0位,LSB是7~0字段。大端模式下16位數據總線的msb是第0位,MSB是數據總線的第0~7的字段;而lsb是第15位,LSB是第8~15字段。小端模式下16位總線的msb是第15位,MSB是數據總線的第15~7位,lsb是第0位,LSB是7~0字段。大端模式下8位數據總線的msb是第0位,MSB是數據總線的第0~7的字段;而lsb是第7位,LSB是第0~7字段。小端模式下8位總線的msb是第7位,MSB是數據總線的第7~0位,lsb是第0位,LSB是7~0字段。
? ? ? 由上分析,我們可以得知對于8位,16位和32位寬度的數據總線,采用大端模式時數據總線的msb和MSB的位置都不會發生變化,而采用小端模式時數據總線的lsb和LSB位置也不會發生變化。
? ? ? 為此,大端模式的處理器對8位,16位和32位的內存訪問(包括外設的訪問)一般都包含第0~7字段,即MSB。小端模式的處理器對8位,16位和32位的內存訪問都包含第7~0位,小端方式的第7~0字段,即LSB。由于大小端處理器的數據總線其8位,16位和32位寬度的數據總線的定義不同,因此需要分別進行討論在系統級別上如何處理端模式轉換。在一個大端處理器系統中,需要處理大端處理器對小端外設的訪問。
總結
以上是生活随笔為你收集整理的Big-Endian Little-Endian的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Markdown数学公式语法、常用符号与
- 下一篇: 浅谈网络安全态势感知