1. 程式人生 > >htons函式詳解

htons函式詳解

Part 1: htons函式具體解釋
     在Linux和Windows網路程式設計時需要用到htons和htonl函式,用來將主機位元組順序轉換為網路位元組順序。

     在Intel機器下,執行以下程式

int main()
...{
   printf("%d /n",htons(16));
      return 0;
}
得到的結果是4096,初一看感覺很怪。

    解釋如下,數字16的16進製表示為0x0010,數字4096的16進製表示為0x1000。 由於Intel機器是小尾端,儲存數字16時實際順序為1000,儲存4096時實際順序為0010。因此在傳送網路包時為了報文中資料為0010,需要經過htons進行位元組轉換。如果用IBM等大尾端機器,則沒有這種位元組順序轉換,但為了程式的可移植性,也最好用這個函式。

   另外用注意,數字所佔位數小於或等於一個位元組(8 bits)時,不要用htons轉換。這是因為對於主機來說,大小尾端的最小單位為位元組(byte)。

Part 2: 大小端模式


不同的CPU有不同的位元組序型別 這些位元組序是指整數在記憶體中儲存的順序 這個叫做主機序 
最常見的有兩種
1. Little endian:將低序位元組儲存在起始地址
2. Big endian:將高序位元組儲存在起始地址

LE little-endian 
最符合人的思維的位元組序 
地址低位儲存值的低位 
地址高位儲存值的高位 
怎麼講是最符合人的思維的位元組序,是因為從人的第一觀感來說 
低位值小,就應該放在記憶體地址小的地方,也即記憶體地址低位 
反之,高位值就應該放在記憶體地址大的地方,也即記憶體地址高位

BE big-endian 
最直觀的位元組序 
地址低位儲存值的高位 
地址高位儲存值的低位 
為什麼說直觀,不要考慮對應關係 
只需要把記憶體地址從左到右按照由低到高的順序寫出 
把值按照通常的高位到低位的順序寫出 
兩者對照,一個位元組一個位元組的填充進去

例子:在記憶體中雙字0x01020304(DWORD)的儲存方式

記憶體地址 
4000 4001 4002 4003 
LE 04 03 02 01 
BE 01 02 03 04

例子:如果我們將0x1234abcd寫入到以0x0000開始的記憶體中,則結果為
      big-endian  little-endian
0x0000  0x12      0xcd
0x0001  0x23      0xab
0x0002  0xab      0x34
0x0003  0xcd      0x12
x86系列CPU都是little-endian的位元組序.

網路位元組順序是TCP/IP中規定好的一種資料表示格式,它與具體的CPU型別、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋。網路位元組順序採用big endian排序方式。

為了進行轉換 bsd socket提供了轉換的函式 有下面四個
htons 把unsigned short型別從主機序轉換到網路序
htonl 把unsigned long型別從主機序轉換到網路序
ntohs 把unsigned short型別從網路序轉換到主機序
ntohl 把unsigned long型別從網路序轉換到主機序

在使用little endian的系統中 這些函式會把位元組序進行轉換 
在使用big endian型別的系統中 這些函式會定義成空巨集

同樣 在網路程式開發時 或是跨平臺開發時 也應該注意保證只用一種位元組序 不然兩方的解釋不一樣就會產生bug.

注:
1、網路與主機位元組轉換函式:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的CPU上執行不同的作業系統,位元組序也是不同的,參見下表。
處理器    作業系統    位元組排序
Alpha    全部    Little endian
HP-PA    NT    Little endian
HP-PA    UNIX    Big endian
Intelx86    全部    Little endian <-----x86系統是小端位元組序系統
Motorola680x()    全部    Big endian
MIPS    NT    Little endian
MIPS    UNIX    Big endian
PowerPC    NT    Little endian
PowerPC    非NT    Big endian  <-----PPC系統是大端位元組序系統
RS/6000    UNIX    Big endian
SPARC    UNIX    Big endian
IXP1200 ARM核心    全部    Little endian

Part 3: 模擬htonl、ntohl、htons、ntohs函式實現


--------------------------------------------------------------------------------
今天在如鵬網裡討論htonl、ntohl在不同機器的區別,特意模擬了htonl、ntohl、htons、ntohs函式實現。
實現如下:


typedef unsigned short int uint16;

typedef unsigned long int uint32;

// 短整型大小端互換

#define BigLittleSwap16(A)  ((((uint16)(A) & 0xff00) >> 8) | /

                                                 (((uint16)(A) & 0x00ff) << 8))

// 長整型大小端互換

#define BigLittleSwap32(A)  ((((uint32)(A) & 0xff000000) >> 24) | /

                                                 (((uint32)(A) & 0x00ff0000) >> 8) | /

                                                 (((uint32)(A) & 0x0000ff00) << 8) | /

                                                 (((uint32)(A) & 0x000000ff) << 24))

// 本機大端返回1,小端返回0

int checkCPUendian()

{

       union{

              unsigned long int i;

              unsigned char s[4];

       }c;

       c.i = 0x12345678;

       return (0x12 == c.s[0]);

}

// 模擬htonl函式,本機位元組序轉網路位元組序

unsigned long int HtoNl(unsigned long int h)

{

       // 若本機為大端,與網路位元組序同,直接返回

       // 若本機為小端,轉換成大端再返回

       return checkCPUendian() ? h : BigLittleSwap32(h);

}

// 模擬ntohl函式,網路位元組序轉本機位元組序

unsigned long int NtoHl(unsigned long int n)

{

       // 若本機為大端,與網路位元組序同,直接返回

       // 若本機為小端,網路資料轉換成小端再返回

       return checkCPUendian() ? n : BigLittleSwap32(n);

}

// 模擬htons函式,本機位元組序轉網路位元組序

unsigned short int HtoNs(unsigned short int h)

{

       // 若本機為大端,與網路位元組序同,直接返回

       // 若本機為小端,轉換成大端再返回

       return checkCPUendian() ? h : BigLittleSwap16(h);

}

// 模擬ntohs函式,網路位元組序轉本機位元組序

unsigned short int NtoHs(unsigned short int n)

{

       // 若本機為大端,與網路位元組序同,直接返回

       // 若本機為小端,網路資料轉換成小端再返回

       return checkCPUendian() ? n : BigLittleSwap16(n);

}