htons函式詳解
Part 1: htons函式具體解釋
在Linux和Windows網路程式設計時需要用到htons和htonl函式,用來將主機位元組順序轉換為網路位元組順序。
在Intel機器下,執行以下程式
int main()
...{
printf("%d /n",htons(16));
return 0;
}
得到的結果是4096,初一看感覺很怪。
解釋如下,數字16的16進製表示為0x0010,數字4096的16進製表示為0x1000。 由於Intel機器是小尾端,儲存數字16時實際順序為1000,儲存4096時實際順序為0010。因此在傳送網路包時為了報文中資料為0010,需要經過htons進行位元組轉換。如果用IBM等大尾端機器,則沒有這種位元組順序轉換,但為了程式的可移植性,也最好用這個函式。
另外用注意,數字所佔位數小於或等於一個位元組(8 bits)時,不要用htons轉換。這是因為對於主機來說,大小尾端的最小單位為位元組(byte)。
Part 2: 大小端模式
不同的CPU有不同的位元組序型別 這些位元組序是指整數在記憶體中儲存的順序 這個叫做主機序
最常見的有兩種
1. Little endian:將低序位元組儲存在起始地址
2. Big endian:將高序位元組儲存在起始地址
LE little-endian
最符合人的思維的位元組序
地址低位儲存值的低位
地址高位儲存值的高位
怎麼講是最符合人的思維的位元組序,是因為從人的第一觀感來說
低位值小,就應該放在記憶體地址小的地方,也即記憶體地址低位
反之,高位值就應該放在記憶體地址大的地方,也即記憶體地址高位
BE big-endian
最直觀的位元組序
地址低位儲存值的高位
地址高位儲存值的低位
為什麼說直觀,不要考慮對應關係
只需要把記憶體地址從左到右按照由低到高的順序寫出
把值按照通常的高位到低位的順序寫出
兩者對照,一個位元組一個位元組的填充進去
例子:在記憶體中雙字0x01020304(DWORD)的儲存方式
記憶體地址
4000 4001 4002 4003
LE 04 03 02 01
BE 01 02 03 04
例子:如果我們將0x1234abcd寫入到以0x0000開始的記憶體中,則結果為
big-endian little-endian
0x0000 0x12 0xcd
0x0001 0x23 0xab
0x0002 0xab 0x34
0x0003 0xcd 0x12
x86系列CPU都是little-endian的位元組序.
網路位元組順序是TCP/IP中規定好的一種資料表示格式,它與具體的CPU型別、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋。網路位元組順序採用big endian排序方式。
為了進行轉換 bsd socket提供了轉換的函式 有下面四個
htons 把unsigned short型別從主機序轉換到網路序
htonl 把unsigned long型別從主機序轉換到網路序
ntohs 把unsigned short型別從網路序轉換到主機序
ntohl 把unsigned long型別從網路序轉換到主機序
在使用little endian的系統中 這些函式會把位元組序進行轉換
在使用big endian型別的系統中 這些函式會定義成空巨集
同樣 在網路程式開發時 或是跨平臺開發時 也應該注意保證只用一種位元組序 不然兩方的解釋不一樣就會產生bug.
注:
1、網路與主機位元組轉換函式:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的CPU上執行不同的作業系統,位元組序也是不同的,參見下表。
處理器 作業系統 位元組排序
Alpha 全部 Little endian
HP-PA NT Little endian
HP-PA UNIX Big endian
Intelx86 全部 Little endian <-----x86系統是小端位元組序系統
Motorola680x() 全部 Big endian
MIPS NT Little endian
MIPS UNIX Big endian
PowerPC NT Little endian
PowerPC 非NT Big endian <-----PPC系統是大端位元組序系統
RS/6000 UNIX Big endian
SPARC UNIX Big endian
IXP1200 ARM核心 全部 Little endian
Part 3: 模擬htonl、ntohl、htons、ntohs函式實現
--------------------------------------------------------------------------------
今天在如鵬網裡討論htonl、ntohl在不同機器的區別,特意模擬了htonl、ntohl、htons、ntohs函式實現。
實現如下:
typedef unsigned short int uint16;
typedef unsigned long int uint32;
// 短整型大小端互換
#define BigLittleSwap16(A) ((((uint16)(A) & 0xff00) >> 8) | /
(((uint16)(A) & 0x00ff) << 8))
// 長整型大小端互換
#define BigLittleSwap32(A) ((((uint32)(A) & 0xff000000) >> 24) | /
(((uint32)(A) & 0x00ff0000) >> 8) | /
(((uint32)(A) & 0x0000ff00) << 8) | /
(((uint32)(A) & 0x000000ff) << 24))
// 本機大端返回1,小端返回0
int checkCPUendian()
{
union{
unsigned long int i;
unsigned char s[4];
}c;
c.i = 0x12345678;
return (0x12 == c.s[0]);
}
// 模擬htonl函式,本機位元組序轉網路位元組序
unsigned long int HtoNl(unsigned long int h)
{
// 若本機為大端,與網路位元組序同,直接返回
// 若本機為小端,轉換成大端再返回
return checkCPUendian() ? h : BigLittleSwap32(h);
}
// 模擬ntohl函式,網路位元組序轉本機位元組序
unsigned long int NtoHl(unsigned long int n)
{
// 若本機為大端,與網路位元組序同,直接返回
// 若本機為小端,網路資料轉換成小端再返回
return checkCPUendian() ? n : BigLittleSwap32(n);
}
// 模擬htons函式,本機位元組序轉網路位元組序
unsigned short int HtoNs(unsigned short int h)
{
// 若本機為大端,與網路位元組序同,直接返回
// 若本機為小端,轉換成大端再返回
return checkCPUendian() ? h : BigLittleSwap16(h);
}
// 模擬ntohs函式,網路位元組序轉本機位元組序
unsigned short int NtoHs(unsigned short int n)
{
// 若本機為大端,與網路位元組序同,直接返回
// 若本機為小端,網路資料轉換成小端再返回
return checkCPUendian() ? n : BigLittleSwap16(n);
}