1. 程式人生 > >為什麼C++中位元組用 unsigned char 來表示

為什麼C++中位元組用 unsigned char 來表示

在C中,預設的基礎資料型別均為signed,現在我們以char為例,說明(signed) char與unsigned char之間的區別 

首先在記憶體中,char與unsigned char沒有什麼不同,都是一個位元組,唯一的區別是,char的最高位為符號位,因此char能表示-128~127, unsigned char沒有符號位,因此能表示0~255,這個好理解,8個bit,最多256種情況,因此無論如何都能表示256個數字。

在實際使用過程種有什麼區別呢?

主要是符號位,但是在普通的賦值,讀寫檔案和網路位元組流都沒什麼區別,反正就是一個位元組,不管最高位是什麼,最終的讀取結果都一樣,只是你怎麼理解最高位而已,在螢幕上面的顯示可能不一樣。

但是我們卻發現在表示byte時,都用unsigned char,這是為什麼呢?

首先我們通常意義上理解,byte沒有什麼符號位之說,更重要的是如果將byte的值賦給int,long等資料型別時,系統會做一些額外的工作。

如果是char,那麼系統認為最高位是符號位,而int可能是16或者32位,那麼會對最高位進行擴充套件(注意,賦給unsigned int也會擴充套件)

而如果是unsigned char,那麼不會擴充套件。

這就是二者的最大區別。

同理可以推導到其它的型別,比如short, unsigned short。等等

具體可以通過下面的小例子看看其區別

include <stdio.h>

void f(unsigned char v)

{

    char c = v;

    unsigned char uc = v;

    unsigned int a = c, b = uc;

    int i = c, j = uc;

    printf("----------------\n");

    printf("%%c: %c, %c\n", c, uc);

    printf("%%X: %X, %X\n", c, uc);

    printf("%%u: %u, %u\n", a, b);

    printf("%%d: %d, %d\n", i, j);

}

int main(int argc, char *argv[])

{

    f(0x80);

    f(0x7F); 

    return 0;

}

輸出結果:

----------------

%c: ?, ?

%X: FFFFFF80, 80

%u: 4294967168, 128

%d: -128, 128

----------------

%c: , 

%X: 7F, 7F

%u: 127, 127

%d: 127, 127