1. 程式人生 > >字串格式化 sprintf

字串格式化 sprintf

sprintf 是個變參函式,定義如下:
int sprintf( char *buffer, const char *format [, argument] … );除了前兩個引數型別固定外,後面可以接任意多個引數。而它的精華,顯然就在第二個引數:格式化字串上。

printf 和sprintf 都使用格式化字串來指定串的格式,在格式串內部使用一些以”%”開頭的格式說明符(format specifications)來佔據一個位置,在後邊的變參列表中提供相應的變數,最終函式就會用相應位置的變數來替代那個說明符,產生一個呼叫者想要 的字串。

一、格式化數字字串

sprintf 最常見的應用之一莫過於把整數列印到字串中,所以,spritnf 在大多數場合可以替代itoa。

如:
//把整數123 列印成一個字串儲存在s 中。
sprintf(s, “%d”, 123); //產生”123”可以指定寬度,不足的左邊補空格:
sprintf(s, “%8d%8d”, 123, 4567); //產生:” 123 4567”當然也可以左對齊:
sprintf(s, “%-8d%8d”, 123, 4567); //產生:”123 4567”

也可以按照16 進位制列印:
sprintf(s, “%8x”, 4567); //小寫16 進位制,寬度佔8 個位置,右對齊
sprintf(s, “%-8X”, 4568); //大寫16 進位制,寬度佔8 個位置,左對齊

這樣,一個整數的16 進位制字串就很容易得到,但我們在列印16 進位制內容時,通常想要一種左邊補0 的等寬格式,那該怎麼做呢?很簡單,在表示寬度的數字前面加個0 就可以了。
sprintf(s, “%08X”, 4567); //產生:”000011D7”
上面以”%d”進行的10 進位制列印同樣也可以使用這種左邊補0 的方式。

這裡要注意一個符號擴充套件的問題:比如,假如我們想列印短整數(short)-1 的記憶體16 進製表示形式,在Win32 平臺上,一個short 型佔2 個位元組,所以我們自然希望用4 個16 進位制數字來列印它:
short si = -1;
sprintf(s, “%04X”, si);
產 生”FFFFFFFF”,怎麼回事?因為spritnf 是個變參函式,除了前面兩個引數之外,後面的引數都不是型別安全的,函式更沒有辦法僅僅通過一個”%X”就能得知當初函式呼叫前引數壓棧時被壓進來的到底 是個4 位元組的整數還是個2 位元組的短整數,所以採取了統一4 位元組的處理方式,導致引數壓棧時做了符號擴充套件,擴充套件成了32 位的整數-1,列印時4 個位置不夠了,就把32 位整數-1 的8 位16 進位制都打印出來了。

如果你想看si 的本來面目,那麼就應該讓編譯器做0 擴充套件而不是符號擴充套件(擴充套件時二進位制左邊補0 而不是補符號位):
sprintf(s, “%04X”, (unsigned short)si);
就可以了。或者:
unsigned short si = -1;
sprintf(s, “%04X”, si);

sprintf 和printf 還可以按8 進位制列印整數字符串,使用”%o”。注意8 進位制和16 進位制都不會打
印出負數,都是無符號的,實際上也就是變數的內部編碼的直接的16 進位制或8 進製表示。

二、控制浮點數列印格式

浮點數的列印和格式控制是sprintf 的又一大常用功能,浮點數使用格式符”%f”控制,預設保
留小數點後6 位數字,比如:
sprintf(s, “%f”, 3.1415926); //產生”3.141593”
但有時我們希望自己控制列印的寬度和小數位數,這時就應該使用:”%m.nf”格式,其中m 表
示列印的寬度,n 表示小數點後的位數。比如:
sprintf(s, “%10.3f”, 3.1415626); //產生:” 3.142”
sprintf(s, “%-10.3f”, 3.1415626); //產生:”3.142 ”
sprintf(s, “%.3f”, 3.1415626); //不指定總寬度,產生:”3.142”

注意一個問題,你猜
int i = 100;
sprintf(s, “%.2f”, i);
會打出什麼東東來?”100.00”?對嗎?自己試試就知道了,同時也試試下面這個:
sprintf(s, “%.2f”, (double)i);
第 一個打出來的肯定不是正確結果,原因跟前面提到的一樣,引數壓棧時呼叫者並不知道跟i相對應的格式控制符是個”%f”。而函式執行時函式本身則並不知道當 年被壓入棧裡的是個整數,於是可憐的儲存整數i 的那4 個位元組就被不由分說地強行作為浮點數格式來解釋了,整個亂套了。不過,如果有人有興趣使用手工編碼一個浮點數,那麼倒可以使用這種方法來檢驗一下你手工編 排的結果是否正確。

三、字元
/Ascii
碼對照
我們知道,在C/C++語言中,char 也是一種普通的scalable 型別,除了字長之外,它與short,int,long 這些型別沒有本質區別,只不過被大家習慣用來表示字元和字串而已。(或許當年該把這 個型別叫做”byte”,然後現在就可以根據實際情況,使用byte 或short 來把char 通過typedef 定義出來,這樣更合適些)於是,使用”%d”或者”%x”列印一個字元,便能得出它的10 進位制或16 進位制的ASCII 碼;反過來,使用”%c”列印一個整數,便可以看到它所對應的ASCII 字元。以下程式段把所有可見字元的ASCII 碼對照表列印到螢幕上(這裡採用printf,注意”#”與”%X”合用時自動為16 進位制數增加”0X”字首):
for(int i = 32; i < 127; i++) {
printf(“[ %c ]: %3d 0x%#04X/n”, i, i, i);
}