字串函式 sprintf()、snprintf()
sprintf() 函式
(將各種型別的資料構造成字串)
sprintf ()跟 printf ()在用法上幾乎一樣,只是列印的目的地不同而已,sprintf ()會列印到字串中,printf ()則直接在命令列上輸出。
sprintf是個變參函式,定義如下:
int sprintf( char *buffer, const char *format [, argument] … );
前兩個引數型別固定外,後面可以接任意多個引數。最重要的是第二個引數:格式化字串
printf 和 sprintf 都使用格式化字串來指定串的格式,在格式串內部使用一些以“%”開頭的格式說明符(format specifications)來佔據一個位置,在後邊的變參列表中提供相應的變數,最終函式就會用相應位置的變數來替代那個說明符,產生一個呼叫者想要 的字串。
1、格式化數字字串
sprintf最常見的是把整數列印到字串中,所以,spritnf 在大多數場合可以替代itoa。如:
// 把整數123列印成一個字串儲存在s中。
1 |
|
可以指定寬度,不足的左邊補空格:
1 |
|
當然也可以左對齊:
1 |
// 產生:"123 4567"
|
也可以按照16進位制列印:
1 2 |
|
這樣,一個整數的16進位制字串就很容易得到,但我們在列印16進位制內容時,通常想要一種左邊補0的等寬格式,那該怎麼做呢?很簡單,在表示寬度的數字前面加個0就可以了。
1 |
|
上面以 "%d" 進行的10進位制列印同樣也可以使用這種左邊補0的方式。
這裡要注意一個符號擴充套件的問題:比如,假如我們想列印短整數(short)-1的記憶體16進製表示形式,在Win32平臺上,一個 short 型佔2個位元組,所以我們自然希望用4個16進位制數字來列印它:
1 2 |
|
產生 "FFFFFFFF",怎麼回事?因為 sprintf 是個變參函式,除了前面兩個引數之外,後面的引數都不是型別安全的,函式更沒有辦法僅僅通過一個“%X”就能得知當初函式呼叫前引數壓棧時被壓進來的到底是個4位元組的整數還是個2位元組的短整數,所以採取了統一4位元組的處理方式,導致引數壓棧時做了符號擴充套件,擴充套件成了32位的整數-1,列印時 4個位置不夠了,就把32位整數-1的8位16進位制都打印出來了。如果你想看a的本來面目,那麼就應該讓編譯器做0擴充套件而不是符號擴充套件(擴充套件時二進位制左邊補0而不是補符號位):
1 |
|
就可以了。或者:
1 2 |
|
sprintf 和 printf 還可以按8進位制列印整數字符串,使用“%o”。注意8進位制和16進位制都不會打印出負數,都是無符號的,實際上也就是變數的內部編碼是直接的16進位制或8進製表示。
2、控制浮點數列印格式
浮點數的列印和格式控制是 sprintf 的又一大常用功能,浮點數使用格式符“%f”控制,預設保留小數點後6位數字,比如:
1 |
|
但有時我們希望自己控制列印的寬度和小數位數,這時就應該使用:“%m.nf”格式,其中m表示列印的寬度,n表示小數點後的位數。比如:
1 2 3 |
|
注意一個問題,
1 2 |
|
這個打出來的結果肯定不是正確結果,原因跟前面提到的一樣,引數壓棧時呼叫者並不知道跟i相對應的格式控制符是個“%f”。而函式執行時函式本身則並不知道當時被壓入棧裡的是個整數,於是儲存整數i的那4個位元組就被強行作為浮點數格式來解釋了。
1 |
|
字元/Ascii碼對照
我們知道,在C/C++語言中,char也是一種普通 的scalable型別,除了字長之外,它與short,int,long這些型別沒有本質區別,只不過被大家習慣用來表示字元和字串而已。
於是,使用“%d”或者“%x”列印一個字元,便能得出它的10進位制或16進位制的ASCII碼;反過來,使用“%c”列印一個整數,便可以看到它所對應的ASCII字元。以下程式段把所有可見字元的 ASCII碼對照表列印到螢幕上(這裡採用printf,注意“#”與“%X”合用時自動為16進位制數增加“0X”字首):
1 2 3 4 |
|
3、連線字串
sprintf的格式控制串中既然可以插入各種東西,並最終把它們“連成一串”,自然也就能夠連線字串,從而在許多場合可以替代 strcat,但 sprintf 能夠一次連線多個字串(自然也可以同時在它們中間插入別的內容,總之非常靈活)。比如:
1 2 3 4 |
|
strcat 只能連線字串(一段以 '\0' 結尾的字元陣列或叫做字元緩衝,null-terminated-string),但有時我們有兩段字元緩衝區,他們並不是以 '\0' 結尾。比如許多從第三方庫函 數中返回的字元陣列,從硬體或者網路傳輸中讀進來的字元流,它們未必每一段字元序列後面都有個相應的 '\0' 來結尾。如果直接連線,不管是 sprintf 還是 strcat 肯定會導致非法記憶體操作,而 strncat 也至少要求第一個引數是個 null-terminated-string,那該怎麼辦呢?我們 自然會想起前面介紹列印整數和浮點數時可以指定寬度,字串也一樣的。比如:
1 2 |
|
如果:
1 |
|
這樣肯定是有問題的。那是否可以改成:
1 |
|
也不對,正確的應該是:
1 |
|
這可以類比列印浮點數的“%m.nf”,在“%m.ns”中,m表示佔用寬度(字串長度不足時補空格,超出了則按照實際寬度列印),n才表示從相應的字串中最多取用的字元數。通常在列印字串時m沒什麼大用,還是點號後面的n用的多。自然,也可以前後都只取部分字元:
1 |
|
在許多時候,我們或許還希望這些格式控制符中用以指定長度資訊的數字是動態的,而不是靜態指定的,因為許多時候,程式要到執行時才會清楚到底需要取字元陣列中的幾個字元,這種動態的寬度/精度設定功能在 sprintf 的實現中也被考慮到了,sprintf 採用“*”來佔用一個本來需要一個指定寬度或精度的常數數字的位置,同樣,而實際的寬度或精度就可以和其它被列印的變數一樣被提供出來,於是,上面的例子可以變成:
1 |
|
或者:
1 |
|
實際上,前面介紹的列印字元、整數、浮點數等都可以動態指定那些常量值,比如:
1 2 3 |
|
4、列印地址資訊
有時除錯程式時,我們可能想檢視某些變數或者成員的地址,由於地址或者指標也不過是個32位的數,你完全可以使用列印無符號整數的“%u”把他們打印出來:
1 |
|
不過通常人們還是喜歡使用16進位制而不是10進位制來顯示一個地址:
1 |
|
然而,這些都是間接的方法,對於地址列印,sprintf 提供了專門的“%p”:
1 |
|
它實際上就相當於:
1 |
|
5、利用sprintf的返回值
較少有人注意 printf/sprintf 函式的返回值,但有時它卻是有用的,sprintf 返回了本次函式呼叫最終列印到字元緩衝區中的字元數目。也就是說每當一次 sprinf 呼叫結束以後,你無須再呼叫一次strlen 便已經知道了結果字串的長度。如:
1 |
|
對於正整數來說,len便等於整數i的10進位制位數。
下面的是個完整的例子,產生10個[0, 100)之間的隨機數,並將他們列印到一個字元陣列s中,以逗號分隔開。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
設想當你從資料庫中取出一條記錄,然後希望把他們的各 個欄位按照某種規則連線成一個字串時,就可以使用這種方法,從理論上講,他應該比不斷的 strcat 效率高,因為 strcat 每次呼叫都需要先找到最後 的那個 '\0' 的位置,而在上面給出的例子中,我們每次都利用 sprintf 返回值把這個位置直接記下來了。
6、使用 sprintf 的常見問題
sprintf是個變參函式,使用時經常出問題,而且只要出問題通常就是能導致程式崩潰的記憶體訪問錯誤,但好在由sprintf誤用導致的問題雖然嚴重,卻很容易找出,無非就是那麼幾種情況。
a.緩衝區溢位
第一個引數的長度太短了。當然也可能是後面的引數的問題,建議變參對應一定要細心,而列印字串時,儘量使用“%.ns”的形式指定最大字元數。
b. 忘記了第一個引數
c.變參對應出問題
通常是忘記了提供對應某個格式符的變參,導致以後的引數統統錯位。尤其是對應“*”的那些引數,不要把一個整數對應一個“%s”。
二、snprintf() 詳解
函式原型:
int snprintf(char *restrict buf, size_t n, const char * restrict format, ...);
函式說明:最多從源串中拷貝 n-1 個字元到目標串中,然後再在後面加一個 '\0'。所以如果目標串的大小為 n 的話,將不會溢位。
函式返回值:若成功則返回欲寫入的字串長度,若出錯則返回負值。
1、推薦的用法
1 2 3 4 5 6 7 8 9 10 |
|
輸出:
str=012345678
2、不推薦的用法
1 2 3 4 5 6 7 8 9 10 |
|
輸出:
str=01234567890123456
3、snprintf() 函式返回值的測試:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
輸出:
aaabbbccc length=9 str1=abc,ret1=3 str2=aaa,ret2=9
特別注意:
snprintf() 的返回值是欲寫入的字串長度,而不是實際寫入的字串度。如:
1 2 3 4 5 6 7 8 9 10 |
|
輸出:
10|1234