1. 程式人生 > >C++ std::string --- 你可能不知道的一些用法

C++ std::string --- 你可能不知道的一些用法




toupper, tolower

地球人都知道 C++ 的 string 沒有 toupper ,好在這不是個大問題,因為我們有 STL 演算法:

string s("heLLo");
transform(s.begin(), s.end(), s.begin(), toupper);
cout << s << endl;
transform(s.begin(), s.end(), s.begin(), tolower);
cout << s << endl;

當然,我知道很多人希望的是 s.to_upper() ,但是對於一個這麼通用的 basic_string 來說,的確沒辦法把這些專有的方法放進來。如果你用 boost stringalgo ,那當然不在話下,你也就不需要讀這篇文章了。

------------------------------------------------------------------------
trim

我們還知道 string 沒有 trim ,不過自力更生也不困難,比 toupper 來的還要簡單:

    string s("   hello   ");
    s.erase(0, s.find_first_not_of(" /n"));
    cout << s << endl;
    s.erase(s.find_last_not_of(' ') + 1);
    cout << s << endl;

注意由於 find_first_not_of 和 find_last_not_of 都可以接受字串,這個時候它們尋找該字串中所有字元的 absence ,所以你可以一次 trim 掉多種字元。

-----------------------------------------------------------------------
erase

string 本身的 erase 還是不錯的,但是隻能 erase 連續字元,如果要拿掉一個字串裡面所有的某個字元呢?用 STL 的 erase + remove_if 就可以了,注意光 remove_if 是不行的。

    string s("   hello, world. say bye   ");
    s.erase(remove_if(s.begin(),s.end(),
        bind2nd(equal_to<char>(), ' ')),
    s.end());

上面的這段會拿掉所有的空格,於是得到 hello,world.saybye。

-----------------------------------------------------------------------
replace

string 本身提供了 replace ,不過並不是面向字串的,譬如我們最常用的把一個 substr 換成另一個 substr 的操作,就要做一點小組合:

    string s("hello, world");
    string sub("ello, ");
    s.replace(s.find(sub), sub.size(), "appy ");
    cout << s << endl;

輸出為 happy world。注意原來的那個 substr 和替換的 substr 並不一定要一樣長。

-----------------------------------------------------------------------
startwith, endwith
這兩個可真常用,不過如果你仔細看看 string 的介面,就會發現其實沒必要專門提供這兩個方法,已經有的介面可以乾得很好:

    string s("hello, world");
    string head("hello");
    string tail("ld");
    bool startwith = s.compare(0, head.size(), head) == 0;
    cout << boolalpha << startwith << endl;
    bool endwith = s.compare(s.size() - tail.size(), tail.size(), tail) == 0;
    cout << boolalpha << endwith << endl;

當然了,沒有 s.startwith("hello") 這樣方便。

------------------------------------------------------------------------
toint, todouble, tobool...
這也是老生常談了,無論是 C 的方法還是 C++ 的方法都可以,各有特色:

    string s("123");
    int i = atoi(s.c_str());
    cout << i << endl;

    int ii;
    stringstream(s) >> ii;
    cout << ii << endl;

    string sd("12.3");
    double d = atof(sd.c_str());
    cout << d << endl;

    double dd;
    stringstream(sd) >> dd;
    cout << dd << endl;

    string sb("true");
    bool b;
    stringstream(sb) >> boolalpha >> b;
    cout << boolalpha << b << endl;

C 的方法很簡潔,而且賦值與轉換在一句裡面完成,而 C++ 的方法很通用。

------------------------------------------------------------------------
split
這可是件麻煩事,我們最希望的是這樣一個介面: s.split(vect, ',') 。用 STL 演算法來做有一定難度,我們可以從簡單的開始,如果分隔符是空格、tab 和回車之類,那麼這樣就夠了:

    string s("hello world, bye.");
    vector<string> vect;
    vect.assign(

        istream_iterator<string>(stringstream(s)),

        istream_iterator<string>()

    );


不過要注意,如果 s 很大,那麼會有效率上的隱憂,因為 stringstream 會 copy 一份 string 給自己用。

------------------------------------------------------------------------
concat
把一個裝有 string 的容器裡面所有的 string 連線起來,怎麼做?希望你不要說是 hand code 迴圈,這樣做不是更好?

    vector<string> vect;
    vect.push_back("hello");
    vect.push_back(", ");
    vect.push_back("world");

    cout << accumulate(vect.begin(), vect.end(), string(""));

不過在效率上比較有優化餘地。

-------------------------------------------------------------------------

reverse
其實我比較懷疑有什麼人需要真的去 reverse 一個 string ,不過做這件事情的確是很容易:

  std::reverse(s.begin(), s.end());

上面是原地反轉的方法,如果需要反轉到別的 string 裡面,一樣簡單:

  s1.assign(s.rbegin(), s.rend());

效率也相當理想。

-------------------------------------------------------------------------

解析副檔名
字數多點的寫法:

    std::string filename("hello.exe");

    std::string::size_type pos = filename.rfind('.');
    std::string ext = filename.substr(pos == std::string::npos ? filename.length() : pos + 1);

不過兩行,合併成一行呢?也不是不可以:

    std::string ext = filename.substr(filename.rfind('.') == std::string::npos ? filename.length() : filename.rfind('.') + 1);

我知道,rfind 執行了兩次。不過第一,你可以希望編譯器把它優化掉,其次,副檔名一般都很短,即便多執行一次,區別應該是相當微小。