1. 程式人生 > >Qt Creator程式設計之正則表示式

Qt Creator程式設計之正則表示式

正則表示式:在一個文字中匹配子字串的一種模式,它可以簡寫為regexp。

一個regexp可以主要應用在以下幾個方面:

1.驗證。regexp可以測試一個子字串是否符合一些規範。例如,是否是一個整數或者不包含任何空格等。

2.搜尋。regexp提供了比簡單的子字串匹配更強大的模式匹配。例如,匹配單詞mail或者letter,而不匹配單詞email、mailman或者letterbox。

3.查詢和替換。regexp可以使用一個不同的字串替換所有匹配的子字串。例如,使用Mail來替換一個字串中所有的M字元,但是M字元後面有ail時則不進行替換。

4.字串分割。regexp可以識別在哪裡使用正則表示式進行模式匹配。例如,分割製表符隔離的字串。


Regexps由表示式、量詞和斷言組成。

表示式:一個字元,例如x和5;一組字元,例如[abc](可以簡寫為a-c)。

量詞:指定了必須要匹配的表示式出現的次數。例如x{1,1}意味著必須匹配且只能匹配一個字元x。

        可以使用一些特殊的符號來表示一些常見的字元組和量詞。例如,[0-9]可以用"\d"來替代。要匹配0~99,就可以寫為"^\d{1,2}$"或者"^\d\d{0,1}$"。而{0,1}表示字元是可選的,就是隻出現一次或者不出現,它可以使用"?"來代替,這樣regexp就可以寫為"^\d\d? $",它意味著從字串的開始,匹配一個數字,緊接著是0個或一個數字,再後面就是字串的結尾。

        如果想使用一個單詞,如Mail,替換一個字串中的字元M,但是當字元M的後面是ail的話就不再替換。這樣可以使用(?!E)斷言,例如這裡regexp應該寫成M(?!Mail)。

下面在實際程式中對這些例子進行演示。

#include "widget.h"
#include "ui_widget.h"
#include <QDebug>

Widget::Widget(QWidget *parent) :
    QWidget(parent),
    ui(new Ui::Widget)
{
    ui->setupUi(this);

    QRegExp rx("^\\d\\d?$");           // 兩個字元都必須為數字,第二個字元可以沒有
    qDebug() << rx.indexIn("a1");            // 結果為-1,不是數字開頭
    qDebug() << rx.indexIn("5");             // 結果為0
    qDebug() << rx.indexIn("5b");            // 結果為-1,第二個字元不是數字
    qDebug() << rx.indexIn("12");            // 結果為0
    qDebug() << rx.indexIn("123");           // 結果為-1,超過了兩個字元
    qDebug() << "*******************";       // 輸出分割符,為了顯示清晰
    rx.setPattern("\\b(mail|letter)\\b");    // 匹配mail或者letter單詞
    qDebug() << rx.indexIn("emailletter");   // 結果為-1,mail不是一個單詞
    qDebug() << rx.indexIn("my mail");       // 返回3
    qDebug() << rx.indexIn("my email letter"); // 返回9
    qDebug() << "*******************";
    rx.setPattern("M(?!ail)");               // 匹配字元M,其後面不能跟有ail字元
    QString str1 = "this is M";
    str1.replace(rx, "Mail");                // 使用"Mail"替換匹配到的字元
    qDebug() << "str1: " << str1;            // 結果為this is Mail
    QString str2 = "my M,your Ms,his Mail";
    str2.replace(rx,"Mail");
    qDebug() << "str2: " << str2;            // 結果為my Mail,your Mails,his Mail
    qDebug() << "*******************";
    QString str3 = "One Eric another Eirik, and an Ericsson. "
                   "How many Eiriks, Eric?"; // 一個字串如果一行寫不完,換行後兩行都需要加雙引號
    QRegExp rx2("\\bEi?ri[ck]\\b");         // 匹配Eric或者Eirik
    int pos = 0;
    int count = 0;
    while (pos >= 0) {
        pos = rx2.indexIn(str3, pos);
        if (pos >= 0) {
            ++pos;                         // 從匹配的字元的下一個字元開始匹配
            ++count;                       // 匹配到的數目加1
        }
    }
    qDebug() << "count: " << count;        // 結果為3

    QRegExp rx3("*.txt");
    rx3.setPatternSyntax(QRegExp::Wildcard);
    qDebug() << rx3.exactMatch("README.txt");        // 結果為true
    qDebug() << rx3.exactMatch("welcome.txt.bak");   // 結果為false

    QRegExp rx4("(\\d+)");
    QString str4 = "Offsets: 12 14 99 231 7";
    QStringList list;
    int pos2 = 0;
    while ((pos2 = rx4.indexIn(str4, pos2)) != -1) {
        list << rx4.cap(1);                      // 第一個捕獲到的文字
        pos2 += rx4.matchedLength();             // 上一個匹配的字串的長度
    }
    qDebug() << list;                            // 結果12,14,99,231,7

    QRegExp rxlen("(\\d+)(?:\\s*)(cm|inch)");
    int pos3 = rxlen.indexIn("Length: 189cm");
    if (pos3 > -1) {
        QString value = rxlen.cap(1);            // 結果為189
        QString unit = rxlen.cap(2);             // 結果為cm
        QString string = rxlen.cap(0);           // 結果為189cm
        qDebug() << value << unit << string;
    }

    QRegExp rx5("\\b(\\w+)\\W+\\1\\b");
    rx5.setCaseSensitivity(Qt::CaseInsensitive); // 設定不區分大小寫
    qDebug() << rx5.indexIn("Hello--hello");     // 結果為0
    qDebug() << rx5.cap(1);                      // 結果為Hello

    QRegExp rx6("\\b你好\\b");                  // 匹配中文
    qDebug() << rx6.indexIn("你好");            // 結果為0
    qDebug() << rx6.cap(0); // 整個字串完全匹配,使用cap(0)捕獲,結果為“你好”

}

Widget::~Widget()
{
    delete ui;
}

這裡使用了QRegexp的indexIn()函式,它從指定的位置開始向後對字串進行匹配,預設是從字串開始進行匹配。如果匹配成功,則返回第一個匹配到的位置的索引;如果沒有匹配到,則返回-1.setPattern()函式用來輸入一個regexp。而QString的replace()函式可以使用給定的regexp和替換字元來進行字串的替換。


出處:《Qt Creator快速入門》