C++STL中的unique函式解析
一.總述
unique函式屬於STL中比較常用函式,它的功能是元素去重。即”刪除”序列中所有相鄰的重複元素(只保留一個)。此處的刪除,並不是真的刪除,而是指重複元素的位置被不重複的元素給佔領了(詳細情況,下面會講)。由於它”刪除”的是相鄰的重複元素,所以在使用unique函式之前,一般都會將目標序列進行排序。
二.函式原型
unique函式的函式原型如下:
1.只有兩個引數,且引數型別都是迭代器:
1 |
iterator unique(iterator it_1,iterator it_2);
|
這種型別的unique函式是我們最常用的形式。其中這兩個引數表示對容器中[it_1,it_2)範圍的元素進行去重(注:區間是前閉後開,即不包含it_2所指的元素
2.有三個引數,且前兩個引數型別為迭代器,最後一個引數型別可以看作是bool型別:
1 |
iterator unique(iterator it_1,iterator it_2, bool MyFunc);
|
該型別的unique函式我們使用的比較少,其中前兩個引數和返回值同上面型別的unique函式是一樣的,主要區別在於第三個引數。這裡的第三個引數表示的是自定義元素是否相等。也就是說通過自定義兩個元素相等的規則,來對容器中元素進行去重。這裡的第三個引數與STL中sort函式的第三個引數功能類似(關於sort函式:
三.函式用法例項
上面介紹了unique函式的功能和原型,那麼,它到底是如何進行去重的呢?即“刪除”的具體操作是怎樣的呢?
關於這個問題,http://www.cplusplus.com/reference/algorithm/unique/給了我們一種解釋,即unique函式是完全等價於下面這個函式的:
1 2 3 4 5 6 7 8 9 10 11 12 |
iterator My_Unique (iterator first, iterator last) {
if (first==last) return last;
iterator result = first;
while (++first != last)
{
if (!(*result == *first))
*(++result)=*first;
}
return ++result;
}
|
分析這段程式碼,我們可以知道,unique函式的去重過程實際上就是不停的把後面不重複的元素移到前面來,也可以說是用不重複的元素佔領重複元素的位置。有了這段程式碼我們可以結合例項來更好的理解這個函數了。
例項:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
#include<iostream>
#include<algorithm>
#include<cassert>
using namespace std;
static bool myfunc( int i, int j)
{
return (i + 1) == j;
//return i == j;
}
int main()
{
vector< int > a = {1,3,3,4,5,6,6,7};
vector< int >::iterator it_1 = a.begin();
vector< int >::iterator it_2 = a.end();
//sort(it_1,it_2);
cout<< "去重前的 a : " ;
for ( int i = 0 ; i < a.size(); i++)
cout<<a[i];
cout<<endl;
//it_h = unique(it_1,it_2);
//unique(it_1,it_2,myfunc);
unique(it_1,it_2);
cout<< "去重後的 a : " ;
for ( int i = 0 ; i < a.size(); i++)
cout<<a[i];
cout<<endl;
}
|
執行結果如下:
對於上面的結果,我們可以看到,容器中不重複的元素都移到了前面,至於後面的元素,實際上並沒有改變(這個過程只需結合My_Unique函式來分析即可)。
注:
1.有很多文章說的是,unique去重的過程是將重複的元素移到容器的後面去,實際上這種說法並不正確,應該是把不重複的元素移到前面來。
2.一定不要忘記的是,unique函式在使用前需要對容器中的元素進行排序(當然不是必須的,但我們絕大數情況下需要這麼做),由於本例中的元素已經是排好序的,所以此處我沒排序,但實際使用中不要忘記。
四.用法拓展
1.我們以上的例項針對的是函式原型1的用法,對於函式原型2,我們仍然使用上述例項,只不過unique的用法變成:
1 |
unique(it_1,it_2,myfunc);
|
即自定義的元素相等的準則,其中myfunc在上述例項中有其原始碼,分析可知,只有i+1 == j的時候我們才認為i和j“相等”;例項結果如下:
也就是說,按照我們自定義的規則,這個例項中只有3和4”相等的”,4和5是”相等的”,5和6,6和7是”相等的”。所以最終結果是上圖的樣子。
2.unique函式通常和erase函式一起使用,來達到刪除重複元素的目的。(注:此處的刪除是真正的刪除,即從容器中去除重複的元素,容器的長度也發生了變換;而單純的使用unique函式的話,容器的長度並沒有發生變化,只是元素的位置發生了變化)關於erase函式的用法,可以參考:http://www.cnblogs.com/wangkundentisy/p/9023977.html。下面是一個具體的例項:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
#include<iostream>
#include<algorithm>
#include<cassert>
using namespace std;
int main()
{
vector< int > a ={1,3,3,4,5,6,6,7};
vector< int >::iterator it_1 = a.begin();
vector< int >::iterator it_2 = a.end();
vector< int >::iterator new_end;
new_end = unique(it_1,it_2); //注意unique的返回值
a.erase(new_end,it_2);
cout<< "刪除重複元素後的 a : " ;
for ( int i = 0 ; i < a.size(); i++)
cout<<a[i];
cout<<endl;
}
|
執行結果如下:
可以看到,相比之前的結果,a的長度確實發生了改變,真正的刪除了a中的重複元素。