1. 程式人生 > >關於vector push_back()與其他方式讀取資料的效率對比

關於vector push_back()與其他方式讀取資料的效率對比

引言:
在讀取大量資料(陣列)時,使用vector會盡量保證不會炸空間(MLE),但是相比於scanf的讀取方式會慢上不少。但到底效率相差有多大,我們將通過對比測試得到結果。

測試資料:利用srand()函式生成1e7的隨機陣列(x[i] ∈ (0, 115000]),最終結果將是讀取這1e7(一千萬)的陣列所消耗的時間。

測試環境:在Linux虛擬機器下測試,利用編譯命令:time ./t得到執行時間。

備註:在debug模式下執行,不開任何優化。

生成資料程式碼:

#include <bits/stdc++.h>
using namespace std;

const
int maxn = 10000005, lenth = 115000; int n, x, y; int main() { freopen("test.in", "w", stdout); cout << maxn << endl; srand((unsigned int) time(0)); for(int i = 0; i != maxn; ++i) { x = rand()%lenth+1; cout << x << endl; } fclose(stdout); return
0; }

對比讀入:
1.正常使用push_back()讀入

for(int i = 0; i != n; ++i)
{
    scanf("%d", &curr);
    q1.push_back(curr);
}

2.每次空間不夠時將vector陣列增大空間

void test_resize(int a)
{
    if(num == size_2-1)
    {
        q2.resize(size_2 += 10000);
    }
    q2[++num] = a;
    return ;
}

for(int i = 0; i != n; ++i)//main函式中
{ scanf("%d", &curr); test_resize(curr); }

3.scanf讀入

for(int i = 0; i != n; ++i)//main函式中
{
    scanf("%d", &x[i]);
}

4.讀入優化

int read()
{
    input = 0;
    a = getchar();  
    while(a < '0' || a > '9')
        a = getchar();
    while(a >= '0' && a <= '9')
    {
        input = input*10+a-'0';
        a = getchar();
    }
    return input;
}
for(int i = 0; i != n; ++i)
{
    x[i] = read();
}

5.讀入優化+resize(),再扔入vector陣列

void test_resize(int a)
{
    if(num == size_2-1)
    {
        q2.resize(size_2 += 10000);
    }
    q2[++num] = a;
    return ;
}

int read()
{
    input = 0;
    a = getchar();  
    while(a < '0' || a > '9')
        a = getchar();
    while(a >= '0' && a <= '9')
    {
        input = input*10+a-'0';
        a = getchar();
    }
    return input;
}

for(int i = 0; i != n; ++i)
{
    curr = read();
    test_resize(curr);
}

測試結果:
1.push_back()讀入

real    0m2.046s
user    0m1.620s
sys 0m0.428s

2.resize()後再讀入

real    0m1.743s
user    0m1.636s
sys 0m0.104s

3.scanf讀入

real    0m1.885s
user    0m1.776s
sys 0m0.108s

4.讀入優化

real    0m0.996s
user    0m0.948s
sys 0m0.044s

5.讀入優化+resize,再扔入vector陣列

real    0m1.121s
user    0m1.036s
sys 0m0.084s

讀入優化一騎絕塵,讀入優化+resize位居第二,scanf和resize大致相當,push_back()最慢。

結論:
當資料範圍很大的時候,建議使用vector的resize(lenth)+讀入優化的方式進行讀取,這樣既最大限度降低了記憶體的浪費,又保證了不會在讀入上花費太久

完整測試程式:

#include <bits/stdc++.h>
using namespace std;
#define maxn 10000005

vector<int> q1, q2, q3;
int n, curr, num = -1, size_1, size_2;
int x[maxn], input;
char a;

void test_resize(int a)
{
    if(num == size_2-1)
    {
        q2.resize(size_2 += 10000);
    }
    q2[++num] = a;
    return ;
}

int read()
{
    input = 0;
    a = getchar();  
    while(a < '0' || a > '9')
        a = getchar();
    while(a >= '0' && a <= '9')
    {
        input = input*10+a-'0';
        a = getchar();
    }
    return input;
}


int main()
{
    freopen("test.in", "r", stdin);
    scanf("%d", &n);
    for(int i = 0; i != n; ++i)
    {
        //x[i] = read();
        //curr = read();
        //test_resize(curr);
        //scanf("%d", &x[i]);
        //scanf("%d", &curr);
        //test_resize(curr);
        //q3.push_back(curr);
    }
    return 0;
}

測試自此結束。
箜瑟_qi 2017.04.07 13:55