關於vector push_back()與其他方式讀取資料的效率對比

阿新 • • 發佈：2019-02-19

引言：
在讀取大量資料（陣列）時，使用vector會盡量保證不會炸空間（MLE），但是相比於scanf的讀取方式會慢上不少。但到底效率相差有多大，我們將通過對比測試得到結果。

測試資料：利用srand()函式生成1e7的隨機陣列（x[i] ∈ (0, 115000]），最終結果將是讀取這1e7（一千萬）的陣列所消耗的時間。

測試環境：在Linux虛擬機器下測試，利用編譯命令：time ./t得到執行時間。

備註：在debug模式下執行，不開任何優化。

生成資料程式碼：

#include <bits/stdc++.h>
using namespace std;

const 
 int maxn = 10000005, lenth = 115000;

int n, x, y;

int main()
{
    freopen("test.in", "w", stdout);

    cout << maxn << endl;
    srand((unsigned int) time(0));
    for(int i = 0; i != maxn; ++i)
    {
        x = rand()%lenth+1;
        cout << x << endl;
    }

    fclose(stdout);
    return 
 0;
}

對比讀入：
1.正常使用push_back()讀入

for(int i = 0; i != n; ++i)
{
    scanf("%d", &curr);
    q1.push_back(curr);
}

2.每次空間不夠時將vector陣列增大空間

void test_resize(int a)
{
    if(num == size_2-1)
    {
        q2.resize(size_2 += 10000);
    }
    q2[++num] = a;
    return ;
}

for(int i = 0; i != n; ++i)//main函式中 

{
    scanf("%d", &curr);
    test_resize(curr);
}

3.scanf讀入

for(int i = 0; i != n; ++i)//main函式中
{
    scanf("%d", &x[i]);
}

4.讀入優化

int read()
{
    input = 0;
    a = getchar();  
    while(a < '0' || a > '9')
        a = getchar();
    while(a >= '0' && a <= '9')
    {
        input = input*10+a-'0';
        a = getchar();
    }
    return input;
}
for(int i = 0; i != n; ++i)
{
    x[i] = read();
}

5.讀入優化+resize()，再扔入vector陣列

void test_resize(int a)
{
    if(num == size_2-1)
    {
        q2.resize(size_2 += 10000);
    }
    q2[++num] = a;
    return ;
}

int read()
{
    input = 0;
    a = getchar();  
    while(a < '0' || a > '9')
        a = getchar();
    while(a >= '0' && a <= '9')
    {
        input = input*10+a-'0';
        a = getchar();
    }
    return input;
}

for(int i = 0; i != n; ++i)
{
    curr = read();
    test_resize(curr);
}

測試結果：
1.push_back()讀入

real    0m2.046s
user    0m1.620s
sys 0m0.428s

2.resize()後再讀入

real    0m1.743s
user    0m1.636s
sys 0m0.104s

3.scanf讀入

real    0m1.885s
user    0m1.776s
sys 0m0.108s

4.讀入優化

real    0m0.996s
user    0m0.948s
sys 0m0.044s

5.讀入優化+resize，再扔入vector陣列

real    0m1.121s
user    0m1.036s
sys 0m0.084s

讀入優化一騎絕塵，讀入優化+resize位居第二，scanf和resize大致相當，push_back()最慢。

結論：
當資料範圍很大的時候，建議使用vector的resize(lenth)+讀入優化的方式進行讀取，這樣既最大限度降低了記憶體的浪費，又保證了不會在讀入上花費太久。

完整測試程式：

#include <bits/stdc++.h>
using namespace std;
#define maxn 10000005

vector<int> q1, q2, q3;
int n, curr, num = -1, size_1, size_2;
int x[maxn], input;
char a;

void test_resize(int a)
{
    if(num == size_2-1)
    {
        q2.resize(size_2 += 10000);
    }
    q2[++num] = a;
    return ;
}

int read()
{
    input = 0;
    a = getchar();  
    while(a < '0' || a > '9')
        a = getchar();
    while(a >= '0' && a <= '9')
    {
        input = input*10+a-'0';
        a = getchar();
    }
    return input;
}


int main()
{
    freopen("test.in", "r", stdin);
    scanf("%d", &n);
    for(int i = 0; i != n; ++i)
    {
        //x[i] = read();
        //curr = read();
        //test_resize(curr);
        //scanf("%d", &x[i]);
        //scanf("%d", &curr);
        //test_resize(curr);
        //q3.push_back(curr);
    }
    return 0;
}

測試自此結束。
箜瑟_qi 2017.04.07 13:55

關於vector push_back()與其他方式讀取資料的效率對比

引言：在讀取大量資料（陣列）時，使用vector會盡量保證不會炸空間（MLE），但是相比於scanf的讀取方式會慢上不少。但到底效率相差有多大，我們將通過對比測試得到結果。測試資料：利用srand()函式生成1e7的隨機陣列（x[i] ∈ (0,

Go語言三種方式讀取檔案效率對比及原因分析

最近有遇到需要用go讀取大檔案的情況，順路研究了一下go幾種讀取檔案方式的效率。 go幾種常見的檔案io方式使用os包內的open和read。 fi, err := os.Open(path) // 開啟檔案 buf := make([]byte, 102

SparkStreaming與kafka通過直連方式讀取資料

1、Spark-Streaming的receive的方式和直連方式有什麼區別: Receive接收固定時間間隔的資料（放在記憶體中），達到固定的時間才進行處理，效率低並且容易丟失資料（Kafka高階API），自動維護偏移量 Direct直連方式，相當於直接連線到Kafka的分割槽上，相當於K

Tensorflow中使用tfrecord方式讀取資料

前言本部落格預設讀者對神經網路與Tensorflow有一定了解，對其中的一些術語不再做具體解釋。並且本部落格主要以圖片資料為例進行介紹，如有錯誤，敬請斧正。使用Tensorflow訓練神經網路時，我們可以用多種方式來讀取自己的資料。如果資料集比較小，而且

Tensorflow中使用tfrecord，佇列方式讀取資料

標準TensorFlow格式有一種儲存記錄的方法可以允許你講任意的資料轉換為TensorFlow所支援的格式，這種方法可以使TensorFlow的資料集更容易與網路應用架構相匹配。這種建議的方法就是使用TFRecords檔案，TFRecords檔案包含了tf.

使用 Flex 佈局與其他普通佈局的簡單對比

最近使用 flex 佈局來做各種居中真的帶來了不少方便，現在來總結一下平時的普通佈局是怎樣使用 flex 佈局來實現一樣的效果。一、左右 1:1 佈局佈局： <div class="container"> <div class="child">LEFT</div&g

SIFT演算法與SURF演算法特徵檢測效率對比

SIFT和SURF演算法都是特徵檢測中較常用的演算法，SURF是對SIFT的一種改進，尤其在效率上有明顯提升。下面的實驗給出了SIFT演算法和SURF演算法在特徵檢測效率上的對比， SURF特徵檢測中的綠色箭頭表示暗背景中的亮點(laplacian符號為0)，粉色箭頭

LinkedList和ArrayList在尾部插入資料效率對比

做這個實驗之前，我的猜想的是：因為每次都是在尾部插入資料，而LinkedLiist裡面有一個last指標一直指向最後一個元素，而ArrayList則根據索引來找到最後一個元素，那麼，這兩個方式中，效率應該是差不多的；但是實驗結果卻不是這樣的；先看程式碼： packa

事務提交大量sql與合併提交大量sql效率對比

事務提交5000條update，耗時：13.79 秒，記憶體佔用：17.88 MB（大量時間消耗在Query生成sql語句上） $startTime = microtime(true); $startMemory = memory_get_usage(); $tran

與其他系統介面對接（java），json格式資料傳遞···OkHttpClient方式

上一種方式HttpURLConnection方式出現了點問題，就是在idea中啟動服務一切正常。當時用tomcat部署專案時候，對方介面接收引數出現中文亂碼問題。用了很多方式都沒有解決，不知有沒有大佬可以解決引入依賴 <dependency>

與其他系統介面對接（java），json格式資料傳遞···HttpURLConnection方式

這個操作是與****系統進行資料介面的對接，本系統向****系統傳遞幾個引數，****系統接收並返回值。目錄 post請求方式 @Service層工具類ResultUtil pom需要新增的依賴 get請求方式另一種 OkHttpClient 方式 post

文本與集合的讀取寫入方式總結

void space -1 方式 static div throws col arraylist //1.從文本中讀取並添加到集合,按行讀取 1 public static void main(String[] args) throws IOException { 2

python性能優化、內存優化、內存泄露；與其他語音比較效率如何？

語音 gpo .org .html www. com log .cn amp 1、內存泄露：http://www.cnblogs.com/xybaby/p/7491656.html 2、內存優化：http://www.cnblogs.com/xybaby/p/7488216

一種業務系統與工作流系統資料交換的方式

一種業務系統與工作流系統資料交換的方式工作流系統作為業務系統的業務流程驅動支撐，提供必要的工作流基本功能，如任務提交，撤回，掛起，終止，獲取待辦事項，路由計算等等。除此之外，還提供流程圖設計，參與人指定等流程定義功能。以上工作不可避免地用到業務系統的資料，比如根據業務資料（借款單）的資料進行路由判斷，計算

依賴注入的兩種常用方式(構造器和Setter)與注入內容(裝配資料)——Spring IOC/DI（三）

本章主要講解一下Spring中依賴注入方式，接上一章依賴注入原理和方式： https://blog.csdn.net/qq_34598667/article/details/83315669 依賴注入常用的兩種方式以及注入的內容(裝配資料) Spring通過DI（依賴注入）實現I

基於前端框架react或者vue或者其他其他框架到出資料生成csv檔案,以及匯入csv檔案讀取資料的簡單例子

1.用npm在專案中安裝以下外掛: npm install file-saver --save npm install papaparse --save npm install jschardet --save npm install iconv-lite --save npm install

tensorflow讀取資料的方式

轉載：https://blog.csdn.net/u014038273/article/details/77989221 TensorFlow程式讀取資料一共有四種方法（一般針對影象）: 供給資料(Feeding)：在TensorFlow程式執行的每一步，讓Python程式碼來供給資

C++學習筆記（二）：開啟檔案、讀取資料、資料定位與資料寫入

1.開啟二進位制檔案（fopen）、讀取資料（fread），應用示例如下： FILE *fp = fopen("data.yuv", "rb+"); //開啟當前目錄中的data.yuv檔案 char *buffer = ( char*) malloc (sizeof(char)*FrameSi

非阻塞方式下Socket讀取資料的一個例子

發信人: lBlade (刀鋒), 信區: Delphi 標題: Re: 斑竹幫忙看看偶這段Socket程式!救救我! (轉載)發信站: BBS 水木清華站 (Tue Jan 11 14:22:56 2000)【在 windlike (風花雪月) 的大作中提到: 】: 多謝指教！: 我去大富

IOS之BLE藍芽讀取資料與寫入資料

1.本篇文章歸納了詳細的藍芽讀取，與藍芽寫入的通訊。 2.藉助公司最近一直研發藍芽裝置專案，博主一路走過來，也遇到不少的坑，希望在此能夠給予更多看官的幫助。藍芽的讀取 UUID的主要類檔案，歸納放置在一個檔案：Constants.h #define APP

關於vector push_back()與其他方式讀取資料的效率對比

相關推薦