1. 程式人生 > >ios::sync_with_stdio(false) 詳細解釋

ios::sync_with_stdio(false) 詳細解釋

在競賽中,遇到大資料時,往往讀檔案成了程式執行速度的瓶頸,需要更快的讀取方式。相信幾乎所有的C++學習者都在cin機器緩慢的速度上栽過跟頭,於是從此以後發誓不用cin讀資料。還有人說Pascal的read語句的速度是C/C++中scanf比不上的,C++選手只能乾著急。難道C++真的低Pascal一等嗎?答案是不言而喻的。一個進階的方法是把資料一下子讀進來,然後再轉化字串,這種方法傳說中很不錯,但具體如何從沒試過,因此今天就索性把能想到的所有的讀資料的方式都測試了一邊,結果是驚人的。

競賽中讀資料的情況最多的莫過於讀一大堆整數了,於是我寫了一個程式,生成一千萬個隨機數到data.txt中,一共55MB。然後我寫了個程式主幹計算執行時間,程式碼如下:

最簡單的方法就算寫一個迴圈scanf了,程式碼如下:

#include <ctime>  
int main()  
{  
    int start = clock();  
    //DO SOMETHING  
    printf("%.3lf\n",double(clock()-start)/CLOCKS_PER_SEC);  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

最簡單的方法就算寫一個迴圈scanf了,程式碼如下:

int numbers[MAXN];  
void
scanf_read() { freopen("data.txt","r",stdin); for (int i=0;i<MAXN;i++) scanf("%d",&numbers[i]); }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

可是效率如何呢?在我的電腦Linux平臺上測試結果為2.01秒。接下來是cin,程式碼如下

const int MAXN = 10000000;  

int numbers[MAXN];  

void cin_read()  
{ 
    freopen("data.txt"
,"r",stdin); for (int i=0;i<MAXN;i++) std::cin >> numbers[i]; }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

出乎我的意料,cin僅僅用了6.38秒,比我想象的要快。cin慢是有原因的,其實預設的時候,cin與stdin總是保持同步的,也就是說這兩種方法可以混用,而不必擔心檔案指標混亂,同時cout和stdout也一樣,兩者混用不會輸出順序錯亂。正因為這個相容性的特性,導致cin有許多額外的開銷,如何禁用這個特性呢?只需一個語句std::iOS::sync_with_stdio(false);,這樣就可以取消cin於stdin的同步了。程式如下:

const int MAXN = 10000000;  

int numbers[MAXN];  

void cin_read_nosync()  
{  
    freopen("data.txt","r",stdin);  
    std::ios::sync_with_stdio(false);  
    for (int i=0;i<MAXN;i++)  
        std::cin >> numbers[i];  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

取消同步後效率究竟如何?經測試執行時間銳減到了2.05秒,與scanf效率相差無幾了!有了這個以後可以放心使用cin和cout了。 
接下來讓我們測試一下讀入整個檔案再處理的方法,首先要寫一個字串轉化為陣列的函式,程式碼如下

const int MAXS = 60*1024*1024;  
char buf[MAXS];  

void analyse(char *buf,int len = MAXS)  
{  
    int i;  
    numbers[i=0]=0;  
    for (char *p=buf;*p && p-buf<len;p++)  
        if (*p == ' ')  
            numbers[++i]=0;  
        else  
            numbers[i] = numbers[i] * 10 + *p - '0';  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

把整個檔案讀入一個字串最常用的方法是用fread,程式碼如下:

const int MAXN = 10000000;  
const int MAXS = 60*1024*1024;  

int numbers[MAXN];  
char buf[MAXS];  

void fread_analyse()  
{  
    freopen("data.txt","rb",stdin);  
    int len = fread(buf,1,MAXS,stdin);  
    buf[len] = '\0';  
    analyse(buf,len);  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

上述程式碼有著驚人的效率,經測試讀取這10000000個數只用了0.29秒,效率提高了幾乎10倍!掌握著種方法簡直無敵了,不過,我記得fread是封裝過的read,如果直接使用read,是不是更快呢?程式碼如下:

const int MAXN = 10000000;  
const int MAXS = 60*1024*1024;  

int numbers[MAXN];  
char buf[MAXS];  

void read_analyse()  
{  
    int fd = open("data.txt",O_RDONLY);  
    int len = read(fd,buf,MAXS);  
    buf[len] = '\0';  
    analyse(buf,len);  
}