1. 程式人生 > >CSV檔案的使用-寫入/寫出(C++/Python)

CSV檔案的使用-寫入/寫出(C++/Python)

參考:

#########################################################################

CSV-逗號分隔符(Comma-Separatored Values,有時也可用字元分隔符,分隔字元不一定要使用逗號)

典型分隔符是逗號,分號或製表符

excel表格可以開啟csv檔案,如果分隔符使用的是逗號的話,表格可以按逗號分隔,但如果不是逗號的話,並不能分隔

新建一個檔案test.csv(利用逗號分隔):

hello,world
hai,hi

利用excel表格開啟


新建另一個檔案test2.csv(利用分號分隔):

hello;world
hai;hi

利用excel表格開啟:


並沒有按分號分隔

所以如果我們想要讀取表格資料時,可以先將表格儲存為csv檔案,然後利用分隔符','讀取表格資料

有時我們想要在資料中使用分隔符這時可以用雙引號:

test3.csv:

"adsf,asdfa",323
gadfasf,23


test4.csv:

"asdf'asdf',adf",32
"ads'asd',af",45


#########################################################33

C++實現

寫入CSV檔案:

#include <iostream>
#include <fstream>
#include <sstream>
#include <string>
#include <vector>
#include <io.h>
#include <time.h>
#include <direct.h>
#include <algorithm>
using namespace std;

//圖片地址
const char *address="D:\\VSProject\\CSVTest\\CSVTest\\images\\";
//csv儲存地址
const char *csv_addr="D:\\VSProject\\CSVTest\\CSVTest\\images.csv";

/**
 * @function: 獲取cate_dir目錄下的所有檔名
 * @param: cate_dir - const char指標型別
 * @result:vector<string>型別
*/
vector<string> getFiles(const char *cate_dir)
{
	vector<string> files;//存放檔名

#ifdef WIN32
	_finddata_t file;
	long lf;
	//輸入資料夾路徑
	if ((lf=_findfirst(cate_dir, &file)) == -1) {
		cout<<cate_dir<<" not found!!!"<<endl;
	} else {
		while(_findnext(lf, &file) == 0) {
			//輸出檔名
			//cout<<file.name<<endl;
			if (strcmp(file.name, ".") == 0 || strcmp(file.name, "..") == 0)
				continue;
			files.push_back(file.name);
		}
	}
	_findclose(lf);
#endif

#ifdef linux
	DIR *dir;
	struct dirent *ptr;
	char base[1000];
 
	if ((dir=opendir(cate_dir)) == NULL)
    {
		perror("Open dir error...");
        exit(1);
    }
 
	while ((ptr=readdir(dir)) != NULL)
	{
		if(strcmp(ptr->d_name,".")==0 || strcmp(ptr->d_name,"..")==0)    ///current dir OR parrent dir
		        continue;
		else if(ptr->d_type == 8)    ///file
			//printf("d_name:%s/%s\n",basePath,ptr->d_name);
			files.push_back(ptr->d_name);
		else if(ptr->d_type == 10)    ///link file
			//printf("d_name:%s/%s\n",basePath,ptr->d_name);
			continue;
		else if(ptr->d_type == 4)    ///dir
		{
			files.push_back(ptr->d_name);
			/*
		        memset(base,'\0',sizeof(base));
		        strcpy(base,basePath);
		        strcat(base,"/");
		        strcat(base,ptr->d_nSame);
		        readFileList(base);
			*/
		}
	}
	closedir(dir);
#endif

	//排序,按從小到大排序
	sort(files.begin(), files.end());
	return files;
}

/**
 * @function: 將圖片資訊以及對應ID寫入檔案,儲存為csv格式
 * @param: images - const vector<string>型別,圖片地址
 * @param: labels - const vector<int>型別,圖片ID
 * @param: addr - const char指標型別,儲存地址
 * @param: separator - char型別,分隔符,預設值為';'
*/
bool write_csv(const vector<string> images, const vector<int> labels, const char *addr, char separator=';')
{
	ofstream fout(addr);
	if (!fout.is_open())
	{
		cout<<addr<<" could not open "<<endl;
		return false;
	}

	for (int i=0; i<(int)images.size(); i++)
	{
		fout<<images[i];
		fout<<separator;
		fout<<labels[i]<<endl;
	}

	fout.close();
	return true;
}

int main()
{
	//獲取所有類別地址
	string image_address=(string)address+"*";
	vector<string> cates=getFiles(image_address.c_str());

	//圖片地址
	vector<string> images;
	//圖片ID
	vector<int> labels;
	for (int i=0; i<(int)cates.size(); i++)
	{
		//獲取類別絕對地址
		string cate_dir=(string)address+cates[i];
		//獲取圖片
		string cate_addr=cate_dir+"\\*";
		vector<string> imgs=getFiles(cate_addr.c_str());
		//判斷圖片是否存在
		if ((int)imgs.size() == 0)
		{
			cout<<cate_dir<<" can not find any images"<<endl;
			exit(1);
		}

		//設定絕對地址
		for (int j=0; j<(int)imgs.size(); j++)
		{
			string img_dir=cate_dir+"\\"+imgs[j];
			images.push_back(img_dir);
			labels.push_back(i+1);
		}
	}

	time_t start=clock();
	//製作csv檔案
	write_csv(images, labels, csv_addr);
	time_t end=clock();
	double time=(double)(end-start)/CLOCKS_PER_SEC; //計算函式使用時間,以秒計
	cout<<"write_csv() need time is "<<time<<" s."<<endl;

	cout<<"end..."<<endl;
	cin.get();
	return 0;
}

讀出CSV檔案:
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {
    std::ifstream file(filename.c_str(), ifstream::in);
    if (!file) {
        string error_message = "No valid input file was given, please check the given filename.";
        CV_Error(CV_StsBadArg, error_message);
    }
    string line, path, classlabel;
    while (getline(file, line)) {
        stringstream liness(line);
        getline(liness, path, separator);
        getline(liness, classlabel);
        if(!path.empty() && !classlabel.empty()) {
            images.push_back(imread(path, 0));
            labels.push_back(atoi(classlabel.c_str()));
        }
    }
}


#########################################################

python實現

#!/usr/bin/env python
#-*- coding: utf-8 -*-

'''
實現csv檔案的讀出,寫入功能
'''

__author__ = 'zj'

import time
import os

#csv檔案寫入,預設分隔符是';'
#引數csv_name表示儲存地址
#引數rows_list儲存寫入內容,是列表型別,每個元素代表一行輸入內容,同樣是列表型別
#例:rows_list=[[23,53,'123'], [434, 3, 'dfgv']]
def write_csv(csv_name, rows_list, separator=';'):
	start=time.clock()
	
	#開啟檔案
	fi=open(csv_name, 'w')
	#遍歷每一行
	for row in rows_list:
		#遍歷每一列
		for col in row:
			fi.write(str(col))
			fi.write(separator)
		#endfor
		fi.write("\n")
	#endfor
	fi.close()
	
	end=time.clock()
	print 'write_csv function need time :%f s'%(end-start)
#end of write_csv

#csv檔案讀出,預設分隔符是';'
#引數csv_name表示儲存地址
#引數rows_list儲存寫出內容,是列表型別,每個元素代表一行輸入內容,同樣是列表型別
#例:rows_list=[[23,53,'123'], [434, 3, 'dfgv']]
def read_csv(csv_name, rows_list, separator=';'):
	start=time.clock()

	#開啟檔案
	fi=open(csv_name, 'r')
	#讀取每一行
	for line in fi.readlines():
		#分隔每一列
		cols=line.split(separator)
		rows_list.append(cols)
	#endfor
	fi.close()

	end=time.clock()
	print 'read_csv function need time :%f s'%(end-start)
#end of read_csv

if __name__ == '__main__':
	#設定儲存地址
	address=os.path.join(os.getcwd(), "test.csv")
	#設定儲存內容
	rows_list=[[23,53,'123'], [434, 3, 'dfgv']]
	#寫入csv檔案	
	write_csv(address, rows_list, ';')
	
	lists=[]
	#讀出csv檔案
	read_csv(address, lists, ';')
	for line in lists:
		for param in line:
			print param+" ",
		#endfor		
		print
	#endfor
#endif