1. 程式人生 > >對於CSV檔案型別的解釋

對於CSV檔案型別的解釋

CSV

 

(逗號分隔值檔案格式)

 
逗號分隔值(Comma-Separated Values,CSV,有時也稱為字元分隔值,因為分隔字元也可以不是逗號),其檔案以純文字形式儲存表格資料(數字和文字)。純文字意味著該檔案是一個字元序列,不含必須像二進位制數字那樣被解讀的資料。CSV檔案由任意數目的記錄組成,記錄間以某種換行符分隔;每條記錄由欄位組成,欄位間的分隔符是其它字元或字串,最常見的是逗號或製表符。通常,所有記錄都有完全相同的欄位序列。通常都是純文字檔案。建議使用WORDPAD或是記事本(NOTE)來開啟,再則先另存新檔後用EXCEL開啟,也是方法之一。CSV檔案格式的通用標準並不存在,但是在RFC 4180中有基礎性的描述。使用的字元編碼同樣沒有被指定,但是7-bit
ASCII
是最基本的通用編碼。

這些都是客套話,我來通俗的解釋一下:

  • 由於本人的部落格中爬蟲儲存資料並沒有使用資料庫儲存,而是使用.CSV檔案儲存,所以特此寫下此文來解釋該型別檔案
  • 首先,CSV其實就是文字檔案,而並不是表格,至於為什麼可以用Excel開啟,我覺得這是Microsoft爸爸的一個善舉
  • 其次,.csv 和 .xls區別在於,1.xls只能用excel開啟,而且,xls與csv的編碼格式也不一樣,簡單來說,csv可以用文字(txt)開啟也可以用excle開啟,而xls只能用excel開啟
  • 最後,如何在csv與xls之間抉擇呢?這裡我們要弄清楚幾個問題,csv只是單純的文字檔案,同樣的,也只是單純的以文字格式儲存,只是Microsoft爸爸給我們了一種表格的展示,這意味著:
    csv無法生成公式、依賴,也無法儲存公式、依賴!所以,如果單純的只是儲存文字格式的資料,可以直接選擇使用csv檔案,讀寫方便,易於實現,資料可以表格化展示,這就是優點!

注意:CSV檔案可以通過改變檔案字尾名或者通過excel工具強制轉換成.xls檔案,但是要注意亂碼問題。