1. 程式人生 > >CSV文件導入Mysql出現的亂碼等問題 (轉載)

CSV文件導入Mysql出現的亂碼等問題 (轉載)

一行 varchar data 找到 fma 命令 數據 格式 oca

將*.csv文件導入mysql可使用LOAD DATA INFILE,

概要寫法:

技術分享Load data in file

具體語法使用可參照:http://dev.mysql.com/doc/refman/5.1/zh/sql-syntax.html#load-data

如果一個表中只有英文字符則導入不出現問題,寫法也極其簡單:

LOAD DATA LOCAL INFILE ‘D:\\ports.csv’ INTO TABLE ports;

遇到的問題一:ports.csv文件中存在中文字符,導入數據後變成亂碼

首先修改表及字段的編碼方式

alter table ports character set gbk2312;
alter table ports modify port_chinese varchar(50) character set gbk2312;

通過 show create table ports 查看表及字段的編碼方式,當然也可以通過可視化工具修改字段的編碼格式

我導入的命令行具體寫法是:

LOAD DATA LOCAL INFILE ’D:\\ports.csv’ INTO TABLE ports FIELDS TERMINATED ‘,‘ ENCLOSED BY ‘”’ LINES TERMINATED BY ‘\r\n’ starting by’’;

但我修改以上兩項之後我導入數據依舊亂碼,我的CSV文件編碼格式是GBK,

在網絡上找到一篇關於此問題的文章:http://www.sqlstudy.com/sql_article.php?id=2008081901,借鑒於文章中的寫法修改語句如下:

LOAD DATA LOCAL INFILE ’D:\\ports.csv’ INTO TABLE ports character set gbk2312 FIELDS TERMINATED ‘,‘ ENCLOSED BY ‘”’ LINES TERMINATED BY ‘\r\n’ starting by ’’;

至此亂碼變成了正確的中文字符。

遇到的問題二:在導入數據後查看數據時發現CSV文件中第一行有效數據丟失,而多出三行怪異的無效數據行,而且在執行導入命令時有39個警告

首先我使用SHOW WARNINGS;命令查看提示的警告內容,發現CSV文件中的列標題導入數據庫中出現了N多警告,而出現數據錯誤的關鍵原因在 LINES TERMINATED BY ‘\r\n’ 這句中,因為第一行列標題並沒有以回車換行字符結束,第一行標題列在轉換過程出錯,也導致了第一行有效數據在導入過程中出現錯誤。我將csv文件中文件標題的最後一列標題加上一回車後保存數據,CSV中的第一行有效數據終於導入到數據中,但卻多一行標題行數據,通過IGNORE命令可解決。

最後的CSV導入命令行的寫法:

LOAD DATA LOCAL INFILE ’D:\\ports.csv’ INTO TABLE ports character set gbk2312 FIELDS TERMINATED ‘,‘ ENCLOSED BY ‘”’ LINES TERMINATED BY ‘\r\n’ starting by ’’ IGNORE 1 LINES;

CSV文件導入Mysql出現的亂碼等問題 (轉載)