1. 程式人生 > >MySQL字符集亂碼總結

MySQL字符集亂碼總結

檢視資料庫編碼:
show create database db_name;

查看錶編碼:
show create table tbl_name;

檢視欄位編碼:
show full columns from tbl_name;
show full fields from tbl_name;

MySql 端配置
1. 修改my.ini檔案
[mysql]
default-character-set=utf8
說明:修改連結字符集和校對規則,它會同時設定character_set_client, character_set_connection, character_set_results

也可以修改
[mysqld]
default-character-set=utf8
說明: 這裡修改的是伺服器的字符集和校對規則。

檢視當前伺服器的字符集和校對規則:
mysql> show variables like ‘character_set_server’;
mysql> show variables like ‘collation_server’;

  1. 修改資料庫和表的字符集和校隊規則。
    例如:
    – Create Database.
    drop database if exists HRDB;
    create database HRDB DEFAULT CHARACTER SET utf8; # CHARSET=utf8
    use HRDB;

– 角色表
create table HR_ROLE (
ID bigint not null auto_increment,
NAME varchar(20) not null unique,
primary key (ID)
) ENGINE=INNODB DEFAULT CHARACTER SET utf8; # CHARSET=utf8

檢視當前資料庫的字符集和校對規則:
mysql> show variables like ‘character_set_database’;
mysql> show variables like ‘collation_database’;

查看錶的字符集和校對規則:
mysql> show create table HR_ROLE \G;

MySQL字符集終極解決方案
開源資料庫MySQL從來都是中小企業構建web應用的首選,特別是和PHP配合簡直就是一對黃金搭檔,深受web開發人員的喜愛。但自從4.1以來MySQL加入了多字符集的支援,很多MySQL使用者發現中文居然不能使用了,顯示變成了一堆亂碼!以致於很多人還在使用3.24.58的老版本,最近上MySQL網站,發現居然不提供3.24版本的下載了,MySQL已經徹底放棄3.24版本了。好在我還留有一份windows版的copy,就當作紀念吧。
怎麼會產生亂碼現象的,怎麼解決?只要翻下網上的解決方案,馬上就可以得出答案:“在獲得連線之後執行一句set names ‘gb2312’”,但這樣做的原因是什麼呢?總結一下我的經驗。

MySQL處理連線時,外部連線傳送過來的SQL請求會根據以下順序進行轉換:
character_set_client //客戶連線所採用的字符集
|
character_set_connection //MySQL連線字符集
|
character_set_database //資料庫所採用的字符集(表,列)
|
character_set_results //客戶機顯示所採用的字符集

一. 產生亂碼的根本原因在於:
1.客戶機沒有正確地設定client字符集,導致原先的SQL語句被轉換成connection所指字符集,而這種轉換,是會丟失資訊的,如果client是utf8格式,那麼如果轉換成gb2312格式,這其中必定會丟失資訊,反之則不會丟失。一定要保證connection的字符集大於client字符集才能保證轉換不丟失資訊。
2. 資料庫字型沒有設定正確,如果資料庫字型設定不正確,那麼connection字符集轉換成database字符集照樣丟失編碼,原因跟上面一樣。

二.為什麼set names ‘gb2312’就可以了呢
set names ‘gb2312’相當於這三條語句:
set character_set_client = gb2312;
set character_set_connection = gb2312;
set character_set_results = gb2312;
這樣做的話,上述產生亂碼的原因1就不存在了,因為編碼格式都統一了,但是這樣做並不是萬金油。原因有:
1.你的client不一定是用gb2312編碼傳送SQL的,如果編碼不是gb2312那麼轉換成gb2312就會產生問題。
2.你的資料庫中的表不一定是gb2312格式,如果不是gb2312格式而是其他的比如說latin1,那麼在儲存字符集的時候就會產生資訊丟失。

綜上,終極解決方案如下:
1.首先要明確你的客戶端時候何種編碼格式,這是最重要的(IE6一般用utf8,命令列一般是gbk,一般程式是gb2312)
2.確保你的資料庫使用utf8格式,很簡單,所有編碼通吃。
3.一定要保證connection字符集大於等於client字符集,不然就會資訊丟失,比如: latin1 < gb2312 < gbk < utf8,若設定set character_set_client = gb2312,那麼至少connection的字符集要大於等於gb2312,否則就會丟失資訊
4.以上三步做正確的話,那麼所有中文都被正確地轉換成utf8格式儲存進了資料庫,為了適應不同的瀏覽器,不同的客戶端,你可以修改character_set_results來以不同的編碼顯示中文字型,由於utf8是大方向,因此web應用是我還是傾向於使用utf8格式顯示中文的。

以上就是我的心得了。附上連線原始碼,現行設定,程式中就可以不考慮字符集問題了
include “conf/system.php”;

class Connection {
private $conn;

function __construct() {
global mysqlipaddr,mysql_port, mysqldb,mysql_user, $mysql_pass;

try {
this>conn=newPDO("mysql:host=mysql_ipaddr;port=mysqlport;dbname=mysql_db”, mysqluser,mysql_pass);
} catch (PDOException e) {  print “MySQL伺服器連線失敗: ” .e->getMessage() . “
”;
die();
}
}

public function getConnection() {
if (this->conn != null) {this->conn->query(“set character_set_client = gb2312”); //客戶端使用gb2312格式
this>conn>query(setcharactersetconnection=utf8);//使utf8this->conn->query(“set character_set_results = utf8”); //顯示字符集使用utf8格式
return $this->conn;
}
}

public function closeConnection() {
if (this->conn != null) {this->conn = null;
}
}
}

Q: 在寫一個查詢條件時的問題:如我想寫一個欄位中包含“李”字的所有記錄 str=;selectfromtablewherefieldlikestr%’ ;
顯示的記錄中除了包含”李”字的記錄,還有不包含“李”字的記錄。為什麼?
A: 在MySQL中,進行中文排序和查詢的時候,對漢字的排序和查詢結果是錯誤的。這種情況在MySQL的很多版本中都存在。如果這個問題不解決,那麼MySQL將無法實際處理中文。

出現這個問題的原因是:MySQL在查詢字串時是大小寫不敏感的,在編繹MySQL時一般以ISO-8859字符集作為預設的字符集,因此在比較過程中中文編碼字元大小寫轉換造成了這種現象。

現在mysql上遇到一個問題,我們的字符集是gb2312.在中文模糊查詢時,會有不相關的結果集.
從問題的根本原因分析,還有下面的問題。例:
漢字“不”的第1、2位元組ascii值分別為:178與187
漢字“安”的第1、2位元組ascii值分別為:176與178
漢字“花”的第1、2位元組ascii值分別為:187與168
聰明的人已經看出來了:在字串“安花”中模糊查詢字元“不”字時,mysql系統也會認為兩者匹配!
出現這個問題的原因是:MySQL在查詢字串時是大小寫不敏感的,在編繹MySQL時一般以ISO-8859字符集作為預設的字符集,因此在比較過程中中文編碼字元大小寫轉換造成了這種現象。

方法一:
解決方法是對於包含中文的欄位加上”binary”屬性,使之作為二進位制比較,例如將”name char(10)”改成”name char(10)binary”。

方法二:
如果你使用原始碼編譯MySQL,可以編譯MySQL時使用–with–charset=gbk 引數,這樣MySQL就會直接支援中文查詢和排序了。

方法三:
可以使用 Mysql 的 locate 函式來判斷。以上述問題為例,使用方法為:
SELECT * FROM table WHERE locate(field,’李’) > 0;
本站使用的就是這種方法,感覺還不錯。:P

方法四:
把您的Select語句改成這樣,SELECT * FROM TABLE WHERE FIELDS LIKE BINARY ‘%FIND%’即可!
升級的根本,如果想使用“正確”的字符集,還是先用mysqldump匯出成檔案,然後匯入。

MySQL 字符集查詢

1) status
[html] view plaincopyprint?

mysql> status;

mysql Ver 14.14 Distrib 5.1.54, for debian-linux-gnu (x86_64) using readline 6.2

Connection id: 74267
Current database:
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.16-log Source distribution
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: latin1
Client characterset: latin1
Conn. characterset: latin1
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 128 days 13 hours 4 min 59 sec

Threads: 1 Questions: 356155 Slow queries: 2 Opens: 3975 Flush tables: 1 Open tables: 256 Queries per second avg: 0.032

2)show variables like ‘collation_%’;
[sql] view plaincopyprint?
mysql> show variables like ‘collation_%’;
+———————-+——————-+
| Variable_name | Value |
+———————-+——————-+
| collation_connection | utf8_general_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+———————-+——————-+

3)show variables like ‘character_%’;
[sql] view plaincopyprint?
mysql> show variables like ‘character_%’;
+————————–+—————————-+
| Variable_name | Value |
+————————–+—————————-+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+————————–+—————————-+

4) show create table table_name;
[sql] view plaincopyprint?
mysql> show create table t1;
+——-+————————————
| Table | Create Table
+——-+————————————
| t1 | CREATE TABLE t1 (
id int(11) NOT NULL,
c1 varchar(30) DEFAULT NULL,
PRIMARY KEY (id)
) ENGINE=InnoDB DEFAULT CHARSET=gbk |
+——-+————————————
1 row in set (0.00 sec)

mysql> show full columns from t1;
+——-+————-+—————-+——+—–+-
| Field | Type | Collation | Null | Key |
+——-+————-+—————-+——+—–+-
| id | int(11) | NULL | NO | PRI |
| c1 | varchar(30) | gbk_chinese_ci | YES | |
+——-+————-+—————-+——+—–+-

5) show full fields from table_name;
[sql] view plaincopyprint?
mysql> show full fields from user_info;
+————+————-+——————-+——+—–+———+——-+———————————+———+
| Field | Type | Collation | Null | Key | Default | Extra | Privileges | Comment |
+————+————-+——————-+——+—–+———+——-+———————————+———+
| uid | bigint(18) | NULL | NO | | NULL | | select,insert,update,references | |
| mac_id | char(17) | latin1_swedish_ci | NO | | NULL | | select,insert,update,references | |
| name | varchar(50) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
| nickname | varchar(50) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
| gender | tinyint(1) | NULL | YES | | 0 | | select,insert,update,references | |
| age | varchar(7) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
+————+————-+——————-+——+—–+———+——-+———————————+———+

6)檢視mysql支援的字符集: show charset; 或 show char set;
[sql] view plaincopyprint?
mysql> show charset;
+———-+—————————–+———————+——–+
| Charset | Description | Default collation | Maxlen |
+———-+—————————–+———————+——–+
| big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
| dec8 | DEC West European | dec8_swedish_ci | 1 |
| cp850 | DOS West European | cp850_general_ci | 1 |
| hp8 | HP West European | hp8_english_ci | 1 |
| koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
| latin1 | cp1252 West European | latin1_swedish_ci | 1 |
| latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
| swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
| ascii | US ASCII | ascii_general_ci | 1 |
| ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
| sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
| hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 |
| tis620 | TIS620 Thai | tis620_thai_ci | 1 |
| euckr | EUC-KR Korean | euckr_korean_ci | 2 |
| koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
| gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
| greek | ISO 8859-7 Greek | greek_general_ci | 1 |
| cp1250 | Windows Central European | cp1250_general_ci | 1 |
| gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
| latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
| armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
| ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
| cp866 | DOS Russian | cp866_general_ci | 1 |
| keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
| macce | Mac Central European | macce_general_ci | 1 |
| macroman | Mac West European | macroman_general_ci | 1 |
| cp852 | DOS Central European | cp852_general_ci | 1 |
| latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
| cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
| utf16 | UTF-16 Unicode | utf16_general_ci | 4 |
| cp1256 | Windows Arabic | cp1256_general_ci | 1 |
| cp1257 | Windows Baltic | cp1257_general_ci | 1 |
| utf32 | UTF-32 Unicode | utf32_general_ci | 4 |
| binary | Binary pseudo charset | binary | 1 |
| geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
| cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
| eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
+———-+—————————–+———————+——–+

MySQL 字符集修改

MySQL中預設字符集的設定有四級:伺服器級,資料庫級,表級 ,欄位級。注意前三種均為預設設定,並不代表你的欄位最終會使用這個字符集設定。
MySQL中關於連線環境的字符集設定有 Client端,connection,results 通過這些引數,MySQL就知道你的客戶端工具用的是什麼字符集,結果集應該是什麼字符集。這樣MySQL就會做必要的翻譯,一旦這些引數有誤,自然會導致字串在轉輸過程中的轉換錯誤。基本上99%的亂碼由些造成。

0) 檢視預設資料庫集: status
[sql] view plaincopyprint?

mysql> status;

mysql Ver 14.14 Distrib 5.5.31, for debian-linux-gnu (x86_64) using readline 6.2

Connection id: 41
Current database: tvbss_01
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.31-0ubuntu0.12.04.1 (Ubuntu)
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: latin1
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 7 min 30 sec

Threads: 1 Questions: 131 Slow queries: 0 Opens: 239 Flush tables: 1 Open tables: 58 Queries per second avg: 0.291

說明: 通過 sudo apt-get install mysql-server 安裝的mysql,預設client和conn為utf8編碼,server和db為latin1編碼,修改client和conn編碼請繼續下看。

修改客戶端,伺服器級,資料庫級方法如下:
(1) 使用超級使用者root許可權,開啟 /etc/mysql/my.cnf
[email protected]:/# vi /etc/mysql/my.cnf

(2) 修改客戶端級,在 [client] 下新增一行:default-character-set=utf8
[html] view plaincopyprint?
[client]
default-character-set=utf8
port = 3306
socket = /var/run/mysqld/mysqld.sock
如果想修改client和conn為latin1,只需把utf8改為latin1,更多編碼格式請見下面:show charset;

(3) 修改伺服器級,在 [mysqld] 新增兩行: character-set-server=utf8 和 collation-server=utf8_general_ci
[html] view plaincopyprint?
[mysqld]
character-set-server=utf8
collation-server=utf8_general_ci

* Basic Settings

user = mysql
pid-file = /var/run/mysqld/mysqld.pid
socket = /var/run/mysqld/mysqld.sock

status 查詢結果發現: Server 和 Db 變成了 utf8
[sql] view plaincopyprint?

mysql> status;

mysql Ver 14.14 Distrib 5.5.31, for debian-linux-gnu (x86_64) using readline 6.2

Connection id: 42
Current database:
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.31-0ubuntu0.12.04.1 (Ubuntu)
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: utf8
Db characterset: utf8
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 19 sec

Threads: 1 Questions: 130 Slow queries: 0 Opens: 239 Flush tables: 1 Open tables: 58 Queries per second avg: 6.842

collation 和 character 查詢結果發現: collation_server 和 character_set_server 也都變成了 utf8
[sql] view plaincopyprint?
mysql> show variables like ‘character_%’;
+————————–+—————————-+
| Variable_name | Value |
+————————–+—————————-+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+————————–+—————————-+

mysql> show variables like ‘collation_%’;
+———————-+—————–+
| Variable_name | Value |
+———————-+—————–+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+———————-+—————–+

(4)修改資料庫字符集的兩種方法
a)修改db.opt檔案: vi /var/lib/mysql/your_dbname/db.opt # your_dbname是自己資料庫的名稱
[sql] view plaincopyprint?
default-character-set=latin1
default-collation=latin1_swedish_ci

修改為:

default-character-set=utf8
default-collation=utf8_general_ci
修改後發現:Db characterset 變為了 utf8
[sql] view plaincopyprint?

mysql> status;

mysql Ver 14.14 Distrib 5.5.31, for debian-linux-gnu (x86_64) using readline 6.2

Connection id: 42
Current database: tvbss_01
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.31-0ubuntu0.12.04.1 (Ubuntu)
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: utf8
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 1 min 22 sec

Threads: 1 Questions: 142 Slow queries: 0 Opens: 239 Flush tables: 1 Open tables: 58 Queries per second avg: 1.731

       b)命令列修改:  mysql> use your_dbname;    mysql> alter database your_dbname character set utf8;     結果同上。且此時命令列也修改了 /var/lib/mysql/your_dbname/db.opt 檔案的編碼為utf8(同方法a)

MySQL 表、欄位的字符集修改
1) 修改表的字符集: ALTER TABLE tbl_name CONVERT TO CHARACTER SET character_name [COLLATE utf8_general_ci]
修改表字符集示例: 資料庫表 tbl_name 從latin1 轉為 utf8
[sql] view plaincopyprint?
mysql> show create table db_name.tbl_name;
+————+——————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————+
| user_info | CREATE TABLE user_info (
uid bigint(18) NOT NULL,
name varchar(50) DEFAULT NULL,
nickname varchar(50) DEFAULT NULL,
gender tinyint(1) DEFAULT ‘0’,
age varchar(7) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+———–

mysql> alter table table db_name.tbl_name convert to character set utf8 collate utf8_general_ci;

mysql> show create table db_name.tbl_name;
+————+—————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————-+
| user_info | CREATE TABLE user_info (
uid bigint(18) NOT NULL,
name varchar(50) DEFAULT NULL,
nickname varchar(50) DEFAULT NULL,
gender tinyint(1) DEFAULT ‘0’,
age varchar(7) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |

2)修改表的欄位字符集: ALTER TABLE tbl_name CHANGE column_name column_name CHARACTER SET character_name [COLLATE utf8_general_ci…];
修改表的欄位字符集示例: 欄位 name 從 utf8 轉為 latin1
[sql] view plaincopyprint?
mysql> show full fields from db_name.tbl_name;
+————+————-+—————–+——+—–+———+——-+———————————+———+
| Field | Type | Collation | Null | Key | Default | Extra | Privileges | Comment |
+————+————-+—————–+——+—–+———+——-+———————————+———+
| uid | bigint(18) | NULL | NO | | NULL | | select,insert,update,references | |
| name | varchar(50) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
| nickname | varchar(50) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
| gender | tinyint(1) | NULL | YES | | 0 | | select,insert,update,references | |
| age | varchar(7) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
+————+————-+—————–+——+—–+———+——-+———————————+———+

mysql> alter table db_name.tbl_name change name name varchar(50) character set latin1 collate latin1_swedish_ci;

mysql> show full fields from db_name.tbl_name;
+————+————-+——————-+——+—–+———+——-+———————————+———+
| Field | Type | Collation | Null | Key | Default | Extra | Privileges | Comment |
+————+————-+——————-+——+—–+———+——-+———————————+———+
| uid | bigint(18) | NULL | NO | | NULL | | select,insert,update,references | |
| name | varchar(50) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
| nickname | varchar(50) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
| gender | tinyint(1) | NULL | YES | | 0 | | select,insert,update,references | |
| age | varchar(7) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
+————+————-+—————–

MySQL 連線數
1) 檢視連線數
show variables like “max_connections”;
+—————–+——-+
| Variable_name | Value |
+—————–+——-+
| max_connections | 500 |
+—————–+——-+

2) 修改連線數(命令)
set global max_connections = 200;
+—————–+——-+
| Variable_name | Value |
+—————–+——-+
| max_connections | 200 |
+—————–+——-+
不用重啟就生效

3) 修改連線數(配置檔案)
sudo vi /etc/mysql/my.cnf
1)去掉註釋,修改為