MySQL字符集亂碼總結
檢視資料庫編碼:
show create database db_name;
查看錶編碼:
show create table tbl_name;
檢視欄位編碼:
show full columns from tbl_name;
show full fields from tbl_name;
MySql 端配置
1. 修改my.ini檔案
[mysql]
default-character-set=utf8
說明:修改連結字符集和校對規則,它會同時設定character_set_client, character_set_connection, character_set_results
也可以修改
[mysqld]
default-character-set=utf8
說明: 這裡修改的是伺服器的字符集和校對規則。
檢視當前伺服器的字符集和校對規則:
mysql> show variables like ‘character_set_server’;
mysql> show variables like ‘collation_server’;
- 修改資料庫和表的字符集和校隊規則。
例如:
– Create Database.
drop database if exists HRDB;
create database HRDB DEFAULT CHARACTER SET utf8; # CHARSET=utf8
use HRDB;
– 角色表
create table HR_ROLE (
ID bigint not null auto_increment,
NAME varchar(20) not null unique,
primary key (ID)
) ENGINE=INNODB DEFAULT CHARACTER SET utf8; # CHARSET=utf8
檢視當前資料庫的字符集和校對規則:
mysql> show variables like ‘character_set_database’;
mysql> show variables like ‘collation_database’;
查看錶的字符集和校對規則:
mysql> show create table HR_ROLE \G;
MySQL字符集終極解決方案
開源資料庫MySQL從來都是中小企業構建web應用的首選,特別是和PHP配合簡直就是一對黃金搭檔,深受web開發人員的喜愛。但自從4.1以來MySQL加入了多字符集的支援,很多MySQL使用者發現中文居然不能使用了,顯示變成了一堆亂碼!以致於很多人還在使用3.24.58的老版本,最近上MySQL網站,發現居然不提供3.24版本的下載了,MySQL已經徹底放棄3.24版本了。好在我還留有一份windows版的copy,就當作紀念吧。
怎麼會產生亂碼現象的,怎麼解決?只要翻下網上的解決方案,馬上就可以得出答案:“在獲得連線之後執行一句set names ‘gb2312’”,但這樣做的原因是什麼呢?總結一下我的經驗。
MySQL處理連線時,外部連線傳送過來的SQL請求會根據以下順序進行轉換:
character_set_client //客戶連線所採用的字符集
|
character_set_connection //MySQL連線字符集
|
character_set_database //資料庫所採用的字符集(表,列)
|
character_set_results //客戶機顯示所採用的字符集
一. 產生亂碼的根本原因在於:
1.客戶機沒有正確地設定client字符集,導致原先的SQL語句被轉換成connection所指字符集,而這種轉換,是會丟失資訊的,如果client是utf8格式,那麼如果轉換成gb2312格式,這其中必定會丟失資訊,反之則不會丟失。一定要保證connection的字符集大於client字符集才能保證轉換不丟失資訊。
2. 資料庫字型沒有設定正確,如果資料庫字型設定不正確,那麼connection字符集轉換成database字符集照樣丟失編碼,原因跟上面一樣。
二.為什麼set names ‘gb2312’就可以了呢
set names ‘gb2312’相當於這三條語句:
set character_set_client = gb2312;
set character_set_connection = gb2312;
set character_set_results = gb2312;
這樣做的話,上述產生亂碼的原因1就不存在了,因為編碼格式都統一了,但是這樣做並不是萬金油。原因有:
1.你的client不一定是用gb2312編碼傳送SQL的,如果編碼不是gb2312那麼轉換成gb2312就會產生問題。
2.你的資料庫中的表不一定是gb2312格式,如果不是gb2312格式而是其他的比如說latin1,那麼在儲存字符集的時候就會產生資訊丟失。
綜上,終極解決方案如下:
1.首先要明確你的客戶端時候何種編碼格式,這是最重要的(IE6一般用utf8,命令列一般是gbk,一般程式是gb2312)
2.確保你的資料庫使用utf8格式,很簡單,所有編碼通吃。
3.一定要保證connection字符集大於等於client字符集,不然就會資訊丟失,比如: latin1 < gb2312 < gbk < utf8,若設定set character_set_client = gb2312,那麼至少connection的字符集要大於等於gb2312,否則就會丟失資訊
4.以上三步做正確的話,那麼所有中文都被正確地轉換成utf8格式儲存進了資料庫,為了適應不同的瀏覽器,不同的客戶端,你可以修改character_set_results來以不同的編碼顯示中文字型,由於utf8是大方向,因此web應用是我還是傾向於使用utf8格式顯示中文的。
以上就是我的心得了。附上連線原始碼,現行設定,程式中就可以不考慮字符集問題了
include “conf/system.php”;
class Connection {
private $conn;
function __construct() {
global mysql_port, mysql_user, $mysql_pass;
try {
mysql_ipaddr;port=mysql_db”, mysql_pass);
} catch (PDOException e->getMessage() . “
”;
die();
}
}
public function getConnection() {
if (this->conn->query(“set character_set_client = gb2312”); //客戶端使用gb2312格式
this->conn->query(“set character_set_results = utf8”); //顯示字符集使用utf8格式
return $this->conn;
}
}
public function closeConnection() {
if (this->conn = null;
}
}
}
Q: 在寫一個查詢條件時的問題:如我想寫一個欄位中包含“李”字的所有記錄 str%’ ;
顯示的記錄中除了包含”李”字的記錄,還有不包含“李”字的記錄。為什麼?
A: 在MySQL中,進行中文排序和查詢的時候,對漢字的排序和查詢結果是錯誤的。這種情況在MySQL的很多版本中都存在。如果這個問題不解決,那麼MySQL將無法實際處理中文。
出現這個問題的原因是:MySQL在查詢字串時是大小寫不敏感的,在編繹MySQL時一般以ISO-8859字符集作為預設的字符集,因此在比較過程中中文編碼字元大小寫轉換造成了這種現象。
現在mysql上遇到一個問題,我們的字符集是gb2312.在中文模糊查詢時,會有不相關的結果集.
從問題的根本原因分析,還有下面的問題。例:
漢字“不”的第1、2位元組ascii值分別為:178與187
漢字“安”的第1、2位元組ascii值分別為:176與178
漢字“花”的第1、2位元組ascii值分別為:187與168
聰明的人已經看出來了:在字串“安花”中模糊查詢字元“不”字時,mysql系統也會認為兩者匹配!
出現這個問題的原因是:MySQL在查詢字串時是大小寫不敏感的,在編繹MySQL時一般以ISO-8859字符集作為預設的字符集,因此在比較過程中中文編碼字元大小寫轉換造成了這種現象。
方法一:
解決方法是對於包含中文的欄位加上”binary”屬性,使之作為二進位制比較,例如將”name char(10)”改成”name char(10)binary”。
方法二:
如果你使用原始碼編譯MySQL,可以編譯MySQL時使用–with–charset=gbk 引數,這樣MySQL就會直接支援中文查詢和排序了。
方法三:
可以使用 Mysql 的 locate 函式來判斷。以上述問題為例,使用方法為:
SELECT * FROM table WHERE locate(field,’李’) > 0;
本站使用的就是這種方法,感覺還不錯。:P
方法四:
把您的Select語句改成這樣,SELECT * FROM TABLE WHERE FIELDS LIKE BINARY ‘%FIND%’即可!
升級的根本,如果想使用“正確”的字符集,還是先用mysqldump匯出成檔案,然後匯入。
MySQL 字符集查詢
1) status
[html] view plaincopyprint?
mysql> status;
mysql Ver 14.14 Distrib 5.1.54, for debian-linux-gnu (x86_64) using readline 6.2
Connection id: 74267
Current database:
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.16-log Source distribution
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: latin1
Client characterset: latin1
Conn. characterset: latin1
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 128 days 13 hours 4 min 59 sec
Threads: 1 Questions: 356155 Slow queries: 2 Opens: 3975 Flush tables: 1 Open tables: 256 Queries per second avg: 0.032
2)show variables like ‘collation_%’;
[sql] view plaincopyprint?
mysql> show variables like ‘collation_%’;
+———————-+——————-+
| Variable_name | Value |
+———————-+——————-+
| collation_connection | utf8_general_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+———————-+——————-+
3)show variables like ‘character_%’;
[sql] view plaincopyprint?
mysql> show variables like ‘character_%’;
+————————–+—————————-+
| Variable_name | Value |
+————————–+—————————-+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+————————–+—————————-+
4) show create table table_name;
[sql] view plaincopyprint?
mysql> show create table t1;
+——-+————————————
| Table | Create Table
+——-+————————————
| t1 | CREATE TABLE t1
(
id
int(11) NOT NULL,
c1
varchar(30) DEFAULT NULL,
PRIMARY KEY (id
)
) ENGINE=InnoDB DEFAULT CHARSET=gbk |
+——-+————————————
1 row in set (0.00 sec)
mysql> show full columns from t1;
+——-+————-+—————-+——+—–+-
| Field | Type | Collation | Null | Key |
+——-+————-+—————-+——+—–+-
| id | int(11) | NULL | NO | PRI |
| c1 | varchar(30) | gbk_chinese_ci | YES | |
+——-+————-+—————-+——+—–+-
5) show full fields from table_name;
[sql] view plaincopyprint?
mysql> show full fields from user_info;
+————+————-+——————-+——+—–+———+——-+———————————+———+
| Field | Type | Collation | Null | Key | Default | Extra | Privileges | Comment |
+————+————-+——————-+——+—–+———+——-+———————————+———+
| uid | bigint(18) | NULL | NO | | NULL | | select,insert,update,references | |
| mac_id | char(17) | latin1_swedish_ci | NO | | NULL | | select,insert,update,references | |
| name | varchar(50) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
| nickname | varchar(50) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
| gender | tinyint(1) | NULL | YES | | 0 | | select,insert,update,references | |
| age | varchar(7) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
+————+————-+——————-+——+—–+———+——-+———————————+———+
6)檢視mysql支援的字符集: show charset; 或 show char set;
[sql] view plaincopyprint?
mysql> show charset;
+———-+—————————–+———————+——–+
| Charset | Description | Default collation | Maxlen |
+———-+—————————–+———————+——–+
| big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
| dec8 | DEC West European | dec8_swedish_ci | 1 |
| cp850 | DOS West European | cp850_general_ci | 1 |
| hp8 | HP West European | hp8_english_ci | 1 |
| koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
| latin1 | cp1252 West European | latin1_swedish_ci | 1 |
| latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
| swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
| ascii | US ASCII | ascii_general_ci | 1 |
| ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
| sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
| hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 |
| tis620 | TIS620 Thai | tis620_thai_ci | 1 |
| euckr | EUC-KR Korean | euckr_korean_ci | 2 |
| koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
| gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
| greek | ISO 8859-7 Greek | greek_general_ci | 1 |
| cp1250 | Windows Central European | cp1250_general_ci | 1 |
| gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
| latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
| armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
| ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
| cp866 | DOS Russian | cp866_general_ci | 1 |
| keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
| macce | Mac Central European | macce_general_ci | 1 |
| macroman | Mac West European | macroman_general_ci | 1 |
| cp852 | DOS Central European | cp852_general_ci | 1 |
| latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
| cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
| utf16 | UTF-16 Unicode | utf16_general_ci | 4 |
| cp1256 | Windows Arabic | cp1256_general_ci | 1 |
| cp1257 | Windows Baltic | cp1257_general_ci | 1 |
| utf32 | UTF-32 Unicode | utf32_general_ci | 4 |
| binary | Binary pseudo charset | binary | 1 |
| geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
| cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
| eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
+———-+—————————–+———————+——–+
MySQL 字符集修改
MySQL中預設字符集的設定有四級:伺服器級,資料庫級,表級 ,欄位級。注意前三種均為預設設定,並不代表你的欄位最終會使用這個字符集設定。
MySQL中關於連線環境的字符集設定有 Client端,connection,results 通過這些引數,MySQL就知道你的客戶端工具用的是什麼字符集,結果集應該是什麼字符集。這樣MySQL就會做必要的翻譯,一旦這些引數有誤,自然會導致字串在轉輸過程中的轉換錯誤。基本上99%的亂碼由些造成。
0) 檢視預設資料庫集: status
[sql] view plaincopyprint?
mysql> status;
mysql Ver 14.14 Distrib 5.5.31, for debian-linux-gnu (x86_64) using readline 6.2
Connection id: 41
Current database: tvbss_01
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.31-0ubuntu0.12.04.1 (Ubuntu)
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: latin1
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 7 min 30 sec
Threads: 1 Questions: 131 Slow queries: 0 Opens: 239 Flush tables: 1 Open tables: 58 Queries per second avg: 0.291
說明: 通過 sudo apt-get install mysql-server 安裝的mysql,預設client和conn為utf8編碼,server和db為latin1編碼,修改client和conn編碼請繼續下看。
修改客戶端,伺服器級,資料庫級方法如下:
(1) 使用超級使用者root許可權,開啟 /etc/mysql/my.cnf
[email protected]:/# vi /etc/mysql/my.cnf
(2) 修改客戶端級,在 [client] 下新增一行:default-character-set=utf8
[html] view plaincopyprint?
[client]
default-character-set=utf8
port = 3306
socket = /var/run/mysqld/mysqld.sock
如果想修改client和conn為latin1,只需把utf8改為latin1,更多編碼格式請見下面:show charset;
(3) 修改伺服器級,在 [mysqld] 新增兩行: character-set-server=utf8 和 collation-server=utf8_general_ci
[html] view plaincopyprint?
[mysqld]
character-set-server=utf8
collation-server=utf8_general_ci
* Basic Settings
user = mysql
pid-file = /var/run/mysqld/mysqld.pid
socket = /var/run/mysqld/mysqld.sock
status 查詢結果發現: Server 和 Db 變成了 utf8
[sql] view plaincopyprint?
mysql> status;
mysql Ver 14.14 Distrib 5.5.31, for debian-linux-gnu (x86_64) using readline 6.2
Connection id: 42
Current database:
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.31-0ubuntu0.12.04.1 (Ubuntu)
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: utf8
Db characterset: utf8
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 19 sec
Threads: 1 Questions: 130 Slow queries: 0 Opens: 239 Flush tables: 1 Open tables: 58 Queries per second avg: 6.842
collation 和 character 查詢結果發現: collation_server 和 character_set_server 也都變成了 utf8
[sql] view plaincopyprint?
mysql> show variables like ‘character_%’;
+————————–+—————————-+
| Variable_name | Value |
+————————–+—————————-+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+————————–+—————————-+
mysql> show variables like ‘collation_%’;
+———————-+—————–+
| Variable_name | Value |
+———————-+—————–+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+———————-+—————–+
(4)修改資料庫字符集的兩種方法
a)修改db.opt檔案: vi /var/lib/mysql/your_dbname/db.opt # your_dbname是自己資料庫的名稱
[sql] view plaincopyprint?
default-character-set=latin1
default-collation=latin1_swedish_ci
修改為:
default-character-set=utf8
default-collation=utf8_general_ci
修改後發現:Db characterset 變為了 utf8
[sql] view plaincopyprint?
mysql> status;
mysql Ver 14.14 Distrib 5.5.31, for debian-linux-gnu (x86_64) using readline 6.2
Connection id: 42
Current database: tvbss_01
Current user: [email protected]
SSL: Not in use
Current pager: stdout
Using outfile: ”
Using delimiter: ;
Server version: 5.5.31-0ubuntu0.12.04.1 (Ubuntu)
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: utf8
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /var/run/mysqld/mysqld.sock
Uptime: 1 min 22 sec
Threads: 1 Questions: 142 Slow queries: 0 Opens: 239 Flush tables: 1 Open tables: 58 Queries per second avg: 1.731
b)命令列修改: mysql> use your_dbname; mysql> alter database your_dbname character set utf8; 結果同上。且此時命令列也修改了 /var/lib/mysql/your_dbname/db.opt 檔案的編碼為utf8(同方法a)
MySQL 表、欄位的字符集修改
1) 修改表的字符集: ALTER TABLE tbl_name CONVERT TO CHARACTER SET character_name [COLLATE utf8_general_ci]
修改表字符集示例: 資料庫表 tbl_name 從latin1 轉為 utf8
[sql] view plaincopyprint?
mysql> show create table db_name.tbl_name;
+————+——————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————+
| user_info | CREATE TABLE user_info
(
uid
bigint(18) NOT NULL,
name
varchar(50) DEFAULT NULL,
nickname
varchar(50) DEFAULT NULL,
gender
tinyint(1) DEFAULT ‘0’,
age
varchar(7) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+———–
mysql> alter table table db_name.tbl_name convert to character set utf8 collate utf8_general_ci;
mysql> show create table db_name.tbl_name;
+————+—————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————-+
| user_info | CREATE TABLE user_info
(
uid
bigint(18) NOT NULL,
name
varchar(50) DEFAULT NULL,
nickname
varchar(50) DEFAULT NULL,
gender
tinyint(1) DEFAULT ‘0’,
age
varchar(7) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
2)修改表的欄位字符集: ALTER TABLE tbl_name CHANGE column_name column_name CHARACTER SET character_name [COLLATE utf8_general_ci…];
修改表的欄位字符集示例: 欄位 name 從 utf8 轉為 latin1
[sql] view plaincopyprint?
mysql> show full fields from db_name.tbl_name;
+————+————-+—————–+——+—–+———+——-+———————————+———+
| Field | Type | Collation | Null | Key | Default | Extra | Privileges | Comment |
+————+————-+—————–+——+—–+———+——-+———————————+———+
| uid | bigint(18) | NULL | NO | | NULL | | select,insert,update,references | |
| name | varchar(50) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
| nickname | varchar(50) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
| gender | tinyint(1) | NULL | YES | | 0 | | select,insert,update,references | |
| age | varchar(7) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
+————+————-+—————–+——+—–+———+——-+———————————+———+
mysql> alter table db_name.tbl_name change name name varchar(50) character set latin1 collate latin1_swedish_ci;
mysql> show full fields from db_name.tbl_name;
+————+————-+——————-+——+—–+———+——-+———————————+———+
| Field | Type | Collation | Null | Key | Default | Extra | Privileges | Comment |
+————+————-+——————-+——+—–+———+——-+———————————+———+
| uid | bigint(18) | NULL | NO | | NULL | | select,insert,update,references | |
| name | varchar(50) | latin1_swedish_ci | YES | | NULL | | select,insert,update,references | |
| nickname | varchar(50) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
| gender | tinyint(1) | NULL | YES | | 0 | | select,insert,update,references | |
| age | varchar(7) | utf8_general_ci | YES | | NULL | | select,insert,update,references | |
+————+————-+—————–
MySQL 連線數
1) 檢視連線數
show variables like “max_connections”;
+—————–+——-+
| Variable_name | Value |
+—————–+——-+
| max_connections | 500 |
+—————–+——-+
2) 修改連線數(命令)
set global max_connections = 200;
+—————–+——-+
| Variable_name | Value |
+—————–+——-+
| max_connections | 200 |
+—————–+——-+
不用重啟就生效
3) 修改連線數(配置檔案)
sudo vi /etc/mysql/my.cnf
1)去掉註釋,修改為