MySQL怎麼存文字不亂碼

阿新 • • 發佈：2018-11-05

MySQL裡怎麼儲存那些看起來會亂碼的字元？我在“UTF8字符集的表怎麼直接轉UTF8MB4”一文中介紹瞭如何把表字符集由UTF8直接轉換成UTF8MB4的幾種方法。

導讀

MySQL裡怎麼儲存那些看起來會亂碼的字元？

我在“UTF8字符集的表怎麼直接轉UTF8MB4”一文中介紹瞭如何把表字符集由UTF8直接轉換成UTF8MB4的幾種方法。

1、只修改字符集（使用預設校驗集）

[email protected]> alter table t1 convert to character

set utf8mb4

2、同時修改表字符集和校驗集

[email protected]> alter table t1 convert to character set utf8mb4 collate utf8mb4_bin;

3、只修改某列的字符集

[email protected]> alter table t1 modify

c1 varchar(20) character set utf8mb4 not null default ‘’

4、同時修改某列的字符集和校驗集

[email protected]> alter table t1 modify c1 varchar(20) character set utf8mb4 collate utf8mb4_unicode_ci not

null default ‘’

好了，有個字符集為UTF8MB4的表中想儲存各類不同字符集的文字，有哪些注意事項億避免亂碼？

如果是通過WEB介面儲存資料，則建議在browser端、server端全都採用UTF8字符集，MySQL Server端採用UTF8/UTF8MB4均可（針對大多數文字，其實UTF8字符集就足夠儲存的了）。

其中，MySQL端的字符集設定比較讓人頭大，涉及到的字符集有好幾個：

character_set_server，server端預設字符集；
character_set_database，database預設字符集，若未設定，則和 character_set_server 的設定一樣；database中的資料表/stored procedure/stored function 也可以自行設定字符集，若未指定，則和 character_set_database 的設定一樣；資料表中的字元型別列，也可以單獨設定字符集，若未設定，則和該表指定的字符集一樣；
character_set_client，客戶端顯示讀取結果的字符集；
character_set_connection，客戶端從server端讀取資料時傳輸字符集；
character_set_results，server端將資料傳送給客戶端時的字符集；

可見，涉及到字符集的因素實在太多，因此我們強烈建議各個環節全部採用同一種字符集，避免出現意外狀況。

MySQL採用UTF8MB4字符集時，儲存文字實際消耗位元組數是由文字內容的位元組數決定的，並非總是需要4位元組，列舉幾種情況：

輸入字符集任意，且儲存ASCII字元時，每個字元需要1byte；
輸入字符集是GB2312，且儲存的字元是漢字時，每個字元需要2bytes；
輸入字符集是UTF8/UTF8MB4，且儲存的字元是低編碼漢字時，每個字元需要3bytes；
輸入字符集是UTF8/UTF8MB4，且儲存的字元是高編碼漢字時，每個字元需要4bytes；
輸入字符集是binary，且儲存的字元是高編碼漢字時，每個字元需要4bytes；

總結建議

從前端到後端（瀏覽器=>WEB Server=>MySQL連線層=>Server層=>DB層>TABLE層），儘可能使用同一種字符集；
儘可能採用大字符集，也就是優先順序：UTF8Mb4 > UTF8 > GBK > LATIN1；
採用邏輯備份資料時，切記要不定期進行恢復測試，我以前在這方面栽過一次，教訓慘痛。

附1，關於編碼簡介

ASCII碼，佔7bit，由128個字元組成，包括大小寫字母、數字0-9、標點符號、非列印字元（換行符、製表符等4個）以及控制字元（退格、響鈴等）組成；
latin1，佔1byte，在ASCII基礎上，增加128 ～ 255區間的字元；
GB2312等CJK字符集，可變長字符集，最多佔2bytes，用於儲存常見的CJK字元；
UTF8，可變長字符集，最多佔3bytes，可以囊括ASCII、CJK及其他絕大多數常用語言文字；這中間其實還有個UNICODE字符集，它也是2bytes的，也能囊括ASCII字元，但即便是ASCII字元也需要消耗2bytes，存在一定浪費，而用UTF8儲存ASCII字元時，實際只需要1byte，更為節省儲存空間；
UTF8MB4，可變長字符集，最多佔4bytes，可以包含上面其他幾種字符集；同樣地，以UTF8MB4儲存ASCII字元時，實際上也是隻佔用1bytes，儲存一般的漢字佔用3bytes，而儲存個別漢字則需要4bytes，儲存emoji也至少需要4bytes；

附2，字符集相容線上測試

為了方便大家，我寫了個簡單的PHP介面供測試，可以提交一些不常見的漢字，或者emoji表情符，看看是否都能正常顯示。

開發這個介面時，發現釘釘中的個別表情符是由2個4位元組編碼組成的，也就是說一個emoji表情符，其實是需要8個位元組的。

這個介面最後輸出的格式是：

字串 : 位元組數

比如 "a齒a : 5" ，表示 "a齒a" 這個字串共消耗 5個位元組，因為 "齒" 其實只需要3個位元組來儲存，雖然看起來挺大一坨的。

相應的程式碼如下：

select vchar, length(vchar) as vcharlen

測試介面連結： utf8mb4字符集相容性測試介面

如果想要寫入4位元組的漢字，可以從龍泉寺提供的字型檔拷貝過來，或者插入emoji表情符。

MySQL怎麼存文字不亂碼

MySQL裡怎麼儲存那些看起來會亂碼的字元？我在“UTF8字符集的表怎麼直接轉UTF8MB4”一文中介紹瞭如何把表字符集由UTF8直接轉換成UTF8MB4的幾種方法。導讀 MySQL裡怎麼儲存那些看起來會亂碼的字元？我在“UTF8字符集的表怎麼直接轉UT

記一次mysql中文字符亂碼的問題排查

mysql mysql中文亂碼 mysql字符集今天開發反應兩樣的程序往一個庫裏面插入數據正常，往另外一個庫裏面插入數據有亂碼。第一反應就是兩個數據庫關於字符集的配置不一樣。在兩個庫分別查看參數：show variables like "%char%";+--------------------

mysql存資料出現亂碼、問號的問題

注：我的MYSQL版本為5.6.25 1、快捷鍵win+r，然後輸入cmd進入dos命令視窗，然後輸入mysql進入mysql的控制檯，然後輸入 show variables like 'character_set_%'; 2、如果出現如下畫面（這是我的，可能你的不一樣

為什麼我直接在servlet裡面直接輸出message不亂碼，而跳轉到web頁面就出現亂碼，而且存到資料庫的也是亂碼，我嘗試了網上的各種方法，還是不成功。。

為什麼我直接在servlet裡面直接輸出message不亂碼，而跳轉到web頁面就出現亂碼，而且存到資料庫的也是亂碼，我嘗試了網上的各種方法，還是不成功。。 public class HandleRegister extends HttpServlet { public void i

mysql navicat編碼保持一致不亂碼

mysql在安裝的時候要指定utf-8,但是如果同時用navicat，則會出現二者編碼不能同步的問題，要麼mysql中文，navicat亂碼，要麼反之，大家按下面方法即可保持二者一致。navicat for mysql中文亂碼修改Navicat伺服器連線屬性及資料庫屬性重新

mysql 存中文亂碼

今天碰到一個問題，mysql 資料庫中某欄位存了一串中文，我將它讀取出來之後更新該挑記錄某個 int 欄位，然後再將資料存入資料庫，發現原本應該原封不動取出再存入的中文欄位變成亂碼了。參照下述文章，修改mysql的配置檔案（Windows版）：my.ini

MySQL存儲引擎

技術分享得到兼容不同的 mage 關系頻率 isam 將在概述數據庫存儲引擎是數據庫底層軟件組織，數據庫管理系統（DBMS）使用數據引擎進行創建、查詢、更新和刪除數據。不同的存儲引擎提供不同的存儲機制、索引技巧、鎖定水平等功能，使用不同的存儲引擎，還可以獲得特

mysql 存儲過程中報Illegal mix of collations

mysql 存儲過程 utf8_general_ci utf8_unicode_ci 我寫了一個存儲過程，裏邊有一個遊標，然後遍歷遊標，根據遍歷的結果update 另外一張表的值，這是大體情況；問題是在update的時候報：Illegal mix of collations (utf8_unic

mysql 存儲過程時間月份減法

sub sel har nth 過程 clas mon ndt span declare startTime VARCHAR(19) default ‘2014-00-00 00:00:00‘; declare tempTime VARCHAR(19) default

MySql存儲過程的作用及語法

時區輸出參數輸入 time 修改 total insert ram 最小值 MySQL使用存儲過程的作用 1、使用了存過程，很多相似性的刪除，更新，新增等操作就變得輕松了，並且以後也便於管理！ 2、存儲過程因為SQL語句已經預編繹過了，因此運行的速度比較快。 3、

mysql 存儲過程入門

釋放 rac 許可範圍組合接收參數 mit until 針對這篇文章主要介紹了MySql存儲過程與函數詳解,內容很詳細，需要的朋友可以參考下存儲過程和函數是在數據庫中定義一些SQL語句的集合，然後直接調用這些存儲過程和函數來執行已經定義好的SQL語句。存儲過

mysql存儲過程

多條資源全部 span 解決 cep 讀取 str into Life is not what you have gained but what you have done! SQL語句首先需要編譯，然後才運行，而存儲過程是為了完成某一功能的SQL集，經編譯後存儲在

MySql 存儲引擎的選取

數據集 htm apt 官方 add 保護 -m 導出數據 -a 存儲引擎是為不同的表類型處理 SQL 操作的 MySql 組件。InnoDB 是默認的、最通用的存儲引擎，也是官方推薦使用的存儲引擎，除非一些特定案例。MySql 5.6 中的 CREATE TABLE

mysql-存儲過程

bold lar fetch oop 調用方法 default clas font color 1、數據存儲：把多個sql語句封裝成一個方法 delimiter // 修改結束符 create procedure proc() begin select *

mysql之 mysql 5.6不停機主從搭建（一主一從基於GTID復制）

從庫 creat 不停機 event rep ply copy from end 環境說明：版本 version 5.6.25-log 主庫ip: 10.219.24.25從庫ip：10.219.24.22os 版本： centos 6.7已安裝熱備軟件：xtrabacku

mysql之 mysql 5.6不停機雙主一從搭建（活躍雙主一從基於日誌點復制）

stat 5.6 create 文件夾 eat ima send spec tar 環境說明：版本 version 5.6.25-log 主1庫ip: 10.219.24.25主2庫ip: 10.219.24.22從1庫ip：10.219.24.26os 版本： cento

mysql存儲過程-匯總學習

存儲 ont 數量 div 正常 where bold name 簡單的簡單的存儲過程插入語句 BEGIN INSERT into useraccount VALUES (10,10,3,‘2013-01-02‘,9);#RoauDtine body goes

mysql存儲引擎記錄

memory 服務器數據庫數據表安全性 MyISAM Mysql5.5之前的默認數據庫引擎，最為常用。擁有較高的插入，查詢速度，但不支持事務InnoDB事務型數據庫的首選引擎，支持ACID事務，支持行級鎖定,MySQL 5.5起成為默認數據庫引擎BDB源自Berkeley DB，事務

Identity server4改用MySQL存儲數據

startup 分享技術分享 pom .com 技術數據庫連接 ram 添加進入github下載Identity server4與ef core集成的源碼，源碼地址為：https://github.com/IdentityServer/IdentityServer4.

Mysql存儲過程和函數區別介紹

fill get .com href 參數 tle gravity 由於 target 原文鏈接存儲過程是用戶定義的一系列sql語句的集合，涉及特定表或其它對象的任務，用戶可以調用存儲過程，而函數通常是數據庫已定義的方法，它接收參數並返回某種類型的值並且不涉及特定用戶表。

MySQL怎麼存文字不亂碼

相關推薦