mysql/Java服務端對emoji的支援與問題解決方法詳解
阿新 • • 發佈:2020-01-07
本文例項講述了mysql Java服務端對emoji的支援與問題解決方法。分享給大家供大家參考,具體如下:
問題描述
將底層抓取的微博資料存入mysql,有些資料存入失敗,檢視Tomcat後,核心錯誤資訊如下:
// 丟擲字符集不支援的異常
sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1
原因分析
- MYSQL 5.5 之前, utf8 編碼只支援1~3個位元組,即BMP這部分的unicode編碼區(基本就是0000~FFFF這一區)。
- Emoji表情是4個位元組,而mysql的utf8編碼最多3個位元組,所以導致資料插不進去
- 5.5之後,mysql加入utf8mb4編碼,可支援4個位元組,即一個字元最多能有4字元,因此utf8mb4編碼可支援更多的字符集。
- 因此,如果專案要儲存移動產品的使用者文字,必須將DB字符集從UTF8/GBK等傳統字符集升級到utf8mb4
【注】
- utf8mb4相容utf8,且比utf8能表示更多的字元。所以將DB字符集從UTF8或GBK等傳統字符集升級到utf8mb4時不用擔心字元的相容性問題
解決方法
過濾特殊的表情符
content = content.replaceAll("[\\x{10000}-\\x{10FFFF}]","");// 簡單粗暴,不人性化
升級資料庫字符集
1、utf8mb4支援的mysql版本為5.5.3+,若mysql低於該版本請先升級
2、修改database、table和column字符集
3、修改mysql配置檔案my.cnf(windows為my.ini),my.cnf一般在etc/mysql/目錄下,找到後在以下三部分裡新增如下內容:
[client] default-character-set = utf8mb4
[mysql] default-character-set = utf8mb4
[mysqld] character-set-client-handshake = FALSE character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci init_connect='SET NAMES utf8mb4'
4、重啟mysql並檢視字符集
在mysql命令列輸入:
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
重啟之前的字符集
重啟之後的字符集
【注】
- 必須保證以下欄位為utf8mb4
- character_set_client
- character_set_connection
- character_set_database
- character_set_results
- character_set_server
以上4步完成後,利用mysql客戶端navicat在表中手動加入Emoji表情⛄,若能儲存成功說明資料庫已升級成功。
這些字符集配置的具體區別參考 深入Mysql字符集設定
5、檢查伺服器端db配置檔案
// 配置spring時使用的連結如下: url="jdbc:mysql://localhost:3306/gzhou?allowMultiQueries=true&useUnicode=true&zeroDateTimeBehavior=convertToNull&transformedBitIsBoolean=true&autoReconnect=true&autoReconnectForPools=true&failOverReadOnly=false&maxReconnects=10" // 若characterEncoding=utf8mb4,插入資料時報錯Caused by: java.sql.SQLException: Unsupported character encoding 'utf8mb4' // 去掉characterEncoding或characterEncoding=utf8
Emoji表情
android系統中,搜狗、百度輸入法自帶Emoji表情。
【注】
如果系統之間Emoji表情符號不相容,只能看到方塊;
更多關於MySQL相關內容感興趣的讀者可檢視本站專題:《MySQL常用函式大彙總》、《MySQL日誌操作技巧大全》、《MySQL事務操作技巧彙總》、《MySQL儲存過程技巧大全》及《MySQL資料庫鎖相關技巧彙總》
希望本文所述對大家MySQL資料庫計有所幫助。