1. 程式人生 > 程式設計 >mysql/Java服務端對emoji的支援與問題解決方法詳解

mysql/Java服務端對emoji的支援與問題解決方法詳解

本文例項講述了mysql Java服務端對emoji的支援與問題解決方法。分享給大家供大家參考,具體如下:

問題描述

將底層抓取的微博資料存入mysql,有些資料存入失敗,檢視Tomcat後,核心錯誤資訊如下:

// 丟擲字符集不支援的異常
sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1

原因分析

  • MYSQL 5.5 之前, utf8 編碼只支援1~3個位元組,即BMP這部分的unicode編碼區(基本就是0000~FFFF這一區)。
  • Emoji表情是4個位元組,而mysql的utf8編碼最多3個位元組,所以導致資料插不進去
  • 5.5之後,mysql加入utf8mb4編碼,可支援4個位元組,即一個字元最多能有4字元,因此utf8mb4編碼可支援更多的字符集。
  • 因此,如果專案要儲存移動產品的使用者文字,必須將DB字符集從UTF8/GBK等傳統字符集升級到utf8mb4

【注】

  • utf8mb4相容utf8,且比utf8能表示更多的字元。所以將DB字符集從UTF8或GBK等傳統字符集升級到utf8mb4時不用擔心字元的相容性問題

解決方法

過濾特殊的表情符

content = content.replaceAll("[\\x{10000}-\\x{10FFFF}]","");// 簡單粗暴,不人性化

升級資料庫字符集

1、utf8mb4支援的mysql版本為5.5.3+,若mysql低於該版本請先升級

2、修改database、table和column字符集

3、修改mysql配置檔案my.cnf(windows為my.ini),my.cnf一般在etc/mysql/目錄下,找到後在以下三部分裡新增如下內容:

[client] default-character-set = utf8mb4

[mysql] default-character-set = utf8mb4

[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'

4、重啟mysql並檢視字符集

在mysql命令列輸入:

SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';

重啟之前的字符集

重啟之後的字符集

【注】

  • 必須保證以下欄位為utf8mb4
    • character_set_client
    • character_set_connection
    • character_set_database
    • character_set_results
    • character_set_server

以上4步完成後,利用mysql客戶端navicat在表中手動加入Emoji表情⛄,若能儲存成功說明資料庫已升級成功。

這些字符集配置的具體區別參考 深入Mysql字符集設定

5、檢查伺服器端db配置檔案

// 配置spring時使用的連結如下:
url="jdbc:mysql://localhost:3306/gzhou?allowMultiQueries=true&useUnicode=true&zeroDateTimeBehavior=convertToNull&transformedBitIsBoolean=true&autoReconnect=true&autoReconnectForPools=true&failOverReadOnly=false&maxReconnects=10"
// 若characterEncoding=utf8mb4,插入資料時報錯Caused by: java.sql.SQLException: Unsupported character encoding 'utf8mb4'
// 去掉characterEncoding或characterEncoding=utf8

Emoji表情

android系統中,搜狗、百度輸入法自帶Emoji表情。

【注】

如果系統之間Emoji表情符號不相容,只能看到方塊;

更多關於MySQL相關內容感興趣的讀者可檢視本站專題:《MySQL常用函式大彙總》、《MySQL日誌操作技巧大全》、《MySQL事務操作技巧彙總》、《MySQL儲存過程技巧大全》及《MySQL資料庫鎖相關技巧彙總》

希望本文所述對大家MySQL資料庫計有所幫助。