解決使用Pyodbc向MSSQL插入unicode字元亂碼的問題

阿新 • • 發佈：2018-11-01

——這個問題煩擾了我將近3個星期。

重要提醒：想看解決方案的直接拖到最後，這中間的過程，急性子的人可以不用看。

問題描述：

現有：

1. unicode字串：a = "測試" ；

2. 資料庫SQL Server 2008表 t(name nvarchar(100))

3. linux主機：CentOS6.7 64bit（run in docker）

4. 驅動及介面：unixODBC2.2.14、FreeTDS0.9.1、pyodbc3.0.10

想要把這個a字串插入到t表中。

就這麼簡單。

實際上，這個並不簡單，unicode字串通過pyodbc插入到sqlserver裡面的時候，會變成：

?μ?èˉ?

KÕ

之類的東東，俗稱亂碼。

問題的詳細描述請看我在論壇的發帖：求助：Linux下使用Pyodbc插入資料到MSSQL中文亂碼 [問題點數：100分]

CSDN確實不夠給力。

只有一條回帖，而且沒有啥價值（給點提示和意見都好啊~哭）。

簡單的來說，就是，windows下能正常執行的程式碼，插入中文無壓力，到了linux下，就不行了，插入的是亂碼。

而且最怪異的是pyodbc用的是freetds的驅動，在freetds裡面insert卻毫無壓力，中文正常到吐。

今晚找了個VPN，把StackOverFlow翻了個遍，終於找到了解決方案。

廢話真多（你也覺得是吧）。

參考文獻1的問題就和我的描述基本一致，只是，作者的資料庫是latin1的env。

投票最多的那個答案嘛，給了我一個提示：

通過FreeTDS進行資料庫連線，路徑如下：

Python App --1-- pyodbc --2-- FreeTDS --3-- DBServer

而這每一步都有一個coding的問題在。

首先，保證python指令碼的coding必須要正確，例如utf-8，這個可以在windows下寫好指令碼執行嘗試一下，確認無誤就好。

其次，pyodbc傳遞給freetds會進行一次轉碼，怎麼轉，轉成什麼，不知道，也沒有更多資訊或者文件支援和論證這個問題。

最後，FreeTDS會將任何接收到的東西採用UCS2編碼的方式轉碼後傳遞到資料庫，寫入。（http://www.freetds.org/userguide/unicodefreetds.htm）

所以，如果1、3我都測試通過沒有問題，那麼癥結就在pyodbc轉碼傳遞給FreeTDS的問題了。

python不支援UCS2編碼，所以沒有辦法採用這種方式轉碼，而FreeTDS也不能明文改成這種編碼的字串。

pyodbc的文件非常悲劇，啥都沒有，那看看StackOverFlow是否有相關的文獻提供支援？

無意中翻閱了文獻2和文獻3，文獻2表示pyodbc的用法嘛，是不建議你通過拼接變數的方式進行賦值的，而是使用“?”表示式（暫且這麼稱呼吧）來賦值。

例如：

問題描述中的插入語句我原本是寫成：

SqlStr = "insert into t(name) values(%s)" % (a)

按照pyodbc的問號表示式的寫法，應該寫成：

SqlStr = "insert into t(name) values(?)" % (a)

這不是傳說中的換湯不換藥麼？

回答的人輕輕地表示，這樣做之後，就能搞定了。

然後捏，然後文獻2的作者然並卵地說他自己笨了，原來是系統的語言環境沒有設定對。

我就不在意了。

文獻3裡面，有回答表示：“丫的，你寫入nvarchar欄位，加個N呀”。

按照他的想法，應該直接這樣：

SqlStr = u"insert into t(name) values(N'測試')"

我就興高采烈屁顛屁顛地試了一下，放屁。

然後二樓就接話了：“孩子，你還年輕，想當年我年輕的時候，用pyodbc的問號表示式的賦值方法，就解決你這個問題了。”

真的麼？

果然……

解決方案：

1. 首先你的資料庫至少是UTF-8編碼的，正常來說，我們大天朝子民，一般都使用 Chinese_PRC_CI_AS

2. python指令碼檔案本身是UTF-8編碼的（在linux下用file命令檢視，得到結果：test.py UTF-8 Unicode Java program text）

3. python指令碼第一行加上檔案編碼的定義，兩種寫法均可：（1）# -*-coding:utf-8-*-；（2）# coding:utf-8

4. python指令碼中，中文（或者泛稱unicode字串）需要使用如下格式：u'中文'

5. FreeTDS配置需加上 client charset = UTF-8 （不知道加哪裡看我的提問貼求助：Linux下使用Pyodbc插入資料到MSSQL中文亂碼 [問題點數：100分]）

6. 指令碼中，涉及到pyodbc insert的語句，採用如下方式執行：

sql = "insert into tpayon_test (name) values (?)"
parameters = (u"中文")
cursor.execute(sql, parameters)

以上6點，缺一不可。

最後興奮地貼一個圖吧：

-------------------------------------------------------------

參考文獻：

1. using pyodbc on linux to insert unicode or utf-8 chars in a nvarchar mssql field

2. pyODBC and Unicode

3. why insert empty value using pyodbc in Linux environment?

4. pyodbc官方文件

解決使用Pyodbc向MSSQL插入unicode字元亂碼的問題

——這個問題煩擾了我將近3個星期。重要提醒：想看解決方案的直接拖到最後，這中間的過程，急性子的人可以不用看。問題描述：現有： 1. unicode字串：a = "測試" ； 2. 資料庫SQL Server 2008表 t(name nvarchar(

解決python3向資料庫插入日期字串報錯的問題

[Err] 22007 - [SQL Server]從字串轉換日期和/或時間時，轉換失敗。　　插入的日期字串（日期字串是從檔案中讀取的，將檔案中的資料轉存到關係型資料庫中）： '2017/04/10' 字串看著沒問題，我用len(str)檢視長度，發現長度為11，多出了一個字元

FreeMarker前臺向後臺傳中文字元亂碼

這個亂碼跟 FreeMarker 本身是無關的如果表單的 method 是 GET 的話，你需要對引數值進行轉碼 ISO8859_1 -> UTF8 如果是 POST 的話，則需要 request.setCharacterEncoding("UTF-8");

struts向資料庫插入中文資料亂碼問題

問題：從jsp頁面向資料庫新增記錄中文亂碼，英文正常-----編碼的問題弄得暈頭轉向··· 解決方向：一、myeclipse裡面各檔案的編碼格式不一樣？ windows--preferences--general--workspace--gbk； windows--pre

php向資料庫插入資料出現亂碼問題

一般插入到資料庫的資料亂碼都是編碼的問題，可以在插入資料庫前檢視下內容的編碼方式，如果和資料庫用的編碼方式（如：utf-8）一樣就執行插入操作，不一樣就進行轉碼。先判斷你要插入資料庫的文字的編碼方式，是utf-8就插入，不是的話要轉為utf-8之後再插入：

Linux下Tomcat向MySQL插入數據中文亂碼解決辦法

中文亂碼解決辦法Linux下Tomcat向MySQL插入數據中文亂碼解決辦法一、問題在windows上面使用eclipse開發的項目在windows上面運行一切正常，部署到騰訊雲時出現向MySQL數據庫中插入數據是中文亂碼二、解決辦法 1、嘗試一直接在linux上面使用insert語句插入中文，正常2、

向mysql插入表中的中文顯示為亂碼或問號的解決方法，親測有用！！

重新啟動重新安裝進入今天 ext database 技術 arc 　　今天在做ssh的博客項目時發現mysql數據庫中的中文顯示為問號，網上查閱了很多資料，都不是很全，所以我總結一下，供大家參考和自己復習。　　1.我的計算機配置： windows系統（linux沒

解決C++連線MySQL資料庫插入和獲取記錄中文字元亂碼問題

字元編碼真是個頭痛的問題，以前一直不放在心上，現在用到了才發現真的麻煩。花了將近一天的時間終於達到目的。測試環境VS2015+MYSQL5.5，各種編碼的具體說明就不講了，自行百度。 1、讀取資料亂碼問題： vs專案下，預設編碼Unicode，但我的資料庫預設utf

解決js向controller傳數據的亂碼問題

spa 亂碼問題 http 解決 red gen cti port ace 1，preferences->general->workspace->text file encoding->utf-8 2,server.xml中加上URIEncoding

中文字元亂碼問題的解決方法

中文字元亂碼問題的解決方法轉載:http://blog.chinaunix.net/uid-26

0021-使用JDBC向Kudu表插入中文字元-cast的祕密

溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。 1.問題描述使用Impala JDBC向Kudu表中插入中文字元，插入的中文字串亂碼，中文字串被截斷。繼之前文件使用sql拼接方式插入中文字串亂碼解決方法後，此文件描述使用jdbc的PreparedStatement方式插入中

0020-使用JDBC向Kudu表插入中文字元-雙引號的祕密

溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。 1.問題描述使用Impala JDBC向Kudu表中插入中文字元，插入的中文字串亂碼，中文字串被截斷。 2.問題復現測試環境： CDH5.12.0 Kudu1.4.0 ImpalaJDBC41_2.5.35

win10更新1809版本後執行Dev-cpp, dos控制檯字元亂碼解決方法

微軟：請勿安裝windows10 1809版本，有bug會刪除個人檔案雖然微軟非常利索的在釋出會後及時推送了新的windows10新版本，但自從推送後，諸多問題層出不窮。之前使用者曾表示1809版本windows 10的工作管理員存在CPU使用率錯誤顯示的問題。不過，可

向資料庫新增中文資料亂碼的解決辦法(本文使用spring-jdbcTemplate)

由於編碼字符集的不同通常容易導致資料庫中文亂碼問題,如顯示問號。往往由以下三個方面所造成的 (一)：資料庫端字符集設定　　1.安裝mysql時，會有一個數據庫編碼設定，將其設定為utf-8 　　2.先設定資料庫的字符集屬性：　　3.將要顯示中文的欄位設定為U

URL編碼解決中文字元亂碼(encodeURIComponent和decodeURIComponent)

1、encodeURIComponent 轉義除了字母、數字、(、)、.、!、~、*、'、-和_之外的所有字元(可看下錶的非轉義字元更清晰)。注意：為了避免伺服器收到不可預知的請求，對任何使用者輸入的作為URI部分的內容你都需要用encodeURIComponent進行轉義。 var x

python celery捕捉unicode字元型別的錯誤，導致後臺任務失敗的解決方案

背景公司有一個用django(1.8.0)寫的運維平臺，目的用於申請阿里雲和騰訊雲機器；申請雲上機器採用後臺非同步的方式，框架採用redis+celery(3.1.18)，但最近發現一個問題，就是有時候申請騰訊雲機器的後臺任務因為沒有捕捉到某些異常，導致任務會

解決mySql中文亂碼以及Eclipse插入中文出現亂碼

cmd --->命令列 mySql查詢資料庫出現中文亂碼： 1、登入資料庫，mysql -u root -p ，輸入密碼,登入 2、查詢mysql編碼： show variables like "%char%"; 3、正確編碼

更改Tomcat字元編碼設定及解決post請求中文字元亂碼

我遇到這個問題的時候是在做一個第三方支付介面的時候，在回撥函式中，解碼URL的時候怎麼解都不好使，解出來是亂碼的問題，搞了半天沒解決，百度找到了另一種方法。這是第一種方法 new String(getURLDecoderString(json).getBytes("IS

jsp向資料庫插入中文問號和=火星文亂碼問題

1.向資料庫插入問號亂碼 Connection conn=DriverManager.getConnection(“jdbc:mysql://localhost/資料庫名?useUnicode=true&characterEncoding=UTF-8”,“root”,""); //連

myeclipse連線mysql生成資料表時中文字元亂碼或問號（解決方法）

出現這個問題有以下三步解決思路： 1. 檢查myeclipse的編碼格式 windows---->Preferences---->general---->Workspace，右側視窗Text file encoding，選擇Other，改變為UTF-8。此時重新整理專案，看能否正常寫

解決使用Pyodbc向MSSQL插入unicode字元亂碼的問題

相關推薦