Python2 之漢字編碼為unicode問題（即類似\xc3\xa4）

阿新 • • 發佈：2019-01-23

Python2中編碼相關的問題很是讓人蛋疼，特別是中文字元。
比如本文所述的中文網頁GBK編碼的詭異問題。

現象

例如：盲錄職氓聭聵，其實網頁裡面正常的應該是會員

分析

接著上面的例子，會員這部分亂碼通過repr()函式求值得到如下結果

\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函式求值得到的結果為unicode

eval(repr())出來值為

盲錄職氓聭聵

通過查表上述6個漢字對應
c3a4 c2bc c29a c3a5 c291 c298

而上面內容對應的UTF-8值就是會員

解決方法

相當詭異的是本身是unicode編碼，卻被當作GBK系列來解碼，結果導致亂碼。因此將這些字元先編碼再解決解決問題。
encode('raw_unicode_escape').decode()

Python2 之漢字編碼為unicode問題（即類似\xc3\xa4）

Python2中編碼相關的問題很是讓人蛋疼，特別是中文字元。比如本文所述的中文網頁GBK編碼的詭異問題。現象例如：盲錄職氓聭聵，其實網頁裡面正常的應該是會員分析接著上面的例子，會員這部分亂碼通過repr()函式求值得到如下結果 \xc3

CentOS 7下MySQL5.7的修改字符集編碼為UTF8（解決中文亂碼問題）

【From：】http://www.2cto.com/database/201311/255324.html 一、登入MySQL檢視用show variables like 'character%';下字符集，顯示如下： 1 2 3 4 5 6 7 8 9 10 11

Java之建立一個帶預設構造方法（即無參構造）的類，在構造方法中列印一條訊息"Hello Constructor";再為這個類新增一個過載構造方法，令其接收一個字串引數。

建立一個帶預設構造方法（即無參構造）的類，在構造方法中列印一條訊息"Hello Constructor";再為這個類新增一個過載構造方法，令其接收一個字串引數，並在這個有參構造方法中把"Hello Constructor"和接收的引數一起打印出來。效果如下：附上程

java--建立一個帶預設構造方法（即無參構造）的類，在構造方法中列印一條訊息"Hello Constructor";再為這個類新增一個過載構造方法，令其接收一個字串引數，將其一起打印出來

題目描述：建立一個帶預設構造方法（即無參構造）的類，在構造方法中列印一條訊息"Hello Constructor";再為這個類新增一個過載構造方法，令其接收一個字串引數，並在這個有參構造方法中把"Hello Constructor"和接收的引數一起打印出來。 //Person類 class Pe

java--建立一個帶預設構造方法（即無參構造）的類，在構造方法中列印一條訊息"Hello Constructor";再為這個類新增一個過載構造方法，令其接收一個字串引數，將其一起打印出來

題目描述：建立一個帶預設構造方法（即無參構造）的類，在構造方法中列印一條訊息"Hello Constructor";再為這個類新增一個過載構造方法，令其接收一個字串引數，並在這個有參構造方法中把"Hello Constructor"和接收的引數一起打印出來。 //Perso

PHP之PSR2編碼指南介紹（一）

本指南擴充套件和擴充套件了基本編碼標準PSR-1。本指南的目的是在掃描來自不同作者的程式碼時減少認知摩擦。它通過列舉一組共享規則和對如何格式化PHP程式碼的期望來實現。這裡的風格規則源於各個成員專案之間的共性。當各個作者跨多個專案進行協作時，在所有這些專案中使用一套指南會

【原創】大資料基礎之Spark（7）spark讀取檔案split過程（即RDD分割槽數量）

spark 2.1.1 spark初始化rdd的時候，需要讀取檔案，通常是hdfs檔案，在讀檔案的時候可以指定最小partition數量，這裡只是建議的數量，實際可能比這個要大（比如檔案特別多或者特別大時），也可能比這個要小（比如檔案只有一個而且很小時），如果沒有指定最小partition數量，初始化完成的

LOADRUNNER之漢字編碼轉換及\X00問題

我們在使用loadrunner做效能測試的時候經常會出現一些URL編碼問題，如當引數中存在中文的時候 "Name=user", "Value=孟林", ENDITEM, 抓包的時候可以看到&user=%e5%ad%9f%e6%9e%97，然而我們在loadrunner中的指令碼日誌會發現並不是這樣

關於python中json load出來編碼為unicode的問題的解決

import json def json_load_byteified(file_handle):return _byteify( json.load(file_handle, object_hook=_byteify), ignore_dicts=True)def json

(轉)UTF8轉換為UNICODE（UTF8ToUnicode）

//注：Linux下使用，未知Window下的情況 1. /**********************************************************************************//* *//* Function: UTF8T

C#將漢字轉換為拼音（按照拼音搜尋）

可以將漢字字串的首字母提取出來，例如：產品名稱：蒙牛酸酸乳，提取後：MNSSR，可用於按照拼音查詢。比如：你想查詢某人姓名，只需輸入名字縮寫即可，還有其它的用處，你可以自己挖掘。如果覺得對你有用，別忘了頂一下，謝謝！ using System; using Syste

改Windows記事本(notepad)預設編碼為Unicode或UTF-8

Windows記事本預設編碼ANSI無法滿足Linuxer，每次都得“另存為”然後選擇編碼方式。找到一解決方法如下： 1. 新建一個txt文件，不輸入任何內容。然後“另存為”，將編碼由預設的 ANSI 修改為 Unicode 或 UTF-8，並將新文件命名為 te

Ubuntu14.04下MySQL 5.6的修改字符集編碼為UTF8（徹底解決中文亂碼問題）

上一篇文章講解的MySQL安裝、但是安裝好的MySQL資料庫字元編碼有問題，這裡我們需要修改字元編碼。我們首先講解一下我們安裝好的MySQL。 1、資料庫目錄，其所建立的資料庫檔案都在該目錄下　　/var/lib/mysql/ 　

Linux下MySQL5.6的修改字符集編碼為UTF8（解決中文亂碼問題，親測可用！）

Linux下MySQL5.6的修改字符集編碼為UTF8（解決中文亂碼問題）一、登入MySQL檢視用 SHOW VARIABLES LIKE ‘character%’; 下字符集，顯示如下：+--------------------------+--------------

C語言利用棧實現將中綴表示式轉換為字尾表示式（即逆波蘭式）

輸入計算表示式如：（1-3）*4+10/5 輸出的逆波蘭式：1 3 - 4 * 10 5 / + 碼程式碼時臉上洋溢著的神祕的微笑 #include <stdio.h> #include <stdlib.h> #include

天津政府應急系統之GIS一張圖（arcgis api for flex）解說（三）顯示地圖坐標系模塊

image blur rda plain 讀取 else important baseline pat config.xml文件的配置例如以下： 1 2 <widget left="3" bottom="3" config="widg

Ubuntu使用BIOS時間做為localtime（與windows保持一致）

ubuntu查看狀態：timedatectlLocal time: 三 2016-07-13 23:40:35 CST Universal time: 三 2016-07-13 15:40:35 UTC RTC time: 三 2016-07-13 15:40:35 Time zone: Asia

python學習之路——第三彈（作業篇第一題）

image 操作啟動程序代碼 color 鎖定文件文件文件內容數據作業一：編寫登錄接口1.輸入用戶名密碼2.認證成功後顯示歡迎信息3.輸錯三次後鎖定。所需知識點文件基本讀寫操作，循環，列表，字典上面的作業題是在學習完數據類型和簡單的文件操作之後布置的，

wamp圖標為黃色（非端口號問題）

pac bsp log 進入找到配置 services src 沒有 1、Win鍵+R 輸入:services.msc 進入服務，找到wamp,看哪個服務沒有啟動 2、手動啟動apache服務失敗，彈出以下錯誤 3、然後在cmd命令行中切換到你的apache的b

[轉]微信小程序之加載更多（分頁加載）實例 —— 微信小程序實戰系列（2）

是否底部 watermark water ongl 小程序教程所有空數組 osi 本文轉自;http://blog.csdn.net/michael_ouyang/article/details/56846185 loadmore 加載更多（分頁加載）當

Python2 之漢字編碼為unicode問題（即類似\xc3\xa4）

現象

分析

解決方法

相關推薦