將txt文字由utf-8轉gbk

阿新 • • 發佈：2020-12-24

import codecs

# file = open(path, encoding='gbk', errors='ignore')
# print(file.readline())


path = "locator5.txt" #輸入檔案路徑,要保證格式為utf-8,window下文字開啟另存為utf-8,
                    # linux下檔案直接轉gbk  [[email protected]: ~]$ iconv -f utf-8 -t gbk utf_file > gbk_file
path2 = "locator6.txt" 

path3 = "locator.json"

def ReadFile(filePath,encoding="utf-8"):
    with codecs.open(filePath, "r", encoding) as f:
        return f.read()

def ReadFile2(filePath,encoding="gbk"):
    with codecs.open(filePath, "r", encoding) as f:
        return f. 
read()

def WriteFile(filePath,u,encoding="gbk"):
    with codecs.open(filePath, "w", encoding) as f:
        f.write(u)

def UTF8_2_GBK(src,dst):
    content = ReadFile(src, encoding="utf-8")
    WriteFile(dst, content, encoding="gbk")

def UTF8_2_GBK2(src,dst) 
:
    content = ReadFile(src, encoding="utf-8")
    WriteFile(dst, content, encoding="gb18030")




def UTF8_2_GBK3(src,dst):
    content = ReadFile(src, encoding="gbk")
    WriteFile(dst, content, encoding="gbk")



UTF8_2_GBK2(path,path2)
#
# a = ReadFile2(path3)
# b = WriteFile(path2)
# UTF8_2_GBK2(a,b)

還有順便補一個去除中文的

#隨便記一個去除中文的
```python
import re
from zhon.hanzi import punctuation
from zhon.hanzi import characters

def lm_find_unchinese(file):
    pattern = re.compile(r'[\u4e00-\u9fa5]')
    unchinese = re.sub(pattern,"",file) #排除漢字
    unchinese = re.sub('[{}]'.format(punctuation),"",unchinese) #排除中文符號
    #print("unchinese:",unchinese)
    return unchinese

將txt文字由utf-8轉gbk

import codecs # file = open(path, encoding=\'gbk\', errors=\'ignore\') # print(file.readline()) path = "locator5.txt" #輸入檔案路徑,要保證格式為utf-8,window下文字開啟另存為utf-8,

如何做編碼轉換：UTF-8轉GBK

如何將UTF-8編碼的檔案轉換成GBK 1、將檔案graphfile.json上傳到linux機器上 2、直接使用一行命令搞定

python unicode、utf-8、gbk編碼與解碼展示

encode()：編碼 decode()：解碼 repr()：返回一個可以用來表示物件的可列印的字串 [oracle@10-248-57-246 ~]$ locale

3D網頁小實驗——將txt配置文字轉化為3D陳列室

設計目標：借鑑前輩程式設計者的經驗將簡單的配置文字轉化為3D場景，並根據配置檔案在場景中加入圖片和可播放的視訊，最終形成可瀏覽的3D陳列室。

VC++下漢字GBK轉UNICODE和UTF-8 原理實現

技術標籤：程式設計技巧unicode字串分享一個讀取GBK和UNICODE互轉對照表檔案形式，來實現漢字GBK轉UNICODE和UTF-8 ；

GBK和UTF-8文字編碼的區別

GBK和UTF-8文字編碼的區別 UTF-8是一種國際化標準的文字編碼，GBK的存在是為了中國國情而創造的

python 如何將資料寫入本地txt文字檔案的實現方法

一、讀寫txt檔案 1、開啟txt檔案 file_handle=open(\'1.txt\',mode=\'w\') 上述函式引數有（1.檔名，mode模式）

win10電腦新建文字文件預設編碼是UTF-8怎麼修改成ANSI編碼

當我們在win10系統中新建文字檔案的時候，預設編碼是UTF-8，如果想要右鍵新建文字檔案為預設的ANSI編碼的話，該怎麼操作呢，本文就給大家講解一下win10電腦新建文字文件預設編碼是UTF-8修改成ANSI編碼的具體步驟如下

瀏覽器中的中文亂碼問題（GBK還是UTF-8）

程式碼編寫過程中，遇到中文的亂碼問題，我們一定會想到修改編碼為UTF-8，但這並不一定對所有的情況都適用。

批量轉換.txt檔案的編碼格式為utf-8

.txt檔案原本的編碼格式為國標或者ANSI,需要轉換為utf-8，防止中文亂碼。只要修改path路徑為.txt檔案所在目錄即可。

[轉]UTF-8編碼的空格（194 160）問題 - Eric Sun - 部落格園

　　前臺的字串傳遞到後臺進行處理，發現了一個較詭異的問題：字串中的一個空格(ASCII：32)被UTF-8編碼之後變成了一個詭異的字元(ASCII：194 和 160的組合)！但在後臺其表象還是空格。

C++ 多位元組string轉UTF-8 string

需求:資料庫資料格式為UTF-8,本地VS工程編碼字符集為多位元組字符集,匯入到本地csv檔案時需要轉化多位元組std::string為UTF-8 std::string

編碼轉換：UTF-8 BOM to GBK

2019獨角獸企業重金招聘Python工程師標準>>> 編碼轉換：UTF-8 BOM to GBK 最近因為一個實驗，需要文字檔案的編碼格式為GBK或者GB2312，而源數

將txt、csv等文字檔案匯入Hive

將txt、csv等文字檔案匯入Hive 目錄將txt、csv等文字檔案匯入Hive00.資料在虛擬機器外01.啟動hadoop、hdfs02.將檔案放置在hdfs目錄下03.登入hive並進入指定資料庫04.根據檔案建立表05.執行匯入語句

python 將.txt檔案批量轉化為excel表格

技術標籤：pythonexcelpython python 將.txt檔案批量轉化為excel表格問題描述：在四個資料夾目錄下，有很多個.TXT檔案，單純用手把它們轉化為excel檔案過於繁瑣

PHP判斷字串所屬編碼：ASCII、GB2312、GBK、UTF-8、ISO-8859-1

ASCII： ASCII的編碼範圍為0-127（十六進位制：0x00-0x7F），判斷函式： function isasciistr($str){

前端通過node.js實現16進位制轉utf-8

技術標籤：超級避坑指難JavaScriptnodejsutf-8 Buffer.from(buffer) buffer <Buffer> | <Uint8Array> 要拷貝資料的 Buffer 或 Uint8Array。

用goalng實現ascii、UCS2、UTF-8文字字串的解碼與編碼

技術標籤：golanggo字串用goalng實現ANSI、UCS2、UTF-8文字字串的解碼與編碼用到的外部包：

C# 讀取utf-8文字檔案

技術標籤：C#c# C# 讀取utf-8文字檔案需要的名稱空間引用 using System.IO; using System.Text;

嘗試通過 JDBC 將 UTF-8 插入 MySQL 時出現“亂碼”

這是我的連線設定方式： Connection conn = DriverManager.getConnection(url + dbName + \"?useUnicode=true&characterEncoding=utf-8\", userName, password);

將txt文字由utf-8轉gbk

相關推薦