1. 程式人生 > >python指令碼實現windows下檔案gbk編碼與utf-8相互轉換

python指令碼實現windows下檔案gbk編碼與utf-8相互轉換

程式碼如下:

import codecs
import sys
def ReadFile(filePath, encoding="utf-8"):
    with codecs.open(filePath, "r", encoding) as f:
        return f.read()


def WriteFile(filePath, u, encoding="gbk"):
    with codecs.open(filePath, "w", encoding) as f:
        f.write(u)


def UTF8_2_GBK(src, dst, reverse =
False): if reverse == False: content = ReadFile(src, encoding="utf-8") WriteFile(dst, content, encoding="gbk") else: content = ReadFile(src, encoding="gbk") WriteFile(dst, content, encoding="utf-8") if __name__ == "__main__": if len(sys.argv) == 2: UTF8_2_GBK(
sys.argv[1], sys.argv[1]) else: UTF8_2_GBK(sys.argv[1], sys.argv[1], True)

相關推薦

python指令碼實現windows檔案gbk編碼utf-8相互轉換

程式碼如下: import codecs import sys def ReadFile(filePath, encoding="utf-8"): with codecs.open(filePa

c語言實現windows檔案遍歷

參考網上的程式碼,寫的註釋比較完整的程式碼。 例程如下,在article目錄下,有若干檔案和目錄。 #include <stdio.h> #include <windows.h> void loopThrough(char* p

Python Windows檔案讀寫二進位制讀寫的區別

從我遇到的實際場景來看,區別主要在於對換行符的處理上。 概念: ”\n” – 換行符(LF) – 指向新的一行 “\r” – 回車符(CR) – 指到一行的開頭 不同系統下的換行符有區別: Window 下為 “\r\n”; Unix 下為 “\n”;

Python(pycharm)在windows路徑 ( ' / ' ' \ ' )的問題

1.0 首先了解Python中與pycharm,windows互動的模組(這二個模組可以避免出現路徑錯誤的問題)sys模組 (側重Python與pycharm互動)提供的與路徑相關的方法有: __file__ # 當前執行檔案所在的絕對路徑 sys.path

《Java》Java“字串操作”實際應用——形成GBK編碼UTF-8編碼的文字檔案,通過其二進位制資料觀察兩種編碼的不同

一、任務目標     完成一個java application應用程式,可以把GBK編碼的漢字字串與UTF-8編碼的漢字字串相互轉換。並配合寫檔案操作形成不同編碼格式的文字檔案,可以通過其二進位制資料觀察兩種編碼的不同。   二、程式設計思路     博主將“程式設計思路”以流程

WindowsCMD命令列顯示UTF-8字元

在中文windows系統中,如果一個文字檔案是utf-8編碼的,那麼在cmd.exe命令列視窗(所謂的dos視窗)中不能正確顯示檔案中的內容。在預設情況下,命令列視窗中使用的內碼表是中文或者美國的,即編碼是中文字符集或者西文字符集。 如果想正確顯示UTF-8字元,可以按照以下步驟操作:

Eclipse 修改所有檔案預設編碼UTF-8

摘要 在實際運用中,我們通常需要使用UTF-8的編碼,但是每次新建一個工程都要改編碼,是不是特別麻煩呢。 而且一旦忘記了,改過之後中文亂碼… 1、修改 workspace text file encoding 依次點選windows -> Preferences

PHP中文GBK編碼UTF-8

iconv 和 mb_convert_encoding的區別 函式比較 string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] ) 需要先enable mbstring 擴充套件庫,在 php

VBA 向檔案寫入編碼UTF-8的資料

Sub Test()           '需要引入  ActiveX Data Objects(ADO)元件  '       即 Microsoft ActiveX Data Objects 2.5 Library 或者 Microsoft ActiveX Data O

Java專案GBK編碼UTF-8

方法一:使用Apache的common-io 1.maven專案pom.xml <dependency> <groupId>commons-io</groupId> <artif

GBK(GB2312)UTF-8檔案轉碼

最近使用的Intelij IDEA開發工具,轉碼有點小問題。百度了一下,Eclipse可以自動轉碼,而IDEA卻不可以。總是需要手動去轉若要把原始檔由GBK轉成UTF-8的,得靠其他方式了。網上搜羅了一下方法,然後自己整理了一下。現把程式碼貼出來,測試OK、可以直接使用!

java中如何從字串中刪選中文字元(GBK編碼UTF-8編碼

1.GBK編碼中文佔兩個位元組,英文佔一個位元組。下面進行一個小的程式的測試: <span style="font-size:24px;">import java.io.Unsupport

windowsJDK 1.7 1.8共存

1,先安裝jdk7,配置環境變數JAVA_HOME,然後安裝jdk8。2,安裝jdk8後,JAVA_HOME指向未做修改,執行java -version顯示還是以前的jdk7版本資訊,3,接下來我們配置環境變數JAVA_HOME,發現配置jdk7的路徑,或者配置jdk8的路徑 ,或是亂寫一個路徑 還是一樣顯示

Script中16進位制Unicode編碼中文的相互轉換

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">   <HTML>    

base64編碼圖片之間相互轉換

Base64是網路上最常見的用於傳輸8Bit位元組碼的編碼方式之一 一、將base64轉換成圖片 只需要在img 標籤中引入即可,注意要加上標明字首(data:image/png;base64),否則並不知道,這串程式碼是幹啥的 如: 二、將圖片轉換成base64 通過ca

將圖片(二進位制檔案)儲存於資料庫,論檔案位元組流二進位制字串相互轉換

開發中遇到儲存圖片檔案於資料庫這樣的需求。我們知道檔案本身就是一份二進位制資料,不同型別的檔案只是編碼形式不同,對應的解讀形式不同,無論txt檔案、jpg檔案亦或是mp4檔案,本質上都是0和1組成的。而在C++中我們可以通過位元組流來讀寫檔案,也就是說我們可以把檔案讀入cha

Python指令碼Windows檔案備份

Python指令碼 —Windows下備份檔案【Python 3.6版本】 1:明確備份資源和儲存路徑 2:Windows下沒有安裝zip打包軟體,需安裝info-zip(https://sourceforge.net/projects/infozip/files/)

Python指令碼實現查詢指定目錄包含指定關鍵字的檔案

#!/usr/bin/python # coding:utf8 import os # 判斷檔案中是否包含關鍵字,是則將檔案路徑打印出來 def is_file_contain_word(file

bat結合maven 實現windowsmaven自動打包指令碼

不知道你是否在開發中一直遇到這樣的問題,在maven打包的時候有2中方式,一種就是在ide工具裡面打包,然後在ide的輸出資訊裡面找到對應的war或者jar包所在位置,然後拷貝出來。另一種就是先找到專案所在的位置然後通過maven clean install 命令執行完畢之後

Python指令碼實現去除檔案的只讀性

 如何在PYTHON中移去檔案的只讀屬性, 用chmod命令stat.S_IWRITE import os import stat os.chmod( filename, stat.S_IWRITE ) 如去除檔案 D:\整合架\MobileDgnSdk12\samples\PKP