1. 程式人生 > >eclipse:將編碼為GBK的Java原始檔批量轉為UTF-8

eclipse:將編碼為GBK的Java原始檔批量轉為UTF-8

本人新手,有個java工程開始編碼預設設定為GBK,後來出現編碼問題後準備改為UTF-8編碼,發現出現中文亂碼,在網上找到一篇博文可以批量有GBK轉化為UTF-8可以解決此問題,原網址:http://my.oschina.net/binny/blog/62959。再次感謝!

程式碼如下:

package xxx;


import java.util.*;
import java.io.File;
import org.apache.commons.io.FileUtils;




/**
 * 將GBK編碼檔案轉成UTF-8
 * @author 
 *
 */
public class GBK2UTF8 {
	
	public static void main(String[] args) throws Exception {
	    //GBK編碼格式原始碼路徑
	    String srcDirPath = "E:\\JavaProject\\touchfuture_test\\src";
	    //轉為UTF-8編碼格式原始碼路徑
	    String utf8DirPath = "E:\\UTF8\\src";
	         
	    //獲取所有java檔案
	    Collection<File> javaGbkFileCol =  FileUtils.listFiles(new File(srcDirPath), new String[]{"java"}, true);
	    for (File javaGbkFile : javaGbkFileCol) {
	    //UTF8格式檔案路徑
	    String utf8FilePath = utf8DirPath+javaGbkFile.getAbsolutePath().substring(srcDirPath.length());
	    //使用GBK讀取資料,然後用UTF-8寫入資料
	    FileUtils.writeLines(new File(utf8FilePath), "UTF-8", FileUtils.readLines(javaGbkFile, "GBK"));     
	    }
	}
}

程式碼和commons-io.jar打包下載地址:http://download.csdn.net/detail/sangluo/8177059。

相關推薦

eclipse編碼GBK的Java原始檔批量轉為UTF-8

本人新手,有個java工程開始編碼預設設定為GBK,後來出現編碼問題後準備改為UTF-8編碼,發現出現中文亂碼,在網上找到一篇博文可以批量有GBK轉化為UTF-8可以解決此問題,原網址:http://my.oschina.net/binny/blog/62959。再次感謝!

如何實現Eclipse默認編碼UTF-8

unicode tex window utf-8 選擇 nic iso odin src 1 Window->Preferences->General->Workspace,右邊Text file encoding選擇Other->UTF-8 2

EclipseEclipse設定文字編碼UTF-8

    在eclipse中,js檔案的預設編碼是ISO-8859-1,每次新增一個js檔案,就必須手動的將js檔案的編碼格式改為UTF-8,由於這種針對每個檔案的編碼設定儲存在專案的.settings/org.eclipse.core.resources.prefs檔案中,

eclipse設定全域性編碼UTF-8的方法

如果要使外掛開發應用能有更好的國際化支援,能夠最大程度的支援中文輸出,則最好使 Java檔案使用UTF-8編碼。然而,Eclipse工作空間(workspace)的預設字元編碼是作業系統預設的編碼,簡體中文作業系統 (Windows XP、Windows 2000簡體中文)的預設編碼是GB18030,在此

eclipse 設定預設編碼Utf-8

需要設定的幾處地方為:  Window->Preferences->General ->Content Type->Text->JSP 最下面設定為UTF-8  Window->Preferences->General->

eclipse xml 編碼問題 “3 字節的 UTF-8 序列的字節 3 無效”

log 序列 odi div mit 原本 嘗試 編碼 utf 原本項目沒問題,git commit之後,突然報錯 “3 字節的 UTF-8 序列的字節 3 無效” 嘗試過改xml文件編碼等,沒成功。pom中設置屬性,成功解決 <project.build.sour

Java實現任何編碼方式的txt檔案以UTF-8編碼方式轉存

本文利用JDK中的BufferedReader和BufferedWriter實現將任何編碼方式的txt檔案以UTF-8編碼方式轉存。 UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,又稱萬國碼,由Ken Thompson於199

log4cplus如何在windows下使用log4cplus以UTF-8編碼輸出中文

       如果Visual C++中字符集設定的是Unicode,如果想使用GBK格式讓log4cplus輸出中文,可以在log4cplus.properties配置檔案中設定Local屬性,例如: log4cplus.appender.ALL_MSGS.Append

assic編碼的json字串轉化為utf-8編碼的json字串

一、匯入模組 import urllib.request import urllib.parse import json 二、指定url,構造headers,構造請求引數 1.指定url url = 'http://fanyi.baidu.c

字元編碼ANSI和ASCII區別、Unicode和UTF-8區別

ANSI和ASCII區別 ANSI碼(American National Standards Institute) 美國國家標準學會的標準碼 ASCII碼(America Standard Code

GBK編碼形式的xml檔案 資料請求轉為utf-8

public String resposeString(String urlStr){ String result = ""; try { URL url = new URL(urlStr); HttpURLConnection httpURLC

MATLAB預設編碼方式由GBK轉為UTF-8

MATLAB版本:2016b 在命令視窗輸入命令: feature('locale') 可以看到多是用 GBK 進行編碼。 如果想以 utf-8 編碼,而不是 GBK 編碼的話,請找到MATLAB的安裝路徑,我的是D:\MATLAB\R2016b。找到bin目錄下的

編碼格式錯誤】SyntaxError: Non-UTF-8 code starting with

org 一行 文件 編碼 with details pla err pytho 問題: SyntaxError: Non-UTF-8 code starting with ‘\xba‘ in file E:/placement/placement/Placement Tes

編碼歷史ASCII、Unicode、utf-8和GBK

英文字母 英文 全世界 兩個 編碼 中國 歷史 1的個數 包含 ASCII編碼:用來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊控制字符,一個字符共8位,占一個字節。 ASCII編碼是由美國國家標準協會制定的標準的單字節字符編碼方案,用來存

字符編碼,ASCII、Unicode與UTF-8的理解

F5 標準化 一般來說 簡書 打開文件 說了 tps can 常用 首先我們先要明白的兩點是:1、計算機中的信息都是由二進制的0和1儲存的;2、我們再計算機屏幕上看到的各種字符都是計算機系統按照一定的規則將二進制數字轉換而來的。 一、基本概念。 1、字符集(charse

【轉載】字元編碼中ASCII、Unicode和UTF-8的區別

1. ASCII碼 我們知道,在計算機內部,所有的資訊最終都表示為一個二進位制的字串。每一個二進位制位(bit)有0和1兩種狀態,因此八個二進位制位就可以組合出256種狀態,這被稱為一個位元組(byte)。也就是說,一個位元組一共可以用來表示256種不同的狀態,每一個狀態對應一個符

sublime text 2 顯示GBK 編碼,並轉為 UTF-8 儲存

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

編碼方式ASCII、Unicode和UTF-8的區別及聯絡

最早的計算機在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位制11111111=十進位制255),如果要表示更大的整數,就必須用更多的位元組。比如兩個位元組可以表示的最大整數是65535,4個位元組可以表示的最大整

python中文編碼問題(decode('gbk').encode('utf-8')和decode('utf-8').encode('gbk')這對好基友)

    想必每個Python新手都會遇到Python編碼的問題,特別是使用到漢字的時候。UTF-8編碼是比較通用的編碼方式,它可以輸出中文,而Python2中預設的編碼方式一般是GBK,所以往往我們期

字串和編碼(ASCII 、Unicode、UTF-8

計算機只能處理數字,如果要處理文字,就必須先把文字轉換為數字才能處理。最早的計算機在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位制11111111=十進位制255),如果要表示更大的整數,就必須用更多的位元組。