java如何獲取一個文字檔案的編碼(格式)資訊呢？

阿新 • • 發佈：2021-10-24

轉自:http://www.java265.com/JavaJingYan/202110/16350332691561.html

文字檔案是我們在windows平臺下常用的一種檔案格式，

這種格式會隨著作業系統的語言不同，而出現其預設的編碼不同

那麼如何使用程式獲取“文字檔案”的編碼方式呢？

檔案編碼的格式決定了檔案可儲存的字元型別，所以得到檔案的型別至關重要

下文筆者講述獲取一個文字檔案的格式資訊的方法分享，如下所示:

實現思路:
    通過獲取檔案流的前3個位元組
	判斷其值的方式，即可獲取文字檔案的編碼方式

例:

package com.java265.other;
import java.io.File;
 
import java.io.FileInputStream;
import java.io.InputStream;
 
public class Test {
    /*
     * java265.com 獲取文字檔案的編碼方式
     *  
     **/
     
    public static void main(String[] args)   {
      File file = new File("E://person/java265.com/java.txt");
      System.out.println(GetEncoding(file));
      }
    
    
    
     
public static String GetEncoding(File file)
    {
        String charset = "GBK";
        byte[] first3Bytes = new byte[3];
        try {
            boolean checked = false; 
            InputStream is = new FileInputStream(file);
            int read = is.read(first3Bytes, 0, 3);
 
            if (read == -1)
                 
return charset;
            if (first3Bytes[0] == (byte) 0xFF && first3Bytes[1] == (byte) 0xFE) {
                charset = "UTF-16LE";
                checked = true;
            } else if (first3Bytes[0] == (byte) 0xFE
                    && first3Bytes[1] == (byte) 0xFF) {
                charset = "UTF-16BE";
                checked = true;
            } else if (first3Bytes[0] == (byte) 0xEF
                    && first3Bytes[1] == (byte) 0xBB
                    && first3Bytes[2] == (byte) 0xBF) {
                charset = "UTF-8";
                checked = true;
            }else if (first3Bytes[0] == (byte) 0xA
                    && first3Bytes[1] == (byte) 0x5B
                    && first3Bytes[2] == (byte) 0x30) {
                charset = "UTF-8";
                checked = true;
            }else if (first3Bytes[0] == (byte) 0xD
                    && first3Bytes[1] == (byte) 0xA
                    && first3Bytes[2] == (byte) 0x5B) {
                charset = "GBK";
                checked = true;
            }else if (first3Bytes[0] == (byte) 0x5B
                    && first3Bytes[1] == (byte) 0x54
                    && first3Bytes[2] == (byte) 0x49) {
                charset = "windows-1251";
                checked = true;
            }
            //bis.reset();
            InputStream istmp = new FileInputStream(file);
            if (!checked) {
                int loc = 0;
                while ((read = istmp.read()) != -1) {
                    loc++;
                    if (read >= 0xF0)
                        break;
                    if (0x80 <= read && read <= 0xBF)
                        break;
                    if (0xC0 <= read && read <= 0xDF) {
                        read = istmp.read();
                        if (0x80 <= read && read <= 0xBF)
                            continue;
                        else
                            break;
                    } else if (0xE0 <= read && read <= 0xEF) {
                        read = istmp.read();
                        if (0x80 <= read && read <= 0xBF) {
                            read = istmp.read();
                            if (0x80 <= read && read <= 0xBF) {
                                charset = "UTF-8";
                                break;
                            } else
                                break;
                        } else
                            break;
                    }
                }
            }
            is.close();
            istmp.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return charset; 
    }
    
    
}

java如何獲取一個文字檔案的編碼(格式)資訊呢？

轉自:http://www.java265.com/JavaJingYan/202110/16350332691561.html 文字檔案是我們在windows平臺下常用的一種檔案格式，

Loadrunner+引數化檔案編碼格式+獲取請求報文發生異常

問題：在回放時報文返回“獲取請求報文發生異常”，如圖01所示，但是在Jmeter中可以正常請求。

window系統中獲取資料夾下所有檔名到一個文字檔案中

技術標籤：windows指令碼語言列表 windows系統獲取資料夾下所有檔名（表名）到一個table.txt檔案中：

Java 例項 - 獲取web.xml檔案中的資訊

XMLUtil執行檔案 public class XMLUtil { public static void main(String[] args) { String IP = XMLUtil.getIpName(); //讀取配置檔案中的引數

java實現大文字檔案拆分

本文例項為大家分享了java實現大文字檔案拆分的具體程式碼，供大家參考，具體內容如下

Notepad++ 批量修改檔案編碼格式

一、安裝notepad++ 外掛管理器（PluginManager）進入下面地址https://github.com/bruderstein/nppPluginManager/releases 下載對應的版本

統計一個文字檔案中字元的個數//統計檔案中文字的行數

1 //統計一個文字檔案中字元的個數 2 package classwork10; 3 4 import java.io.FileInputStream;

Qt之檔案操作：QTextStream寫入內容到一個文字檔案中

技術標籤：pythonlinuxjavamysql資料庫 #include <QFile> #include <QTextStream> QFile data("output.txt");//建立output.txt

JAVA獲取一個月有多少天,以及判斷當前天為周幾

import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date;

java獲取一個類中所有屬性名和屬性值

獲取屬性名和屬性值 public static void outprint(String s1, Object o) { try { Class c = Class.forName(s1);

java獲取檔案編碼,jsoup獲取html純文字操作

maven引入獲取編碼的jar <dependency> <groupId>com.ibm.icu</groupId> <artifactId>icu4j</artifactId>

10: java資料結構和演算法: 構建哈夫曼樹, 獲取哈夫曼編碼, 使用哈夫曼編碼原理對檔案壓縮和解壓

最終結果哈夫曼樹,如圖所示: 直接上程式碼: public class HuffmanCode { public static void main(String[] args) {

兩個文字檔案各存放英文字母這兩個檔案中的資訊合併進行排序寫到一個新檔案

技術標籤：python 兩個文字檔案各存放英文字母這兩個檔案中的資訊合併進行排序寫到一個新檔案

java實現阿里雲(oss)多檔案獲取並壓縮成zip格式下載

package com.wei.common.web.api; import com.aliyun.oss.OSSClient; import com.aliyun.oss.model.OSSObject;

一個php檔案兩種編碼格式的解決方式

技術標籤：PHP編碼php亂碼最近的一個專案,上司用的編碼格式是UTF-8和ISO-8859兩種編碼格式,導致有的時候alert彈框彈出的內容以及在編輯器上的內容會出現亂碼的情況.就在網上搜了一下關於多種編碼格式的轉換問題

java讀取TXT檔案（硬核區分編碼格式）

廢話：我看了百度上大部分的自動讀取TXT檔案，在不確定編碼格式的情況下，好像都沒啥效果，但是我還是保留了，萬一有用呢[狗頭]，可能是我的搜尋方式不對，沒有找到正確結果，我目前的方法由於太過硬核我也覺得不是

python自動識別文字編碼格式程式碼

我就廢話不多說了，直接上程式碼吧！ #!/usr/bin/python3 # -*- coding: utf-8 -*- import codecs

python 讀寫檔案包含多種編碼格式的解決方式

今天寫一個指令碼檔案，需要將多個檔案中的內容彙總到一個txt檔案中，由於多個檔案有三種不同的編碼方式，讀寫出現錯誤，先將解決方法記錄如下：

Java獲取配置檔案的值過程解析

這篇文章主要介紹了java獲取配置檔案的值過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python利用 utf-8-sig 編碼格式解決寫入 csv 檔案亂碼問題

先舉個例子，分別以不指定編碼、指定編碼為 utf-8、指定編碼為 utf-8-sig 三種方式來做比較，再將寫入 csv 檔案和 txt 檔案來做個對比

java如何獲取一個文字檔案的編碼(格式)資訊呢？

相關推薦