urt-8轉成GBK 之多種方法

阿新 • • 發佈：2018-11-02

	/**
	 *  <p>Description:獲取字串後的第二個?後的字串</p>
	 *  @author sunshaofeng
	 * @date 2018-9-18 15:45
	 * @return 
	 * @version 1.0
	 */
	 private static String getStr(String str, int n) {
		  try {
	        int i = 0;
	        int s = 0;
	        String ss="";
	        //迴圈遍歷
	        while (i++ < n) {
	            s = str.indexOf("?", s + 1);
	            if (s == -1) {
	                return str;
	            }
	        }
			ss=new String(str.substring(s+2));
			//獲取編碼方式
			String encoding = getEncoding(ss);
			logger.info("encoding :"+encoding);
			logger.info("ENCODE BEFORE :"+ss);
			//方法一
			try {
				String	gbkStyle = gbk2Utf(ss);
				logger.info("gbk2Utf encodeToGBK ONE:"+gbkStyle);
			} catch (Exception e) {
				e.printStackTrace();
			}
			//方法二
			try {
				String gbkStyle2 = new String(getUTF8BytesFromGBKString(ss), "UTF-8");
				logger.info("gbk2Utf encodeToGBK TWO:"+gbkStyle2);
			} catch (Exception e) {
				e.printStackTrace();
			}
			//方法三
			try {
				String gbkStyle3 = charsetConvert(ss,"UTF-8");
				logger.info("gbk2Utf encodeToGBK THREE:"+gbkStyle3);
			} catch (Exception e) {
				e.printStackTrace();
			}
			//方法四
			try {
				String gbkStyle41 = gbkToUnicode(ss);
				String gbkStyle42 = unicodeToUtf8(gbkStyle41);
				logger.info("gbk2Utf encodeToGBK FOUR:"+gbkStyle42);
				
				String encoding1 = getEncoding(gbkStyle42);
				logger.info("encoding After:"+encoding1);
			} catch (Exception e) {
				e.printStackTrace();
			}
			//方法五
			try {
				String gbkStyle5=new String(ss.getBytes("GB2312"),"UTF-8");//轉換後的結果
				logger.info("gbk2Utf encodeToGBK FIVE:"+gbkStyle5);
			} catch (Exception e) {
				e.printStackTrace();
			}
			//方法六
			try {
				String gbkStyle6  = URLEncoder.encode (ss, "UTF-8" );
				logger.info("gbk2Utf encodeToGBK 6:"+gbkStyle6);
			} catch (Exception e) {
				e.printStackTrace();
			}
			
			return ss;
			} catch (Exception e) {
				e.printStackTrace();
			}
	        return null;
}
	/**
	 * GBK轉UTF-8 方式一
	 */
	 
	 private  static String gbk2Utf(String gbk) throws UnsupportedEncodingException {  
 	    char[] c = gbk.toCharArray();  
 	    byte[] fullByte = new byte[3*c.length];  
 	    for (int i=0; i<c.length; i++) {  
 	        String binary = Integer.toBinaryString(c[i]);  
 	        StringBuffer sb = new StringBuffer();  
 	        int len = 16 - binary.length();  
 	        //前面補零  
 	        for(int j=0; j<len; j++){  
 	                sb.append("0");  
 	            }  
 	        sb.append(binary);  
 	        //增加位，達到到24位3個位元組  
 	        sb.insert(0, "1110");  
 	            sb.insert(8, "10");  
 	            sb.insert(16, "10");  
 	            fullByte[i*3] = Integer.valueOf(sb.substring(0, 8), 2).byteValue();//二進位制字串建立整型  
 	            fullByte[i*3+1] = Integer.valueOf(sb.substring(8, 16), 2).byteValue();  
 	            fullByte[i*3+2] = Integer.valueOf(sb.substring(16, 24), 2).byteValue();  
 	    }  
 	    //模擬UTF-8編碼的網站顯示  
 	    
 	    return(new String(fullByte,"UTF-8"));
 	}
	 /**
	  * GBK轉 UTF-8方式二:
	  */
	 
	 public static byte[] getUTF8BytesFromGBKString(String gbkStr) {  
	        int n = gbkStr.length();  
	        byte[] utfBytes = new byte[3 * n];  
	        int k = 0;  
	        for (int i = 0; i < n; i++) {  
	            int m = gbkStr.charAt(i);  
	            if (m < 128 && m >= 0) {  
	                utfBytes[k++] = (byte) m;  
	                continue;  
	            }  
	            utfBytes[k++] = (byte) (0xe0 | (m >> 12));  
	            utfBytes[k++] = (byte) (0x80 | ((m >> 6) & 0x3f));  
	            utfBytes[k++] = (byte) (0x80 | (m & 0x3f));  
	        }  
	        if (k < utfBytes.length) {  
	            byte[] tmp = new byte[k];  
	            System.arraycopy(utfBytes, 0, tmp, 0, k);  
	            return tmp;  
	        }  
	        return utfBytes;  
	    }
	 /**
	  * GBK轉 UTF-8 方式三
	  */
	 private static String charsetConvert(String str, String charset) {
		    try {
		        str = new sun.misc.BASE64Encoder().encode(str.getBytes(charset));
		        byte[] bytes = new sun.misc.BASE64Decoder().decodeBuffer(str);
		        str = new String(bytes, charset);
		    } catch(IOException e) {
		        e.printStackTrace();
		    }
		    return str;
		}
	 
	 
	 	/**
	 	 * 獲取字串的編碼方式
	 	 * @param str
	 	 * @return
	 	 */
		public static String getEncoding(String str) {      
		       String encode = "GB2312";      
		      try {      
		          if (str.equals(new String(str.getBytes(encode), encode))) {      
		               String s = encode;      
		              return s;      
		           }      
		       } catch (Exception exception) {      
		       }      
		       encode = "ISO-8859-1";      
		      try {      
		          if (str.equals(new String(str.getBytes(encode), encode))) {      
		               String s1 = encode;      
		              return s1;      
		           }      
		       } catch (Exception exception1) {      
		       }      
		       encode = "UTF-8";      
		      try {      
		          if (str.equals(new String(str.getBytes(encode), encode))) {      
		               String s2 = encode;      
		              return s2;      
		           }      
		       } catch (Exception exception2) {      
		       }      
		       encode = "GBK";      
		      try {      
		          if (str.equals(new String(str.getBytes(encode), encode))) {      
		               String s3 = encode;      
		              return s3;      
		           }      
		       } catch (Exception exception3) {      
		       }      
		      return "";      
		   }
		/**
	     * gbk轉unicode
	     * @param str
	     * @return
	     */
	    public static String gbkToUnicode(String str) {
	        StringBuffer result = new StringBuffer();
	        for (int i = 0; i < str.length(); i++) {
	            char chr1 = (char) str.charAt(i);
	            if ((chr1 & (0x00FF)) == chr1) {
	                result.append(chr1);
	                continue;
	            }
	            result.append("\\u" + Integer.toHexString((int) chr1));
	        }
	        return result.toString();
	    }
	    /**
	     * unicode轉utf-8
	     * @param theString
	     * @return
	     */
	    public static String unicodeToUtf8(String theString) {
	        char aChar;
	        int len = theString.length();
	        StringBuffer outBuffer = new StringBuffer(len);
	        for (int x = 0; x < len;) {
	            aChar = theString.charAt(x++);
	            if (aChar == '\\') {
	                aChar = theString.charAt(x++);
	                if (aChar == 'u') {
	                    int value = 0;
	                    for (int i = 0; i < 4; i++) {
	                        aChar = theString.charAt(x++);
	                        switch (aChar) {
	                        case '0':
	                        case '1':
	                        case '2':
	                        case '3':
	                        case '4':
	                        case '5':
	                        case '6':
	                        case '7':
	                        case '8':
	                        case '9':
	                            value = (value << 4) + aChar - '0';
	                            break;
	                        case 'a':
	                        case 'b':
	                        case 'c':
	                        case 'd':
	                        case 'e':
	                        case 'f':
	                            value = (value << 4) + 10 + aChar - 'a';
	                            break;
	                        case 'A':
	                        case 'B':
	                        case 'C':
	                        case 'D':
	                        case 'E':
	                        case 'F':
	                            value = (value << 4) + 10 + aChar - 'A';
	                            break;
	                        default:
	                            throw new IllegalArgumentException(
	                                    "Malformed   \\uxxxx   encoding.");
	                        }
	                    }
	                    outBuffer.append((char) value);
	                } else {
	                    if (aChar == 't')
	                        aChar = '\t';
	                    else if (aChar == 'r')
	                        aChar = '\r';
	                    else if (aChar == 'n')
	                        aChar = '\n';
	                    else if (aChar == 'f')
	                        aChar = '\f';
	                    outBuffer.append(aChar);
	                }
	            } else
	                outBuffer.append(aChar);
	        }
	        return outBuffer.toString();
	    }

urt-8轉成GBK 之多種方法

/** * <p>Description:獲取字串後的第二個?後的字串</p> * @author sunshaofeng * @date 2018-9-18 15:45 * @return * @version 1.0 */ p

C++之MFC從exe應用轉成dll簡潔快速方法

最開始都是使用從exe或者dll單獨開發，最近遇到一個專案，搞了好久，程式碼量和業務量很大，忽然需要將之前的exe轉換為dll，來被別的模組呼叫，瞬間悲催，從網上找了些方法，寫的都是很概括，沒有什麼太大幫助，後來鑽研了一天終於搞定，下面把心得記錄一下： 1.找到exe專案中

fastjson解析超長json串以及轉成list,map等方法實例

log 方法其他 sonar 分享分號 mage pla sina 　　今天在工作中出現了這麽一個問題,在手機桌面的app加密解密後,字符串超長,讀取兩三個都會出現內存溢出的現象,最後只能根據id累加來一個個解析.解析出來的數據最後在進行處理. 轉換成對象使用的是阿裏巴

python入門：UTF-8轉換成GBK編碼

終端 nco 什麽等於 windows 就是 python 2 類型 window 1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 #UTF-8轉換成GBK編碼 4 #temp(臨時雇員，譯音：泰坡) 5

將圖片資源轉化為Bitmap的多種方法

圖片資源轉化為Bitmap的多種方法,總有一款是你需要的方法1: Bitmap bitmap = BitmapFactory.decodeResource(getResources(), R.mipmap.mingchuseal, newOpts); 方法2:

vue打包的時候自動將px轉成rem的操作方法

px2rem-loader 需要與 flexible 配合使用，不然px2rem僅僅只是轉成rem卻不會設定rem的資訊安裝 flexible npm i lib-flexible -S 然後在main.js中引入 import ‘lib-flexible/flexible

一種將英文文章字串每個單詞首字母轉成大寫字母的方法

import java.util.Arrays; public class newexercise3 {public static void main(String[] args) {String str =new String("If you were a teardro

[轉]成神之路

成神之路　　引言　　現在起點已經有六萬多位作者，對於一個剛入行的新人來說，要想從這六萬名“敵人”的重重包圍中殺出，成為一線作者，成為其他人口中的“大神”，難度不可謂不大，但是，這並不是沒有可能的，而且，只要肯努力，只要找對方法，這種可能性是極大的

十進位制轉換成二進位制(如8轉成1000)

alter proc prc_num @num bigintasdeclare @numstr varchar(50)set @numstr=''while (@num<>0)begin set @[email protected]+convert(

將表示時間的毫秒整數轉成時間顯示的方法

轉換數字秒為時間在SQL Server查詢分析器中執行SQL語句如下語句即可： select '1240243635 = ' as '秒數', dateadd(ss, 1240243635, '1970-01-01 00:00') 輸出示例：秒數時間 12402

今天這篇內容分享Apache由http自動跳轉到https的多種方法

admin 頁面站點自動 rule 所有 access http請求使用　　本文主要和大家分享Apache http自動跳轉到https的幾種方法，非常不錯，具有參考借鑒價值，需要的朋友參考下　　本文主要和大家分享Apache http自動跳轉到https的幾種

Linux使用技巧7--GBK轉成UTF-8

檔案的內容編碼的轉換Windows系統中編輯的Java原始碼，在Linux下開啟會出現中文亂碼的情況。原因就是檔案編碼格式的問題，Windows下通常是GBK而Linux下是UTF-8。在vim中用set fileencoding命令就可以看出編碼格式，如下：//li

玩轉web之json(五)---將表單通過serialize()方法獲取的值轉成json

form表單有一個serialize()方法，可以序列化表單的值，但是jquery提供的這個方法會把資料序列化為類似下面的形式： a=1&b=2&c=3&d=4 jquery並沒有提供將表單資料序列化為json的方法，所以需要我們自己封裝一下，下面給

Objective-C之成魔之路【8-訪問成員變量和屬性】

order 線程安全 ring 內容時間 targe 簡化音樂 blank 郝萌主傾心貢獻，尊重作者的勞動成果。請勿轉載。假設文章對您有所幫助，歡迎給作者捐贈，支持郝萌主，捐贈數額任意，重在心意^_^ 我要捐贈: 點擊捐贈 Cocos2d-X源代碼

（轉） SolrCloud之分布式索引及與Zookeeper的集成

閾值 leader選舉較高的配置配置信息 tail ots 便是 recovery http://blog.csdn.net/ebay/article/details/46549481 作者：Wang, Josh 一、概述 Lucene是一個Java語言

Python之str型轉成int型

port bsp char pan func tool fun lam lambda str轉int: 1 def fn(x,y): 2 return x*10+y 3 4 def char2num(s): 5 return {‘0‘:0, ‘1‘:1,

pyhton3.5將漢字轉成二進制的方法

font code 中國進制 family bytes print 3.5 int 直接上代碼:name = "你好,中國人"byteName = bytes(name.encode("utf-8"))print(byteName)for b in byteName :

Python 之 new() 方法與實例化(轉)

啟動是否 copy 調用 def 得到互調沒有客戶 _new__() 是在新式類中新出現的方法，它作用在構造方法建造實例之前，可以這麽理解，在 Python 中存在於類裏面的構造方法 __init__() 負責將類的實例化，而在 __init__() 啟動之前，__

JavaSE8基礎 Integer構造方法將符合標準的String類型轉成int類型

light 方法 win 異常 javase png integer 基礎 pre os ：windows7 x64 jdk：jdk-8u131-windows-x64 ide：Eclipse Oxygen Release (4.7.0)

Python爬蟲系列（四）：Beautiful Soup解析HTML之把HTML轉成Python對象

調用 nor 結束版本現在 name屬性 data 官方文檔 get 在前幾篇文章，我們學會了如何獲取html文檔內容，就是從url下載網頁。今天開始，我們將討論如何將html轉成python對象，用python代碼對文檔進行分析。 (牛小妹在學校折騰了好幾天，也沒把h

urt-8轉成GBK 之多種方法

相關推薦