工作中碰到的Java問題整理及解決方案
阿新 • • 發佈:2018-12-29
1.SOH分隔符(Notepad++)
SOH是ASCII碼錶為ASCII值==1的控制字元(不可見)char字元:0x01
Java String.split() 以SOH為分隔符的字串
//第一種方案(最優解決方案) lineTxt.split("\001", -1); str.split("\u0001", -1); //第二種方案和第一種類似 private static final byte[] SOH = { 0x01 }; private static final String SPLIT = new String(SOH); lineTxt.split(SPLIT, -1); //第三種解決方案比較麻煩(之前不知道第一種解決方案) //先把SOH字元替換為‘|’,再使用split("\\|", -1); public static String conver(String lineTxt){ char[] cs = lineTxt.toCharArray(); StringBuilder builder = new StringBuilder(); for (char c : cs) { if(c == 0x01){ builder.append("|"); }else{ builder.append(c); } } return builder.toString(); }
測試第一種方案
/** * 測試SOH控制字元為分隔符 */ @Test public void test(){ char c = 0x01; String xdrstr = "2018072607182018-07-26 07:18:34.3422018-07-26 07:18:34.3744600773516111053532680788981525353268076\\N25525525525565535\\N65535241763786765535255429496729532416838592749884294967295255.255.255.255255.255.255.255\\N100.84.4.1\\N100.84.88.249364123641265535429496729513648107873458IMS.mnc000.mcc460.gprs1861573551700318051912552557098226391199377408\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N03555\\N5b59054a0000bd7600bd7601b249388c"; System.out.println(xdrstr.split("\001")[1]); } @Test public void test09(){ String str = "428\u00011\u000152358\u00010\u00010\u00010\u0001416\u00013102\u000128985\u00010\u00012018-11-19 16:48:33.578653440\u00012818689326047227317\u0001255\u00010\u00010\u000112\u00010\u000112\u0001255\u0001255\u0001255\u00013322070061\u000136097\u000164\u00010\u00010.0.0.0\u00010.0.0.0\u000133628723\u0001297304\u000110.100.0.3\u000110.107.105.46\u000136412\u00012901\u0001146929409\u000131136\u0001460\u00011\u00011\u00010\u00013200465\u00013200465\u0001\u0001\u0001\u0001\u0001255\u0001255\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010"; System.out.println(str.split("\u0001", -1)[40]); }
Linux下awk分析結構化檔案(以SOH為分隔符)
分隔符轉義,單雙引號是有區別的