1. 程式人生 > >java 去除空格、標點符號

java 去除空格、標點符號

public class TempTest {
    public static void main(String[] args) {
        //string去除空格
        String str="  hello   world  ";
        System.out.println(str);

        String str1=str.trim();//去除首尾空格
        System.out.println(str1);

        String str2=str.replace(" ","");//去掉所有空格,包括首尾,中間
        System.out.println(str2);

        String str3=str.replaceAll(" +","");//去掉所有空格,包括首尾,中間
        System.out.println(str3);

        String str4=str.replaceAll("\\s*",""); //可以替換大部分空白字元, 不限於空格 . 說明:\s 可以匹配空格、製表符、換頁符等空白字元的其中任意一個
        System.out.println(str4);

        //string去除標點符號
        //正則表示式去除標點
        String stri="ss&*(,.~1如果@&(^-自己!!知道`什`麼#是$苦%……Z,&那*()麼一-=定——+告訴::;\"'/?.,><[]{}\\||別人什麼是甜。";
        System.out.println(stri);

        String stri1=stri.replaceAll("\\p{Punct}","");//不能完全清除標點
        System.out.println(stri1);

        String stri2=stri.replaceAll("\\pP","");//完全清除標點
        System.out.println(stri2);

        String stri3=stri.replaceAll("\\p{P}","");//同上,一樣的功能
        System.out.println(stri3);

        String stri4=stri.replaceAll("[\\pP\\p{Punct}]","");//清除所有符號,只留下字母 數字  漢字  共3類.
        System.out.println(stri4);
    }
}

執行結果:

  hello   world  
hello   world
helloworld
helloworld
helloworld
ss&*(,.~1如果@&(^-自己!!知道`什`麼#是$苦%……Z,&那*()麼一-=定——+告訴::;"'/?.,><[]{}\||別人什麼是甜。
ss1如果自己知道什麼是苦……Z,那麼一定——告訴別人什麼是甜。
ss~1如果^自己知道`什`麼是$苦Z那麼一=定+告訴><||別人什麼是甜
ss~1如果^自己知道`什`麼是$苦Z那麼一=定+告訴><||別人什麼是甜
ss1如果自己知道什麼是苦Z那麼一定告訴別人什麼是甜

關於replace 和replaceAll:

replace(char oldChar,char newChar)

replace(CharSequence  target,CharSequence  replacement)

replaceAll(String regex,String replacement)

1)replace的引數是char和CharSequence,即可以支援字元的替換,也支援字串的替換(CharSequence即字串序列的意思,說白了也就是字串);

2)replaceAll的引數是regex,即基於規則表示式的替換,比如,可以通過replaceAll("\\d", "*")把一個字串所有的數字字元都換成星號;

  相同點是都是全部替換,即把源字串中的某一字元或字串全部換成指定的字元或字串,如果只想替換第一次出現的,可以使用 replaceFirst(),這個方法也是基於規則表示式的替換,但與replaceAll()不同的是,只替換第一次出現的字串;

  另外,如果replaceAll()和replaceFirst()所用的引數據不是基於規則表示式的,則與replace()替換字串的效果是一樣的,即這兩者也支援字串的操作;

  還有一點注意:執行了替換操作後,源字串的內容是沒有發生改變的.