1. 程式人生 > >java從地址串中解析提取省市區-完美匹配中國所有地址

java從地址串中解析提取省市區-完美匹配中國所有地址

前段時間專案中要解析android定位傳的一個地址串 分別存入 省 市 區 欄位,網上找的 寫正則 的方法大都只能解析 xx省xx市xx區 這樣的大眾化地址,而對於一些命名比較特別的地址(比如:西藏自治區日喀則地區日喀則市 / 海南省省直轄縣級行政單位中沙群島的島礁及其海域)就會出問題,我就將正則式進行了修改完善。廢話不多說 直接上程式碼:
package com.jt.util;

import java.util.ArrayList;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class AddressResolutionUtil {
	
	/**
     * 解析地址
     * @author lin
     * @param address
     * @return
     */
    public static List<Map<String,String>> addressResolution(String address){
        String regex="(?<province>[^省]+自治區|.*?省|.*?行政區|.*?市)(?<city>[^市]+自治州|.*?地區|.*?行政單位|.+盟|市轄區|.*?市|.*?縣)(?<county>[^縣]+縣|.+區|.+市|.+旗|.+海域|.+島)?(?<town>[^區]+區|.+鎮)?(?<village>.*)";
        Matcher m=Pattern.compile(regex).matcher(address);
        String province=null,city=null,county=null,town=null,village=null;
        List<Map<String,String>> table=new ArrayList<Map<String,String>>();
        Map<String,String> row=null;
        while(m.find()){
            row=new LinkedHashMap<String,String>();
            province=m.group("province");
            row.put("province", province==null?"":province.trim());
            city=m.group("city");
            row.put("city", city==null?"":city.trim());
            county=m.group("county");
            row.put("county", county==null?"":county.trim());
            town=m.group("town");
            row.put("town", town==null?"":town.trim());
            village=m.group("village");
            row.put("village", village==null?"":village.trim());
            table.add(row);
        }
        return table;
    }

	public static void main(String[] args) {
		System.out.println(addressResolution("湖北省武漢市洪山區"));
	}

}

下面對幾個代表性的地址進行測試:

System.out.println(addressResolution("湖北省武漢市洪山區"));
System.out.println(addressResolution("湖北省恩施土家族苗族自治州恩施市"));
System.out.println(addressResolution("北京市市轄區朝陽區"));
System.out.println(addressResolution("內蒙古自治區興安盟科爾沁右翼前旗"));
System.out.println(addressResolution("西藏自治區日喀則地區日喀則市"));
System.out.println(addressResolution("海南省省直轄縣級行政單位中沙群島的島礁及其海域"));

執行結果:


完美!!!

還有那些奇怪地址 歡迎留言……