Java正则表达式匹配地址获得省市县

Java正则表达式匹配地址获得省市县,第1张

正则表达式

正则表达式测试
正则表达式入门
匹配省、自治区以及四个直辖市作为省

((?[^省]+省|.+自治区)|上海市|北京市|天津市|重庆市)

匹配市、自治州、区作为市

(?[^市]+市|.+自治州|.+区)?

匹配县、市、区、镇、局作为县

(?[^县]+县|.+市|.+区|.+镇|.+局)?

匹配区、镇作为镇

(?[^区]+区|.+镇)?

匹配省市县镇以外其余数据

(?.*)
正则表达式匹配地址获得省市县
import java.util.ArrayList;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @Author zxy
 * @Date 2022-05-10
 * @Desc 使用正则表达式匹配省市县
 */
public class regex_address {
    /**
     * @Desc regexAddress()函数,传入地址,以List存储省市县
     * @param address
     * @return List>
     */
    public static List<Map<String,String>> regexAddress(String address){
        // 自定义正则表达式
        // 由于后续通过province分组无法获取到四个直辖市,所以在后续代码中再次处理,这里只需要匹配成功即可
        String regex = "((?[^省]+省|.+自治区)|上海市|北京市|天津市|重庆市)(?[^市]+市|.+自治州|.+区)?(?[^县]+县|.+市|.+区|.+镇|.+局)?(?[^区]+区|.+镇)?(?.*)";
        // 使用regex正则表达式匹配address地址
        Matcher matcher = Pattern.compile(regex).matcher(address);
        // 初始化省市县
        String province = null,city = null,country = null;
        // 定义ArrayList<>()
        ArrayList<Map<String, String>> table = new ArrayList<>();
        Map<String,String> row = null;
        //匹配成功的情况
        while (matcher.find()){
            row = new LinkedHashMap<String,String>();
            //自定义正则表达式2,用于匹配四个直辖市
            String regex2 = "(上海市|北京市|天津市|重庆市)";
            Matcher matcher1 = Pattern.compile(regex2).matcher(address);
            //如果匹配成功,则将直辖市复制给province变量
            if (matcher1.find())
                province = matcher1.group(1);
            else // 否则直接通过matcher从regex中根据分组province匹配获得
                province = matcher.group("province");
            row.put("province",province == null ? "":province.trim());
            city = matcher.group("city");
            row.put("city",city == null ? "" : city.trim());
            country = matcher.group("country");
            row.put("country",country == null ? "" : country);
            table.add(row);
        }
        return table;
    }
    public static void main(String[] args) {
        String[] addressList = {"浙江省杭州市西湖区", "江苏省苏州市吴中区", "河南省郑州市新郑市","上海市浦东新区","河南省郑州市新郑市","北京市朝阳区"};
        for(String address : addressList){
            System.out.println(address);
            List<Map<String, String>> address1 = regexAddress(address);
            String province = address1.get(0).get("province");
            String city = address1.get(0).get("city");
            String country = address1.get(0).get("country");
            System.out.printf("province:%s,city:%s,country:%s\n",province,city,country);
        }
    }
}

输出结果

浙江省杭州市西湖区
province:浙江省,city:杭州市,country:西湖区
江苏省苏州市吴中区
province:江苏省,city:苏州市,country:吴中区
河南省郑州市新郑市
province:河南省,city:郑州市,country:新郑市
上海市浦东新区
province:上海市,city:浦东新区,country:
河南省郑州市新郑市
province:河南省,city:郑州市,country:新郑市
北京市朝阳区
province:北京市,city:朝阳区,country:

Process finished with exit code 0

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/904994.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-15
下一篇 2022-05-15

发表评论

登录后才能评论

评论列表(0条)

保存