现在遇到一个问题,淘宝的地址格式不规则,本来我想用正则的方式提取,尝试好多种都不行。
这是几个不规则的案例
1,福贵,18752622854-4776,0752-24678465,湖南省 株洲市 醴陵市 客家话街道 豆腐干斜坡上去、烧烤隔壁遇酒 ,412200
(用户填写了两个联系电话,我只需要手机号码的那个,座机的不提取)
2,刚子,86-15670342508,广东省 深圳市 坪山区 坪山街道 海关监管168号第三方B座2103 ,000000
(用户使用的是正常手机号(非虚拟号))
3,翔妃子的,15634966784-9352,广西壮族自治区 北海市 海城区 涠洲镇 房管局很讨厌28号欢聚一堂 ,536000
(用户使用的是虚拟手机号)
4,二十一,15456771441-4962,吉林省 辽源市 龙山区 县级直管街道 天涯高峰会(村),不要放快递站 ,000000
(用户在详细地址后又添加了一个逗号,快递站)
5,刚子,15670342508,广东省 深圳市 坪山区 坪山街道 海关监管168号第三方B座2103 ,000000

上面是地址字符串会出现的几种形式,变化有好几种,比如电话项的86-*******或者是虚拟号******-8795,而我想要的是不管地址字符是怎样的格式,我始终需要图中完整的1/2/4/5元素