Python正则表达式匹配问题
待处理的部分文本(为方便阅读,已做换行处理,实际文本没有)如下:
1 2 3 4 5 6 7 | var station_names = '@bjb|北京北|VAP|beijingbei|bjb| 0
@bjd |北京东|BOP|beijingdong|bjd| 1
@bji |北京|BJP|beijing|bj| 2
@bjn |北京南|VNP|beijingnan|bjn| 3
@bjx |北京西|BXP|beijingxi|bjx| 4
@gzn |广州南|IZQ|guangzhounan|gzn| 5
@cqb |重庆北|CUW|chongqingbei|cqb|
|
最开始的代码是这样的:
1 2 3 4 | r = requests.get(url,verify = False )
stations = re.findall(r '([A-Z]+)|([a-z]+)' ,r.text)
stations = dict (stations)
stations = dict ( zip (stations.values(),stations.keys()))
|
得到的输出如下:
1 2 3 4 5 6 | { 'acheng' : 'ACB' ,
'aershan' : 'ART' ,
'aershanbei' : 'ARX' ,
'aihe' : 'AHP' ,
'aijiacun' : 'AJJ' ,
}
|
现在在Python中,想进一步,用正则表达式提取出其中的中文站名和对应的英文大写缩写。尝试了多次都失败了。。。请问要怎么写。。。也就是说想要输出的是:
1 2 3 4 5 6 | { '阿城' : 'ACB' ,
'阿尔山' : 'ART' ,
'阿尔山北' : 'ARX' ,
'艾河' : 'AHP' ,
'艾家村' : 'AJJ' ,
}
|