検索

ホームページ  >  に質問  >  本文

正则表达式 - python 的re正则编写问题,如果获得含有中文的目标字符串

描述:我有一个字符串a,我想获得目标字符串为[锡山区,南长区 ,惠山区,崇安区 ,北塘区 ,滨湖区 ,宜兴市 ,江阴市 ],我想使用正则的分组实现,但是却出错了?请问问题在哪里,感谢大家。
这是我的正则,我是刚学习的,出错了。
re.sub((^[dc='].>$)(.)(</span>$),r2,a)
原始字符串为:

<a title='锡山区房产' href='http://wx.cityhouse.cn/district/XS/'>锡山区</a>
<a title='南长区房产' href='http://wx.cityhouse.cn/district/NC/'>南长区</a>
<a title='惠山区房产' href='http://wx.cityhouse.cn/district/HS/'>惠山区</a>
<a title='崇安区房产' href='http://wx.cityhouse.cn/district/CA/'>崇安区</a>
<a title='北塘区房产' href='http://wx.cityhouse.cn/district/BT/'>北塘区</a>
<a title='滨湖区房产' href='http://wx.cityhouse.cn/district/BH/'>滨湖区</a>
<a title='宜兴市房产' href='http://yx.wx.cityhouse.cn'>宜兴市</a>
<a title='江阴市房产' href='http://jy.wx.cityhouse.cn'>江阴市</a>

补充说明:我是使用BeautifulSoup来获取的,网页有很多个<a节点,没有直接用get_text()是 有些<a节点的字符串不是我想要的

PHP中文网PHP中文网2810日前566

全員に返信(4)返信します

  • 迷茫

    迷茫2017-04-17 17:49:19

    リーリー

    返事
    0
  • 巴扎黑

    巴扎黑2017-04-17 17:49:19

    pyquery を使用します。構文は jquery と同じです。とても快適に感じるでしょう

    返事
    0
  • 黄舟

    黄舟2017-04-17 17:49:19

    soup.find_all('a') の a について:

    リーリー

    返事
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-17 17:49:19

    Xiao Taiwu のアプローチは実行可能です。
    上記に基づいていくつかの変更を加えます。

    リーリー

    xpath を学習してみませんか? この形式で Web ページを作成するのは非常に簡単です。

    返事
    0
  • キャンセル返事