<a target="blank"href="http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf"></a>
<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf"></a>
<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf"></a>
<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&"></a>
<a target="blank"href="http://a.b.c.d/abc"></a>
<a target="blank"href="http://a.b.c.d/123"></a>
我要拿 href裡的連結
6個連結 前三個符合條件 正規怎麼寫(即連結中必須帶有參數viewkey page viewtype category)
第二個和第三個連結相同 怎麼去重複(python下)
伊谢尔伦2017-05-18 10:53:20
提取前三個連結:
links= re.findall(r'href=\"(.*?=rf)\"',l_string,re.S)
去重:
new_links=set(links)