首页  >  问答  >  正文

a标签 url 正则怎么写(python 或者js)

<a target="blank"href="http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&amp;page=1&amp;viewtype=basic&amp;category=rf"></a>
<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf"></a>

<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf"></a>


<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp"></a>

<a target="blank"href="http://a.b.c.d/abc"></a>


<a target="blank"href="http://a.b.c.d/123"></a>

我要取 href里的链接

6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category)

第二个和第三个链接相同 怎么去重复(python下)

怪我咯怪我咯2712 天前639

全部回复(2)我来回复

  • 黄舟

    黄舟2017-05-18 10:53:20

    雷雷

    回复
    0
  • 伊谢尔伦

    伊谢尔伦2017-05-18 10:53:20

    提取前三个链接:

    links= re.findall(r'href=\"(.*?=rf)\"',l_string,re.S)

    去重:

    new_links=set(links)
    
    

    回复
    0
  • 取消回复