搜尋

首頁  >  問答  >  主體

a標籤 url 正規怎麼寫(python 或js)

<a target="blank"href="http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&amp;page=1&amp;viewtype=basic&amp;category=rf"></a>
<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf"></a>

<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf"></a>


<a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp"></a>

<a target="blank"href="http://a.b.c.d/abc"></a>


<a target="blank"href="http://a.b.c.d/123"></a>

我要拿 href裡的連結

6個連結 前三個符合條件 正規怎麼寫(即連結中必須帶有參數viewkey page viewtype category)

第二個和第三個連結相同 怎麼去重複(python下)

怪我咯怪我咯2756 天前670

全部回覆(2)我來回復

  • 黄舟

    黄舟2017-05-18 10:53:20

    雷雷

    回覆
    0
  • 伊谢尔伦

    伊谢尔伦2017-05-18 10:53:20

    提取前三個連結:

    links= re.findall(r'href=\"(.*?=rf)\"',l_string,re.S)

    去重:

    new_links=set(links)
    
    

    回覆
    0
  • 取消回覆