検索

ホームページ  >  に質問  >  本文

python - 为什么正则表达式抓取不到数据?

已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?

def zhengze():

material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)

这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?

高洛峰高洛峰2889日前727

全員に返信(2)返信します

  • 怪我咯

    怪我咯2017-04-18 09:19:41

    material.read() 2 回使用しました!!!
    2 回目はデータを読み取ることができます。
    read() メソッドは、読み取り後にファイル全体を読み取る必要があります。ファイルの最後に到達すると、再度読み込むと '' が返されます。

    のように記述することをお勧めします。 リーリー

    返事
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 09:19:41

    まずread()後のデータを変数に保存します。

    返事
    0
  • キャンセル返事