搜尋

首頁  >  問答  >  主體

python - 为什么正则表达式抓取不到数据?

已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?

def zhengze():

material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)

这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?

高洛峰高洛峰2888 天前723

全部回覆(2)我來回復

  • 怪我咯

    怪我咯2017-04-18 09:19:41

    material.read() 你用了兩次!!!
    你確定第二次能讀到數據.
    read() 方法是讀取整個文件,讀完文件指針應該到了文件末尾,再次讀取就返回''了,建議這樣寫:

    def zhengze():
        material=open(r"c:\test.txt","r")
        res = material.read()
        print(res)
        pattern=re.compile(r"<p>")
        joke=re.search(pattern,res)
        print(joke)

    回覆
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 09:19:41

    先把read()後的資料保存的變數裡。

    回覆
    0
  • 取消回覆