찾다

 >  Q&A  >  본문

python - 为什么正则表达式抓取不到数据?

已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?

def zhengze():

material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)

这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?

高洛峰高洛峰2889일 전726

모든 응답(2)나는 대답할 것이다

  • 怪我咯

    怪我咯2017-04-18 09:19:41

    material.read() 두 번 사용하셨습니다!!!
    두 번째로 데이터를 읽을 수 있다는 것이 확실합니다.
    read() 메서드는 읽은 후 파일 포인터를 읽어야 합니다. 다시 읽으면 ''이 반환되므로 다음과 같이 작성하는 것이 좋습니다.

    으아악

    회신하다
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 09:19:41

    먼저 변수에 read() 이후의 데이터를 저장합니다.

    회신하다
    0
  • 취소회신하다