>  기사  >  백엔드 개발  >  요청 및 lxml을 사용하여 크롤러를 구현하는 예제 튜토리얼

요청 및 lxml을 사용하여 크롤러를 구현하는 예제 튜토리얼

PHP中文网
PHP中文网원래의
2017-06-20 14:46:432109검색

# 페이지를 요청하는 모듈을 요청합니다
# lxml 모듈의 html 빌드 선택기 선택기(형식화된 응답 응답)
# from lxml import html
# 가져오기 요청

# 응답 = 요청.get(url) .content

# selector = html.formatstring(response)

# hrefs = selector.xpath('/html/body//div[@class='feed-item _j_feed_item']/a + 이것은 페이지를 크롤링하기 전에 html 구조를 주의 깊게 분석해야 합니다. 일부 페이지는 js에 의해 생성됩니다. 이 페이지는 상대적으로 간단하며 향후 에세이에서 관련 정보를 공유하겠습니다.

위 내용은 요청 및 lxml을 사용하여 크롤러를 구현하는 예제 튜토리얼의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.