>  기사  >  백엔드 개발  >  Python 실용적인 크롤러 비디오 튜토리얼에 대한 권장 자료

Python 실용적인 크롤러 비디오 튜토리얼에 대한 권장 자료

黄舟
黄舟원래의
2017-09-01 13:55:171654검색

이 "Python 실용 크롤러 동영상 튜토리얼" 세트는 매우 강력한 Python 실용 동영상 튜토리얼입니다. 이미 Python에 대해 어느 정도 이해하고 있고 Python을 마스터했으며 한 단계 더 나아가고 싶은 친구들은 이 튜토리얼 세트를 배울 수 있습니다!

Python 실용적인 크롤러 비디오 튜토리얼에 대한 권장 자료

강좌 재생 주소: http://www.php.cn/course/603.html

선생님의 강의 스타일:

선생님의 강의는 간단하고 깊이 있고 명확합니다. 논리적 사고력을 사용하여 학생들의 관심을 끌고 이성을 사용하여 교실 교육 과정을 제어합니다. 선생님의 강의를 들으면서 학생들은 지식을 배울 뿐만 아니라 사고력 훈련도 받으며 선생님의 엄격한 학문적 태도에 영향을 받고 영향을 받습니다

이 영상에서 더 어려운 부분은 Python 크롤러입니다:

우리는 매일 인터넷을 서핑하다 보면 멋진 사진들을 자주 보게 되는데, 이런 사진들을 저장해서 다운로드 받거나, 바탕화면이나 디자인 자료로 활용하고 싶어집니다.

가장 일반적인 방법은 마우스 오른쪽 버튼을 클릭하고 다른 이름으로 저장을 선택하는 것입니다. 그러나 일부 사진에는 마우스 오른쪽 버튼을 클릭할 때 다른 이름으로 저장 옵션이 없습니다. 다른 방법은 스크린샷 도구를 사용하여 캡처하는 것이지만 이렇게 하면 사진의 선명도가 떨어집니다. 알았어~! 실제로 페이지 소스 코드를 보려면 마우스 오른쪽 버튼을 클릭하세요.

  Python을 사용하여 이러한 간단한 크롤러 기능을 구현하고 원하는 코드를 로컬에서 크롤링할 수 있습니다. Python을 사용하여 이러한 함수를 구현하는 방법을 살펴보겠습니다.

먼저 전체 페이지 데이터를 가져옵니다

먼저 다운로드할 이미지의 전체 페이지 정보를 가져올 수 있습니다.

getjpg.py

#coding=utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://tieba.baidu.com/p/2738151262")

print html

Urllib 모듈은 로컬 파일처럼 www 및 ftp의 데이터를 읽을 수 있는 인터페이스를 제공합니다. 먼저 getHtml() 함수를 정의합니다.

 urllib.urlopen() 메서드는 URL 주소를 여는 데 사용됩니다.

 read() 메소드는 URL의 데이터를 읽고 getHtml() 함수에 URL을 전달하고 전체 페이지를 다운로드하는 데 사용됩니다. 프로그램을 실행하면 전체 웹 페이지가 인쇄됩니다.

위 내용은 Python 실용적인 크롤러 비디오 튜토리얼에 대한 권장 자료의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.