인증서 확인 실패: 스크래핑 시 SSL 오류 문제 해결
SSL(Secure Socket Layer) 프로토콜을 사용하는 웹 사이트를 스크래핑할 때 개발자는 다음과 같은 문제에 직면할 수 있습니다. "CERTIFICATE_VERIFY_FAILED" 오류. 이 오류는 웹사이트의 SSL 인증서 확인이 실패했음을 나타냅니다.
이 오류의 일반적인 예는 다음 Python 코드를 사용하여 Wikipedia를 스크래핑하려고 할 때 발생합니다.
<code class="python">import urllib.request import bs4 import re pages = set() def getLinks(pageUrl): global pages html = urllib.request.urlopen("http://en.wikipedia.org"+pageUrl) bsObj = bs4.BeautifulSoup(html) for link in bsObj.findAll("a", href=re.compile("^(/wiki/)")): if 'href' in link.attrs: if link.attrs['href'] not in pages: #We have encountered a new page newPage = link.attrs['href'] print(newPage) pages.add(newPage) getLinks(newPage) getLinks("")</code>
이를 실행할 때 코드를 사용하는 경우 다음 오류가 발생할 수 있습니다.
urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1049)>
macOS 사용자를 위한 솔루션
macOS를 사용하는 경우 이 오류에 대한 해결 방법은 간단합니다. Macintosh HD > 애플리케이션 > Python 3.6 폴더(또는 사용 중인 Python 버전)를 선택하고 "Install Certificates.command" 파일을 두 번 클릭합니다. 이 명령은 필요한 인증서를 시스템 키체인에 설치합니다.
이 명령을 실행한 후 Wikipedia 또는 기타 SSL 보안 웹사이트를 스크랩할 때 "CERTIFICATE_VERIFY_FAILED" 오류가 더 이상 나타나지 않습니다.
위 내용은 SSL을 사용하여 웹사이트를 스크랩할 때 \'CERTIFICATE_VERIFY_FAILED\' 오류를 수정하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!