머신러닝에서는 Python의 자연어 처리 프레임워크인 NLTK를 사용하는 경우가 많습니다. 이는 머신러닝에 일반적으로 사용되는 패키지이므로 사용 중에 많은 문제에 직면하게 됩니다. 나는 이것에 대한 나의 경험 중 일부를 여러분과 공유하겠습니다.
오늘은 설치 과정과 설치 중 발생한 다운로드 오류에 대해 이야기해보겠습니다.
>>> import nltk
>>> nltk.download()
NLTK 다운로더
-- ------------------------------------- -----------------------
d) 다운로드 l) 목록 c) 구성 h) 도움말 q) 종료
------------------------------------- ----------
다운로더> l
패키지:
서버 연결 오류 : [Errno -2] 이름이나 서비스를 알 수 없습니다
추측 결과, 다운로드 서버 주소에 서버가 접속하지 못하는 현상입니다.
nltk 다운로드 구성 확인
Downloader> c
데이터 서버:
- URL:
- 3개 패키지 사용 가능한 컬렉션
- 74개의 개별 패키지 사용 가능
로컬 머신:
- 데이터 디렉터리: /home/wym/nltk_data
그런 다음
> 컬 http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml
오류: 컬: (6) 호스트 'nltk.googlecode.com'을 확인할 수 없습니다
Google 주소가 차단되었을 것입니다(모두가 알고 있음)
해결책:
DNS 주소를 수정하세요.
> vim /etc/resolv .conf
네임서버를 다음으로 수정: nameserver 8.8.8.8
문제 해결됨