>  기사  >  백엔드 개발  >  nltk의 눈덩이 추출물 줄기

nltk의 눈덩이 추출물 줄기

高洛峰
高洛峰원래의
2016-10-18 10:12:574523검색

기계 학습에서 매우 중요한 응용 시나리오는 자동 기계 분류이며, 분류의 핵심은 형태소 분석입니다. 그래서 우리는 눈덩이를 사용해야 합니다. 스노우볼이 줄기를 추출하는 두 가지 방법에 대해 이야기해 보겠습니다.

두 가지 방법:

방법 1:

>>> from nltk import SnowballStemmer
>>> SnowballStemmer.언어s ​​# 지원되는 언어 확인
('덴마크어', '네덜란드어', '영어', '핀란드어', '프랑스어', '독일어', '헝가리어',
'이탈리아어', '노르웨이어', '포터', '포르투갈어" , 'romanian',
'russian', 'spanish', 'swedish')
>>> Stemmer = SnowballStemmer("german") # 언어 선택
>>> Stemmer.stem(u" Autobahnen") # 단어 어간
u'autobahn'
그러나 사용 중인 언어 시나리오를 알고 있으면 다음 방법을 사용하여 직접 호출할 수 있습니다.
방법 2:
>> > ps = nltk.stem .snowball.PortugueseStemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
유'셀룰'


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.