>백엔드 개발 >파이썬 튜토리얼 >Python에서 NRC 사전을 사용한 감정 분류

Python에서 NRC 사전을 사용한 감정 분류

WBOY
WBOY앞으로
2023-09-12 08:13:02963검색

Python에서 NRC 사전을 사용한 감정 분류

감정 인식 또는 인식은 환경에 표시되는 특정 감정을 인식하고 이를 여러 감정 범주 중 하나로 분류하는 사람이나 사물의 능력입니다.

Python의

감정 분류는 단어나 문장에 긍정적 또는 부정적 태그를 지정하고 이에 따라 극성 점수를 할당하는 기존 감정 분석 기술에 대한 실행 가능한 대안입니다.

이 알고리즘의 기본 아이디어는 텍스트에서 감정을 묘사하는 단어를 분할하려고 시도하는 인간의 사고 과정을 모방하는 것입니다. 분석은 사전 설정된 정보 세트가 분류의 기초로 시스템에 입력되는 훈련 데이터 세트를 사용하여 수행됩니다.

이 패키지는 NLTK 라이브러리 의 WordNet 동의어 사전과 캐나다 국립 연구 위원회(NRC) 감정 어휘집을 기반으로 하며 27,000개 이상의 용어 를 포함합니다.

도서관에서는 다음 범주를 사용하여 단어의 감정적 영향을 측정하고 분류합니다. -

  • 두려움

  • 화나

  • 기대됩니다

  • 신뢰

  • 서프라이즈

  • 긍정

  • 부정

  • 슬프다

  • 역겹다

  • 기쁨

설치 단계

  • 1단계 - 터미널에서 pip install 명령을 사용하여 NRC 모듈을 설치합니다.

으아아아 Windows를 사용하는 경우 jupyter에서

Notebook명령 프롬프트 설치는 일반적으로 동일한 단계를 따릅니다.

MacO에서의 설치도 동일한 명령을 따릅니다. 터미널을 직접 사용하세요.

  • 2단계 - MissingCorpusError 발생을 방지하려면 textblob 및

    nrclex
  • 도 설치하세요. 으아아아 ul>
    • 3단계 - textblob에서 말뭉치 다운로드

    • 으아아아
    설치 후 라이브러리 가져오기 및 텍스트 개체 생성을 진행할 수 있습니다.

    기본 방법

    1. 원본 텍스트를 필터링된 텍스트로 변환(최상의 결과를 얻으려면 "텍스트"가 유니코드여야 함). 으아아아

    2. 토큰화된 단어 목록을 토큰 목록으로 변환 으아아아

    3. 단어 목록으로 돌아갑니다. 으아아아

    4. 문장 목록을 반환합니다. 으아아아

    5. 영향 목록을 반환합니다. 으아아아

    6. 효과 사전을 반환합니다. 으아아아

    7. 원시 감정 개수를 반환합니다. 으아아아

    8. 최고의 감정으로 돌아가십시오. 으아아아

    9. 반환 빈도. 으아아아

    여기에서는 감정에 따라 단어 목록을 분류하기 위해 top_emotions 함수를 사용합니다.

    알고리즘

    1단계 - nrclex 가져오기 nrclex 가져오기

    2단계 - nrclex에서 NRCLex 가져오기

    3단계 - 분류하려는 문자열 단어 목록 초기화

    4단계 - len(text) 범위의 i

    4단계 - Sentiment = NRCLex(text[i]) #각 텍스트에 대한 객체 생성

    5단계 - emotion.top_emotions #감정분류

    으아아아

    출력

    으아아아

    알고리즘

    1단계 - nrclex 가져오기

    2단계 - nrclex에서 NRCLex 가져오기

    3단계 - 분류하려는 문자열 단어 목록 초기화

    4단계 - 범위 내 i용 len(text)

    4단계 - Sentiment = NRCLex(text[i]) #각 텍스트에 대한 객체 생성

    5단계 - emotion.top_emotions #감정분류

    으아아아

    출력

    으아아아

    결론

    NRC 감정 사전은 연구 및 산업 분야의 감정 분석 및 감정 분류 작업에 널리 사용됩니다. 이는 지원 및 추가 개발에 사용할 수 있는 대규모 사용자 및 리소스 커뮤니티가 있음을 의미합니다. NRCLex는 또한 Google 번역을 사용하여 전 세계 100개 이상의 언어에 대한 안정적인 출력을 제공하여 언어 장벽을 성공적으로 허물었습니다. 이는 의료 분야에 여러 가지로 적용되며 전염병 대응을 이해하는 데 도움이 될 수 있습니다. 실제 응용 분야에는 심리학 및 행동 과학, 가짜 뉴스 감지 및 향상된 인간-컴퓨터 상호 작용이 포함됩니다.

위 내용은 Python에서 NRC 사전을 사용한 감정 분류의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 tutorialspoint.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
이전 기사:Python의 병렬 처리다음 기사:Python의 병렬 처리