Python中的自然語言處理實例：情感分析-Python教學-PHP中文網

首頁

後端開發

Python教學

Python中的自然語言處理實例：情感分析

王林

Jun 11, 2023 am 08:26 AM

python自然語言處理情緒分析

Python中的自然語言處理實例：情感分析

隨著人工智慧的發展，自然語言處理（NLP）在各個領域中越來越受到關注。其中，情緒分析是NLP應用的重要方向。情感分析可以用來分析使用者對產品、服務或事件的情感傾向，幫助企業更好地理解消費者需求，促進行銷策略的發展。本文將介紹Python中進行情緒分析的實例。

安裝必要的函式庫

在Python中進行情緒分析，需要使用第三方函式庫Natural Language Toolkit（NLTK）和TwitterAPI。可以使用pip來安裝這兩個函式庫：

pip install nltk
pip install TwitterAPI

資料預處理

在進行情緒分析之前，需要先對文字進行預處理。可以統一將文字轉換成小寫字母，去除標點符號、數字、停用詞等無關訊息。預處理的程式碼如下：

import re
from nltk.corpus import stopwords

def clean_text(text):
    text = text.lower() # 将文本转换成小写字母
    text = re.sub(r'[^ws]', '', text) # 去除标点符号
    text = re.sub(r'd+', '', text) # 去除数字
    stop_words = set(stopwords.words('english'))
    words = text.split()
    words = [w for w in words if w not in stop_words] # 去除停用词
    text = ' '.join(words)
    return text

情緒分析模型

接下來，需要建立一個情緒分析模型。由於情緒分析屬於監督式學習（即需要標註好的資料），因此建立模型需要有標註好的訓練資料。此處使用來自NLTK的電影評論資料集，其中包含1000條帶有正面或負面情感傾向的評論。這些評論已經被標記好了。

import nltk
from nltk.corpus import movie_reviews
import random

documents = [(list(movie_reviews.words(fileid)), category)
             for category in movie_reviews.categories()
             for fileid in movie_reviews.fileids(category)]

random.shuffle(documents)

在得到訓練資料之後，可以透過使用nltk中的NaiveBayesClassifier來建立一個樸素貝葉斯分類器。程式碼如下：

all_words = nltk.FreqDist(w.lower() for w in movie_reviews.words())
word_features = list(all_words.keys())[:2000]

def document_features(document):
    document_words = set(document)
    features = {}
    for word in word_features:
        features['contains({})'.format(word)] = (word in document_words)
    return features

featuresets = [(document_features(d), c) for (d,c) in documents]
train_set, test_set = featuresets[200:], featuresets[:200]
classifier = nltk.NaiveBayesClassifier.train(train_set)

這個分類器是基於樸素貝葉斯演算法，使用訓練資料的特徵來進行分類。在本實例中，使用的是以單字形式為特徵的「包含（word）」函數。這個函數會檢查文件是否包含了這個單字。

情緒分析應用

完成模型的建立後，就可以使用它來進行情緒分析。在這個實例中，利用TwitterAPI從Twitter上取得推文，然後對推文進行情緒分析。

from TwitterAPI import TwitterAPI
import json

consumer_key = 'your consumer key'
consumer_secret = 'your consumer secret'
access_token_key = 'your access token key'
access_token_secret = 'your access token secret'

api = TwitterAPI(consumer_key,
                 consumer_secret,
                 access_token_key,
                 access_token_secret)

def analyze_tweet(tweet):
    tweet_text = tweet['text']
    tweet_clean = clean_text(tweet_text)
    tweet_features = document_features(tweet_clean.split())
    sentiment = classifier.classify(tweet_features)
    return sentiment

keywords = 'Trump'

for tweet in api.request('search/tweets', {'q': keywords, 'lang': 'en', 'count': 10}):
    sentiment = analyze_tweet(tweet)
    print(tweet['text'])
    print(sentiment)
    print('
')

這個程式碼片段利用TwitterAPI取得包含關鍵字「Trump」的最新的10條推文。然後，對每條推文進行情緒分析，並輸出情感傾向。

除了Twitter外，還可以使用這個模型在其他的文字資料上進行情緒分析。

結論

這篇文章介紹了Python中的情緒分析實例。這個實例利用訓練有素的樸素貝葉斯分類器對文本進行分類，可以用來判斷文本的情感傾向。情感分析可以在行銷和社群媒體監測等領域中廣泛應用。

以上是Python中的自然語言處理實例：情感分析的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

Python：遊戲，Guis等Apr 13, 2025 am 12:14 AM

Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame，提供繪圖、音頻等功能，適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt，Tkinter簡單易用，PyQt功能豐富，適合專業開發。

Python vs.C：申請和用例Apr 12, 2025 am 12:01 AM

Python适合数据科学、Web开发和自动化任务，而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称，C 则以高性能和底层控制能力闻名。

2小時的Python計劃：一種現實的方法Apr 11, 2025 am 12:04 AM

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型，2.掌握控制流（條件語句和循環），3.理解函數的定義和使用，4.通過簡單示例和代碼片段快速上手Python編程。

Python：探索其主要應用程序Apr 10, 2025 am 09:41 AM

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中，Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域，NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面，Python適用於自動化測試和系統管理等任務。