下面小編就為大家帶來一篇python snownlp情緒分析簡易demo(分享)。小編覺得蠻不錯的,現在就分享給大家,也給大家做個參考。一起跟著小編過來看看吧
SnowNLP是國人開發的python類別庫,可以方便的處理中文文本內容,是受到了TextBlob的啟發而寫的,由於現在大部分的自然語言處理庫基本上都是針對英文的,於是寫了一個方便處理中文的類別庫,並且和TextBlob不同的是,這裡沒有用NLTK,所有的演算法都是自己實現的,並且自帶了一些訓練好的字典。注意本程式都是處理的unicode編碼,所以使用時請自行decode成unicode。 MIT許可下發行。
其github 主頁
#我自己修改了上文連結中的python程式碼並加入些許註解,以方便你的理解:
from snownlp import SnowNLP # SnowNLP库: # words:分词 # tags:关键词 # sentiments:情感度 # pinyin:拼音 # keywords(limit):关键词 # summary:关键句子 # sentences:语序 # tf:tf值 # idf:idf值 s = SnowNLP(u'这个东西真心很赞') # s.words # [u'这个', u'东西', u'真心', u'很', u'赞'] print(s.words) s.tags # [(u'这个', u'r'), (u'东西', u'n'), (u'真心', u'd') # , (u'很', u'd'), (u'赞', u'Vg')] print(s.sentiments) # s.sentiments # 0.9769663402895832 positive的概率 # s.pinyin # [u'zhe', u'ge', u'dong', u'xi', # u'zhen', u'xin', u'hen', # u'zan']4 s = SnowNLP(u'「繁體字」「繁體中文」的叫法在臺灣亦很常見。') # s.han # u'「繁体字」「繁体中文」的叫法在台湾亦很常见。' print(s.han)
from snownlp import SnowNLP text = u''' 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。 它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。 自然语言处理是一门融语言学、计算机科学、数学于一体的科学。 因此,这一领域的研究将涉及自然语言,即人们日常使用的语言, 所以它与语言学的研究有着密切的联系,但又有重要的区别。 自然语言处理并不是一般地研究自然语言, 而在于研制能有效地实现自然语言通信的计算机系统, 特别是其中的软件系统。因而它是计算机科学的一部分。 ''' s = SnowNLP(text) print(s.keywords(6)) # [u'语言', u'自然', u'计算机'] 不能用tags输出关键字. s.summary(3) # [u'因而它是计算机科学的一部分', u'自然语言处理是一门融语言学、计算机科学、 # 数学于一体的科学', u'自然语言处理是计算机科学领域与人工智能领域中的一个重要方向']s.sentences # print(s.sentences) print(s.sentiments) # 1.0 s = SnowNLP([[u'这篇', u'文章'], [u'那篇', u'论文'], [u'这个']]) # print(s.tf) # print(s.idf) # print(s.sim([u'文章'])) # [0.3756070762985226, 0, 0]
在編譯運行之前,先得安裝snownlp包,後續還有pylab,pandas模組:
在VS Code終端(查看->整合終端)裡面輸入:
pip install snownlp pip install pylab pip install pandas
前提是你安裝了pip,若是pip沒有安裝可以查看我之前的文章
在VS Code中我們可以右鍵模組名查看定義,便能看到模組的實現了.不得不說VS Code很強大,希望微軟能這麼一直走下去,走向開源走向跨平台! !
然後我隨便提取了《心靈捕手》豆瓣網評,放在了txt中:
其實大多數情況下,大陸的譯名比港譯要更有味道。
It is not ur fault!
我是在電視上偶爾才看到這部電影的,當時看的時候真的很感人。 為什麼會有這麼天才的人,卻有著這樣子曲折的人生。
是認為劇本很好卻沒有被完全拍出來:) 對演員的表演還是心存質疑一點點~ 呵呵
好評
前幾日剛剛看過,一部觸動心靈的電影,尋找真正的人生
這篇影評寫的很棒,我的眼睛濕潤了
很好的片子
最後就是處理的程式了:
from snownlp import SnowNLP import pandas as pd import pylab as pl txt = open('F:/_analyse_Emotion.txt') text = txt.readlines() txt.close() print('读入成功') sentences = [] senti_score = [] for i in text: a1 = SnowNLP(i) a2 = a1.sentiments sentences.append(i) # 语序... senti_score.append(a2) print('doing') table = pd.DataFrame(sentences, senti_score) # table.to_excel('F:/_analyse_Emotion.xlsx', sheet_name='Sheet1') # ts = pd.Series(sentences, senti_score) # ts = ts.cumsum() # print(table) x = [1, 2, 3, 4, 5, 6, 7, 8] pl.mpl.rcParams['font.sans-serif'] = ['SimHei'] pl.plot(x, senti_score) pl.title(u'心 灵 捕 手 网 评') pl.xlabel(u'评 论 用 户') pl.ylabel(u'情 感 程 度') pl.show()
最後的效果:
#可能有些不準確,我也是隨便提取的數據,不過snownlp還是號稱情緒分析準確很高的!
以上是python中snownlp情感分析簡易的demo分享的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于Seaborn的相关问题,包括了数据可视化处理的散点图、折线图、条形图等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于进程池与进程锁的相关问题,包括进程池的创建模块,进程池函数等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于简历筛选的相关问题,包括了定义 ReadDoc 类用以读取 word 文件以及定义 search_word 函数用以筛选的相关内容,下面一起来看一下,希望对大家有帮助。

VS Code的确是一款非常热门、有强大用户基础的一款开发工具。本文给大家介绍一下10款高效、好用的插件,能够让原本单薄的VS Code如虎添翼,开发效率顿时提升到一个新的阶段。

pythn的中文意思是巨蟒、蟒蛇。1989年圣诞节期间,Guido van Rossum在家闲的没事干,为了跟朋友庆祝圣诞节,决定发明一种全新的脚本语言。他很喜欢一个肥皂剧叫Monty Python,所以便把这门语言叫做python。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于数据类型之字符串、数字的相关问题,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于numpy模块的相关问题,Numpy是Numerical Python extensions的缩写,字面意思是Python数值计算扩展,下面一起来看一下,希望对大家有帮助。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

禪工作室 13.0.1
強大的PHP整合開發環境

SublimeText3漢化版
中文版,非常好用

SublimeText3 Linux新版
SublimeText3 Linux最新版

記事本++7.3.1
好用且免費的程式碼編輯器

Dreamweaver CS6
視覺化網頁開發工具