摘要:庫常規(guī)方法方法描述例子向?qū)ο笾屑虞d文本將詞云輸出為圖像文件,或格式應(yīng)用實(shí)例配置對(duì)象參數(shù)加載詞云文本輸出詞云文件分隔以空格分隔單詞統(tǒng)計(jì)單詞出現(xiàn)次數(shù)并過濾字體根據(jù)統(tǒng)計(jì)配置字號(hào)布局顏色環(huán)境尺寸配置對(duì)象參數(shù)參數(shù)參數(shù)描述例子指定詞云對(duì)象生成圖片的寬度
wordcloud庫常規(guī)方法
w = wordcloud.WordCloud()
方法 | 描述 | 例子 |
---|---|---|
w.generate(txt) | 向wordcloud對(duì)象w中加載文本txt | >>>w.generate("Python and WordCloud") |
w.to_file(filename) | 將詞云輸出為圖像文件,.png或.jpg格式 | >>>w.to_file("outfile.png") |
import wordcloud w = wordcloud.WordCloud() #配置對(duì)象參數(shù) w.generate("wordcloud by Python") #加載詞云文本 w.to_file("pywordcloud.png") #輸出詞云文件
分隔: 以空格分隔單詞
統(tǒng)計(jì): 單詞出現(xiàn)次數(shù)并過濾
字體: 根據(jù)統(tǒng)計(jì)配置字號(hào)
布局: 顏色環(huán)境尺寸
配置對(duì)象參數(shù)w = wordcloud.WordCloud(<參數(shù)>)
參數(shù) | 描述 | 例子 |
---|---|---|
width | 指定詞云對(duì)象生成圖片的寬度,默認(rèn)400像素 | >>>w=wordcloud.WordCloud(width=600) |
height | 指定詞云對(duì)象生成圖片的高度,默認(rèn)200像素 | >>>w=wordcloud.WordCloud(height=400) |
min_font_size | 指定詞云中字體的最小字號(hào),默認(rèn)4號(hào) | >>>w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定詞云中字體的最大字號(hào),根據(jù)高度自動(dòng)調(diào)節(jié) | >>>w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定詞云中字體字號(hào)的步進(jìn)間隔,默認(rèn)為1 | >>>w=wordcloud.WordCloud(font_step=2) |
font_path | 指定文件字體的路徑,默認(rèn)None | >>>w=wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定詞云顯示的最大單詞數(shù)量,默認(rèn)200 | >>>w=wordcloud.WordCloud(font_step=2) |
stop_words | 指定詞云的排除詞列表,即不顯示的單詞列表 | >>>w=wordcloud.WordCloud(stop_words={"Python"}) |
mask | 指定詞云形狀,默認(rèn)為長方形,需要應(yīng)用imread()函數(shù) |
>>>from scipy.misc import imread >>>mk=imread("pic.png") >>>w=wordcloud.WordCloud(mask=mk) |
background_color | 指定詞云圖片的背景顏色,默認(rèn)為黑色 | >>>w=wordcloud.WordCloud(background_color="white") |
英文(以空格分隔單詞)
import wordcloud txt = "life is short, you need python" w = wordcloud.WordCloud(background_color = "white") w.generate(txt) w.to_file("pywcloud.png")
中文(中文需要先分詞并組成空格分隔字符串)
import jieba import wordcloud txt = "程序設(shè)計(jì)語言是計(jì)算機(jī)能夠理解和識(shí)別用戶操作意圖的一種交互體系,它按照特定規(guī)則組織計(jì)算機(jī)指令,使計(jì)算機(jī)能夠自動(dòng)進(jìn)行各種運(yùn)算處理。 " w = wordcloud.WordCloud( width=1000, font_path="msyh.ttc",height=700) w.generate(" ".join(jieba.lcut(txt))) w.to_file("pywcloud.png")
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/41724.html
摘要:用實(shí)現(xiàn)微信好友性別及位置信息統(tǒng)計(jì)這里使用的庫開發(fā)。使用圖靈機(jī)器人自動(dòng)與指定好友聊天讓室友幫忙測試發(fā)現(xiàn)發(fā)送表情發(fā)送文字還能回應(yīng),但是發(fā)送圖片可能不會(huì)回復(fù),猜應(yīng)該是我們申請(qǐng)的圖靈機(jī)器人是最初級(jí)的沒有加圖片識(shí)別功能。 1.用 Python 實(shí)現(xiàn)微信好友性別及位置信息統(tǒng)計(jì) 這里使用的python3+wxpy庫+Anaconda(Spyder)開發(fā)。如果你想對(duì)wxpy有更深的了解請(qǐng)查看:wxpy...
摘要:前者對(duì)中文進(jìn)行分詞后者圖形化展示詞語的出現(xiàn)頻率。眾所周知,中文系的語言處理恐怕是最難的自然語言處理的語種。研究中文自然語言處理將是一個(gè)長久而大的工程,對(duì)于分析數(shù)據(jù)我們不是要研究自然語言處理 接上篇,這一篇將從技術(shù)層面講講是如何實(shí)現(xiàn)的。閱讀本文您將會(huì)了解如何用python爬取微博的評(píng)論以及如何用python word_cloud庫進(jìn)行數(shù)據(jù)可視化。 上一篇:程序員代碼下的許豪杰 準(zhǔn)備工作 ...
摘要:前言今天教大家用模塊來生成詞云,我讀取了一篇小說并生成了詞云,先看一下效果圖效果圖一效果圖二根據(jù)效果圖分析的還是比較準(zhǔn)確的,小說中的主人公就是程理,所以出現(xiàn)次數(shù)最多。 前言 今天教大家用wrodcloud模塊來生成詞云,我讀取了一篇小說并生成了詞云,先看一下效果圖: 效果圖一: showImg(https://segmentfault.com/img/remote/1460000015...
摘要:上面是生成詞云的方法封裝,還有一些其他方法根據(jù)詞頻生成詞云根據(jù)文本生成詞云根據(jù)詞頻生成詞云根據(jù)文本生成詞云將長文本分詞并去除屏蔽詞此處指英語,中文分詞還是需要自己用別的庫先行實(shí)現(xiàn),使用上面的對(duì)現(xiàn)有輸出重新著色。 對(duì)于數(shù)據(jù)展示這一塊有時(shí)候會(huì)用到詞云,python中提供的wordcloud模塊可以很靈活的完成生成詞云除了使用python提供的wordcloud模塊以為還有在線的生成方式ht...
閱讀 1438·2021-11-11 16:54
閱讀 9316·2021-11-02 14:44
閱讀 2371·2021-10-22 09:53
閱讀 3259·2019-08-30 11:18
閱讀 1950·2019-08-29 13:29
閱讀 2002·2019-08-27 10:58
閱讀 1622·2019-08-26 11:38
閱讀 3517·2019-08-26 10:31