經(jīng)常做數(shù)據(jù)分析的人肯定不會對詞云圖感到陌生,尤其是近幾年來非常流行,不管是發(fā)布會、行業(yè)報告還是新聞,都喜歡使用詞云這種形式,將信息的關鍵詞組成形象生動的圖案,一下子就能抓住生人眼球,因為詞云圖這種可視化圖表給人的第一印象就是足夠裝逼,足夠亮眼!
羅振宇的跨年演講中用到詞云
但是詞語云圖的最大優(yōu)點,其實并不是它的顏值,而是它能夠能夠直觀地展示數(shù)據(jù)頻率,對出現(xiàn)頻率較高的關鍵詞予以重點突出,從而過濾掉大量的文本信息,幫助我們進行數(shù)據(jù)分析。
而且,如果能夠親手做一個詞云圖,發(fā)到朋友圈里豈不是能夠帥到?jīng)]朋友?
網(wǎng)上有很多線上詞云制作網(wǎng)站,但是基本上很難實現(xiàn)對數(shù)據(jù)的篩選和過濾,僅僅是有著好看的皮囊而已。對于數(shù)據(jù)分析人而言,還是要借助專業(yè)的分析工具,下面我就用Python和FineBI這兩個常用的數(shù)據(jù)分析工具,分別實操一下如何制作炫酷又裝逼的詞云。
Pyhton
1、安裝Python運行環(huán)境和套裝
這個不必多說,推薦下載的套裝是anaconda,做詞云很好用。下載完畢后,配置好運營環(huán)境后,執(zhí)行安裝文件就行了。
2、準備數(shù)據(jù)
下面是我隨便找了一篇英文文章,作為要進行詞云制作的數(shù)據(jù)基礎
我把其中的正文文字部分拷貝了下來,存儲為一個文本文件,叫做yes-minister.txt,把這個文件挪動到我們的工作目錄demo里,這樣數(shù)據(jù)就準備好了。
3、開始做詞云了
做詞云的核心步驟只有兩個——輸入文本和呼喚詞云包。
首先,在命令行下,輸入:
jupyter notebook
瀏覽器會自動開啟,并且顯示如下界面——Jupyter的主頁面,我們點擊New按鈕,選擇Python 2選項。
然后就出現(xiàn)了一個空白的筆記本,供我們使用了。我們在網(wǎng)頁里唯一的代碼文本框里,輸入以下3條語句,輸入后,按Shift+Enter鍵,就可以執(zhí)行了。
filename = "yes-minister.txt"with open(filename) as f: mytext = f.read()
文本就出現(xiàn)了,然后我們呼喚(import)詞云包,利用mytext中存儲的文本內(nèi)容來制造詞云。
from wordcloud import WordCloudwordcloud = WordCloud().generate(mytext)
此時,制作詞云最核心的兩步就完成了。
4、調出詞云,完成
輸入下面4行語句:
%pylab inlineimport matplotlib.pyplot as pltplt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")
這樣一個簡單的詞云圖就做好了,想要將詞云圖做的更加美觀,還需要調節(jié)各種參數(shù),這里就不一一講解了,感興趣地可以自己慢慢去探索。
FineBI
相比于Python,用FineBI最大的好處就是不用編寫代碼,簡單易用,毫無數(shù)據(jù)和編程基礎的人都能夠輕松做出好看的詞云。
1、下載安裝FineBI,準備數(shù)據(jù)
下載地址可以私聊我“FineBI”獲得免費下載鏈接,為了方便起見,我這里就直接用FineBI自帶的數(shù)據(jù)了。
2、組件設置
新建組件并選擇樣式數(shù)據(jù)業(yè)務包下的搜索詞匯統(tǒng)計表,將待分析區(qū)域維度下的字段“搜索詞”拖入橫軸中,將指標下的字段“搜索次數(shù)”拖入縱軸中,在圖表類型下選擇詞云圖。
3、大小、文本、顏色的優(yōu)化
選擇該圖表類型后,圖形屬性下形狀自動切換為文字,維度字段被添加到文本中,指標字段添加到大小屬性中
4、詞云完成
總結
通過進行詞云分析,我們可以看的出來哪些數(shù)據(jù)是出現(xiàn)頻次最多的,我們的關注點是哪些。這次我演示做的詞云也很簡單,后續(xù)在研究研究讓它更美觀一些,精準一些。