標籤:酒店 image imshow 網上 com ges .com pre 支援中文
最近在忙考試的事情,沒什麼時間敲代碼,一個月也沒幾天看代碼,最近看到可視化的詞雲,看到網上也很多這樣的工具,
但是都不怎麼完美,有些不支援中文,有的中文詞頻統計得莫名其妙、有的不支援自訂形狀、所有的都不能自訂色彩
於是網上找了一下,決定用python繪製詞雲,主要用到的是wordcloud庫,安裝只需要pip isntall wordcloud就行,
資料用的是酒店評論的資料,代碼如下:
# -*- coding: utf-8 -*-import matplotlib.pyplot as pltimport picklefrom wordcloud import WordCloud,STOPWORDS,ImageColorGeneratorimport jieba# import codecs# fin = codecs.open(‘HotelComments.txt‘,mode = ‘r‘, encoding = ‘utf-8‘)# print fin.read()# 第一次運行程式時將分好的詞存入檔案# text = ‘‘# with open(‘HotelComments.txt‘) as fin:# for line in fin.readlines():# line = line.strip(‘\n‘)# text += ‘ ‘.join(jieba.cut(line))# text += ‘ ‘# fout = open(‘text.txt‘,‘wb‘)# pickle.dump(text,fout)# fout.close()# 直接從檔案讀取資料fr = open(‘text.txt‘,‘rb‘)text = pickle.load(fr)backgroud_Image = plt.imread(‘girl.jpg‘)wc = WordCloud( background_color = ‘white‘, # 設定背景顏色 mask = backgroud_Image, # 設定背景圖片 max_words = 2000, # 設定最大現實的字數 stopwords = STOPWORDS, # 設定停用詞 font_path = ‘C:/Users/Windows/fonts/msyh.ttf‘,# 設定字型格式,如不設定顯示不了中文 max_font_size = 50, # 設定字型最大值 random_state = 30, # 設定有多少種隨機產生狀態,即有多少種色彩配置 )wc.generate(text)image_colors = ImageColorGenerator(backgroud_Image)wc.recolor(color_func = image_colors)plt.imshow(wc)plt.axis(‘off‘)plt.show()
:
自訂詞雲形狀:
參考部落格:
http://blog.csdn.net/tanzuozhev/article/details/50789226
http://blog.csdn.net/qq_16912257/article/details/52458515
使用python繪製詞雲