當列表已經不能滿足人們對資訊的呈現時,標籤雲這種展現方式很好地滿足了人們關注重點、突出趨勢、顯示偏好的瀏覽需求,本文簡單介紹下使用python產生標籤雲。
有兩種方式:
1. 自己實現 (可以參考http://www.i-alive.com/post/11/)
2.使用現有庫,主要是pytagcloud
本文主要是利用pytagcloud這個庫進列標籤雲的產生。首先需要安裝它,不過在此之前如果你的機器上沒有安裝pygame和simplejson兩個python包,則需要先下載安裝
他們;這三個包安裝完成以後,使用就很簡單了,例子代碼如下:
1 from pytagcloud import create_tag_image,make_tags 2 from pytagcloud.lang.counter import get_tag_counts 3 4 TEXT = ''' 5 python(2) compiler(1) olap(1) 6 recommender-System(2) crawler(1) python networkx(1)) 7 sinaWeibo(1) dremel(1) python-multi-thread(1) path(1) 8 mobile-Internet(1) hadoop hbase HDFS zookeeper(1) meachine-Learning(1) 9 similarity(1) hbase zookeeper(1) openSource(1)10 python(2) python-multi-thread(1) mahout itembased-CF(1) 11 Levenshtein(1)12 auto-Check(1) mahout itembased(1) Real-time data analysis13 python(2) recommender-System(2) python recommender-system(1)) real(1)14 mapreduce shuffle(1) video(1)15 ant(1) Native Hadoop Libraries(1) search(1)16 bigtable(1) nc(1)17 recommender-system(1) bigData(1) data-analysis(1)18 '''19 tags = make_tags(get_tag_counts(TEXT), maxsize=150)20 create_tag_image(tags, 'cloud_large.png', size=(900, 600))
運行後在目前的目錄下會產生一個cloud_large.png結果檔案,結果如下:
除了產生圖片外,pytagcloud還可以產生html形式的標籤雲,可以用來與使用者互動,可以參考pytagcloud的文檔。