玩聚,一直在路上,朝著成為中國的 techmeme並超越techmeme進一步成為資訊過濾器 的方向穩步前進。
我們上星期再次最佳化了互連網熱點新發現演算法,確實精度提高了很多,上升到了一個新高度。
可以從爬蟲抓取到分類到輸出熱點整個流程不用任何人工不用編輯審核就直接放出來給普通使用者看了。
現在6月8日、10日、11、12、13日這五天的熱點就是高精度演算法的結果,已經非常准了,目測比以前精度高了兩倍到三倍。
敬請觀看玩聚實驗室效果:
http://www.onejoo.com:8000/
比如:
6月13日的明星八卦分類的熱點:
http://www.onejoo.com:8000/hotspot/?history=D24155D0-224D-4376-869A-F8209B7F610E
6月11日的電影分類熱點:
http://www.onejoo.com:8000/hotspot/7/?history=F8A6D00F-F717-4177-815E-1546F3F34C5F
6月11日的財經分類熱點【以前財經算得不太好,這回非常強悍了】:
http://www.onejoo.com:8000/hotspot/2/?history=F8A6D00F-F717-4177-815E-1546F3F34C5F
6月11日的明星分類熱點:
http://www.onejoo.com:8000/hotspot/?history=F8A6D00F-F717-4177-815E-1546F3F34C5F
6月10日社會分類:
http://www.onejoo.com:8000/hotspot/17/?history=14949D37-2ED9-431C-BA3F-06DE1AC6E146
6月10日明星分類熱點:
http://www.onejoo.com:8000/hotspot/?history=14949D37-2ED9-431C-BA3F-06DE1AC6E146
6月8日明星分類熱點:http://www.onejoo.com:8000/hotspot/?history=26CAC6CE-D91F-4B9F-9001-1FB8CC8DB805
這個熱點自動探索演算法的目的:
百度、Google是通過使用者搜尋輸入的關鍵詞來判斷中文世界的熱點。
而我們通過分析中文部落格界當天發布的數十萬篇博文的文本相似性來尋找有多少人在談論什麼主題。 通過這種主題自動探索技術,可以隨時知道最近中文世界人們在討論什麼、在關注什麼。
flickrGFW對策,傳播一下:
伊朗的flickr愛好者,他製作了可以瀏覽flickr的Firefxo外掛程式:Access Flickr!,以協助大家突破這個限制。
這個外掛程式支援Firefox2.0a1 – 3.0a5,我安裝了以後確實可以瀏覽到Flickr的圖片,而且速度很快,而通過代理或者Torpark瀏覽器訪問(現已更名為xerobank)不僅複雜,速度也很慢。Firefox真的很神奇,也許這就是Firefox勝過IE的魅力所在。