標籤:style http color io 使用 ar java strong 檔案
酒店評論情感分析系統(四)——LingPipe在Eclipse中的運行
本來打算在做這個項目的時候,使用基於語義的文本傾向性分析方法,即先通過對評論文本進行中文分析,去停用詞,然後在傾向性語義模式庫的協助下對抽取出來的形容詞或短語逐一進行傾向性判斷並賦予一個傾向值,最後將上述所有傾向值累加起來得到文章的總體文本傾向性。但是由於在建語料庫和傾向性字典那塊沒有找到好的方法,並在查閱相關資料的時候,瞭解到一款自然語言處理軟體包LingPipe,故最終決定用基於機器學習文本傾向性研究方法。
一、 LingPipe介紹
LingPipe 是alias公司開發的一款自然語言處理軟體包,包括主題分類、句題檢測、字元語言建模等十餘個模組。而且文檔完整,甚至每一個演算法都有論文參考。更難能可貴的是它支援中文。
官方地址:http://alias-i.com/lingpipe/
:http://alias-i.com/lingpipe/web/download.html
LingPipe分為兩個大塊,一塊是LingPipe核心檔案,另外一塊是LingPipe的模型類。需要支援中文的話需要下載Chinese Word Segmentation模組。
二、 環境
1. 作業系統:windows7,X86,32位
2. Java JDK1.6
3. Eclipse3.4
4. LingPipe4.1
三、 配置步驟
(1) 建立一個名為SentimentAnalysis工程 :
a) 點擊菜單中的File >> New >> Project, 選擇new project wizard下拉式清單中的Java Project from Existing Ant Buildfile。
b) 點擊next,在Project Name後輸入SentimentAnalysis。
c)點擊Browse,找到$LINGPIPE/build.xml檔案。$LINGPIPE是指LingPipe解壓縮後所在的根目錄。
(2) 設定classpath
a) 點擊主菜單的Project,選擇Properties
b) 選擇Java Build Path,點擊Libraries
c)點擊Add External JARs,選擇$LINGPIPE/lib/junit-3.8.1.jar
d) 點擊OK
(4.1)LingPipe在Eclipse中的運行