weka是很好用的機器學習庫,這裡就不詳細介紹了。
言歸正傳,要使用程式方式使用weka,步驟如下:
一、在eclipse裡建立一個java project:
1. 建立工程:單擊菜單中file->new->java project,在彈出對話方塊的project name中起任意一個名字,此處假設是wekaTest。單擊Finish按鈕(在對話方塊底部)。
2. 建立package:在package Explorer中找到剛才建立的工程,在其上右鍵->New->package。在Name文字框裡面輸入名稱,此處假設為Test。單擊Finish按鈕。
3. 建立程式檔案:在剛才建立的package上面右鍵->New->class,選中public static void main(String[] args)多選框,單擊Finish。
二、在該工程中添加weka的引用:
1. package Explorer中工程名上右鍵,選擇快顯功能表最後一項properties->在左面選中java Build Path->在右面的Library頁面->單擊Add External JARs…->瀏覽weka所在目錄,將weka.jar添加進來,然後單擊ok。
2. 在package Explorer中在雙擊Test檔案,然後在package wekaTest;一句下面添加四句代碼:
import java.io.File;
import weka.classifiers.Classifier;
import weka.classifiers.trees.J48;
import weka.core.Instances;
import weka.core.converters.ArffLoader;
三、在程式中添加weka調用代碼:
將以下代碼添加到Main函數中(在// TODO Auto-generated method stub下面):
Classifier m_classifier = new J48();
File inputFile = new File("D://Program Files//Weka-3-6//data//cpu.with.vendor.arff");//訓練語料檔案
ArffLoader atf = new ArffLoader();
atf.setFile(inputFile);
Instances instancesTrain = atf.getDataSet(); // 讀入訓練檔案
inputFile = new File("D://Program Files//Weka-3-6//data//cpu.with.vendor.arff");//測試語料檔案
atf.setFile(inputFile);
Instances instancesTest = atf.getDataSet(); // 讀入測試檔案
instancesTest.setClassIndex(0); //設定分類屬性所在行號(第一行為0號),instancesTest.numAttributes()可以取得屬性總數
double sum = instancesTest.numInstances(),//測試語料執行個體數
right = 0.0f;
instancesTrain.setClassIndex(0);
m_classifier.buildClassifier(instancesTrain); //訓練
for(int i = 0;i<sum;i++)//測試分類結果
{
if(m_classifier.classifyInstance(instancesTest.instance(i))==instancesTest.instance(i).classValue())//如果預測值和答案值相等(測試語料中的分類列提供的須為正確答案,結果才有意義)
{
right++;//正確值加1
}
}
System.out.println("J48 classification precision:"+(right/sum));
四、運行一下試試。