Matlab 內建PCA函數形式為
[mappedX, mapping] = pca(X, no_dims)
自己編寫PCA函數的步驟
%第一步:輸入樣本矩陣%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%data=rand(10,8)+randn(10,8)+ones(10,8);%現對其進行pca降維%%%第二步:計算樣本中每一維的均值,然後計算觀察值與均值之間的偏差,再計算共變數矩陣data=bsxfun(@minus,data,mean(data));%對樣本矩陣去均值C=data'*data;C=C./(size(data,1)-1);%根據共變數公式計算共變數,得到共變數矩C%第三步:計算共變數矩陣的特徵值和特徵向量矩陣fprintf(1,'Calculating generalized eigenvectors and eigenvalues...\n');[eigvectors, eigvalues] = eig(C);%eigvectors為特徵向量組成的矩陣,eigvalues特徵值組成的對角矩陣fprintf(1,'Sorting eigenvectors according to eigenvalues...\n');d1=diag(eigvalues);%返回矩陣對角線上的值,為列向量。[dsort index]=sort(d1,'descend'); %以降序排序,dsort為排列後的值,index為索引值vsort=eigvectors(:,index); %將特徵向量按照特徵值大小按列排序%第四步:計算總能量,並選取貢獻率最大的特徵值dsum=sum(d2); %對所有的特徵值求和dsum_extract = 0;%求前幾個特徵值之和,當前幾個特徵值之和大於90%時,可以認為這幾個特徵值可以表徵當前矩陣p = 0;while( dsum_extract/dsum < 0.9)p = p + 1;dsum_extract = sum(dsort(1:p));end%第五步:計算前p個特徵值所對應的的特徵向量組成的矩陣,計算降維後的樣本矩陣vsort = vsort(:,1:p);%提取前p列特徵向量獲得d*p矩陣fprintf(1,'Feature extraction and calculating newData...\n');newdata=data*vsort;%產生N行p列的矩陣,達到降維的效果