1. 程式人生 > 程式設計 >python實現拉普拉斯特徵圖降維示例

python實現拉普拉斯特徵圖降維示例

這種方法假設樣本點在光滑的流形上,這一方法的計算資料的低維表達,區域性近鄰資訊被最優的儲存。以這種方式,可以得到一個能反映流形的幾何結構的解。

步驟一:構建一個圖G=(V,E),其中V={vi,i=1,2,3…n}是頂點的集合,E={eij}是連線頂點的vi和vj邊,圖的每一個節點vi與樣本集X中的一個點xi相關。如果xi,xj相距較近,我們就連線vi,vj。也就是說在各自節點插入一個邊eij,如果Xj在xi的k領域中,k是定義引數。

步驟二:每個邊都與一個權值Wij相對應,沒有連線點之間的權值為0,連線點之間的權值:

步驟三: ,實現廣義本徵分解:

使 是最小的m+1個本徵值。忽略與 =0相關的本徵向量,選取另外m個本徵向量即為降維後的向量。

1、python實現拉普拉斯降維

def laplaEigen(dataMat,k,t): 
 m,n=shape(dataMat) 
 W=mat(zeros([m,m])) 
 D=mat(zeros([m,m])) 
 for i in range(m): 
 k_index=knn(dataMat[i,:],dataMat,k) 
 for j in range(k): 
  sqDiffVector = dataMat[i,:]-dataMat[k_index[j],:] 
  sqDiffVector=array(sqDiffVector)**2 
  sqDistances = sqDiffVector.sum() 
  W[i,k_index[j]]=math.exp(-sqDistances/t) 
  D[i,i]+=W[i,k_index[j]] 
 L=D-W 
 Dinv=np.linalg.inv(D) 
 X=np.dot(D.I,L) 
 lamda,f=np.linalg.eig(X) 
return lamda,f 
def knn(inX,dataSet,k): 
 dataSetSize = dataSet.shape[0] 
 diffMat = tile(inX,(dataSetSize,1)) - dataSet 
 sqDiffMat = array(diffMat)**2 
 sqDistances = sqDiffMat.sum(axis=1) 
 distances = sqDistances**0.5 
 sortedDistIndicies = distances.argsort() 
return sortedDistIndicies[0:k] 
dataMat,color = make_swiss_roll(n_samples=2000) 
lamda,f=laplaEigen(dataMat,11,5.0) 
fm,fn =shape(f) 
print 'fm,fn:',fm,fn 
lamdaIndicies = argsort(lamda) 
first=0 
second=0 
print lamdaIndicies[0],lamdaIndicies[1] 
for i in range(fm): 
 if lamda[lamdaIndicies[i]].real>1e-5: 
 print lamda[lamdaIndicies[i]] 
 first=lamdaIndicies[i] 
 second=lamdaIndicies[i+1] 
 break 
print first,second 
redEigVects = f[:,lamdaIndicies] 
fig=plt.figure('origin') 
ax1 = fig.add_subplot(111,projection='3d') 
ax1.scatter(dataMat[:,0],dataMat[:,1],2],c=color,cmap=plt.cm.Spectral) 
fig=plt.figure('lowdata') 
ax2 = fig.add_subplot(111) 
ax2.scatter(f[:,first],f[:,second],cmap=plt.cm.Spectral) 
plt.show() 

2、拉普拉斯降維實驗

用如下引數生成實驗資料存在swissdata.dat裡面:

def make_swiss_roll(n_samples=100,noise=0.0,random_state=None): 
 #Generate a swiss roll dataset. 
 t = 1.5 * np.pi * (1 + 2 * random.rand(1,n_samples)) 
 x = t * np.cos(t) 
 y = 83 * random.rand(1,n_samples) 
 z = t * np.sin(t) 
 X = np.concatenate((x,y,z)) 
 X += noise * random.randn(3,n_samples) 
 X = X.T 
 t = np.squeeze(t) 
return X,t 

實驗結果如下:

以上這篇python實現拉普拉斯特徵圖降維示例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。