1. 程式人生 > >餘弦相似度與正規化的歐氏距離的某種等價性

餘弦相似度與正規化的歐氏距離的某種等價性

給一個集合, V={x|xRn}, 和一個點 uRn, 依次計算uV中各個點的距離, 然後按照從近到遠排序, 就可以得到一個序列A=<x1,x2,...>.
距離函式可以取

  • cosine similarity
    值域[1,1],越大表示越相近.
  • Euclidean distance
    值域 [0,+], 越小表示越近.

在二維空間中, 餘弦距離是夾角, 歐氏距離是遠近. 很明顯二者各自得出的序列A 是不同的.
但要是對uV中的點作歸一化呢? 得到的兩個A 是否就相同了呢? 因為在二維空間中容易得到直觀的這個推測.

真是的答案是 Yes!
cosine similarity is identical to l2-normalized euclidean distance someway.

For 2-normalized vectors x,y,

||x||2=||y||2=1,
we have that the squared Euclidean distance is proportional to the cosine distance,
(1)(9)||xy||22=(xy)(xy)(10)=xx2xy+yy(11)=22xy(12)=22cos(x,y)
從式(1)中可以看出, 夾角越大, 歐氏距離的平方就越大, 這就是想要的證明!

參考