用R語言實現歐式距離的兩種標準化

阿新 • • 發佈：2022-03-21

第一種標準化轉換公式：x*=D^-1(x-µ)，求出樣本x的期望和其協方差矩陣的對角矩陣的逆即可。

第二種標準化轉換公式：x*=∑^-1/2(x-µ)，其中∑^-1/2=TΛT′，T為x的協方差矩陣的特徵向量矩陣，Λ為x的協方差矩陣的特徵值構成的對角矩陣。

第一種轉換能夠消除各變數單位的或方差差異的影響，但不能消除變數之間的相關性的影響。

第二種轉換則可以做到消除變數之間的相關性的影響。

下面是R語言程式碼：

library(MASS)
Sigma=matrix(c(2,2.2,2.2,7),2)#建立一個2行的協方差矩陣
mu=c(1,1)#期望
set.seed(8)#設定一個隨機種子
x=mvrnorm(n=100,mu,Sigma)#隨機生成100個隨機樣本服從期望為mu，協方差為Sigma的二元正態分佈
s=cov(x)#計算X的協方差矩陣
plot(x,ylim=c(-10,10),xlim=c(-10,10),pch=20,ylab="y",xlab="x")#對隨機樣本x的點畫圖，橫縱座標數值範圍為-10到10，畫圖符號選20號符號

#diag函式可以用來提取矩陣的對角元素，並將它儲存成向量的格式,然後繼續用diag函式來生成給定對角元素的對角陣
D=diag(sqrt(diag(s)))#計算對角矩陣D
meanx=colMeans(x)#按列來求X的均值
#R語言是預設byrow=False，即資料按列輸入，byrow=True則是按行輸入，rep函式用於重複輸出
mean=matrix(rep(meanx,100),nrow=100,byrow=T)#將meanx按行輸入100次生成一個100*2的矩陣
x1=t(solve(D)%*%t(x-mean))#標準化轉換，D是2*2矩陣，X-mean是100*2矩陣，所以要轉置X-mean進行運算，最後再轉置回來,%*%是左乘的意思
plot(x1,ylim=c(-10,10),xlim=c(-10,10),pch=20,ylab="y",xlab="x")
cov(x1)#x1的協方差陣

完成第一種標準轉換後，確實消除了消除x和y單位的或方差差異的影響，但顯然沒有消除x對y或y對x的相關性的影響。圖中直觀看到隨著x增加y呈上升趨勢，協方差陣cov(x,y),cov(y,x)不為0。下面進行第二種標準轉換。

s.eigen=eigen(s)#計算s的特徵值和特徵向量
s.eigen$vectors#輸出s的特徵向量
a=s.eigen$values#s的特徵值賦值給a
A=diag(a)#計算對角矩陣
T=s.eigen$vectors#S的單位正交特徵向量定義了一個新的座標系
x2=t(t(T)%*%t(x))#將隨機樣本X投影到新的座標系T上
plot(x2,ylim=c(-10,10),xlim=c(-10,10),pch=20,ylab="y",xlab="x")
round(cov(x2),4)#求x2協方差，保留四位小數

在x落在由特徵向量定義的座標軸上，可以看到變數間的相關性已經被消除了。相當於將原先的座標軸旋轉了一下。下面就繼續消除單位的或方差差異的影響

s1=T%*%sqrt(A)%*%t(T)#求A的平方根矩陣
x3=t(solve(s1)%*%t(x-mean))#標準化轉換
plot(x3,ylim=c(-10,10),xlim=c(-10,10),pch=20,ylab="y",xlab="x")
round(cov(x3),4)#求x3協方差，保留四位小數

最後再輸出所有的plot圖，直觀的看看變換過程。

用R語言實現歐式距離的兩種標準化

第一種標準化轉換公式：x*=D-1(x-µ)，求出樣本x的期望和其協方差矩陣的對角矩陣的逆即可。

用R語言實現對不平衡資料的四種處理方法

在對不平衡的分類資料集進行建模時，機器學習演算法可能並不穩定，其預測結果甚至可能是有偏的，而預測精度此時也變得帶有誤導性。那麼，這種結果是為何發生的呢？到底是什麼因素影響了這些演算法的表現？

R語言實現計算兩個向量的協方差、標準差、皮爾遜相關係數

1、協方差協方差：兩個向量每一項與各自平均數只差的對應項乘積之和的平均數。

一種用C語言實現的sqrt開方函式及最優化問題的思考方式

第一次寫部落格，心情有點小激動吼今天上課的時候老師講的“最優化問題的解決思路”倒是覺得挺有意思的，和大家分享一下~

用GA演算法設計22個地點之間最短旅程-R語言實現

某畢業班共有30位同學，來自22個地區，我們希望在假期來一次說走就走的旅行，將所有同學的家鄉走一遍。算起來，路費是一筆很大的花銷，所以希望設計一個旅行方案，確保這一趟走下來的總路程最短。

淺析vue-router實現原理及兩種模式

之前用Vue開發單頁應用，發現不管路由怎麼變化，瀏覽器位址列總是會有一個\'#\'號。

js實現抽獎的兩種方法

本文例項為大家分享了js實現抽獎的具體程式碼，供大家參考，具體內容如下

ES6函式實現排它兩種寫法解析

排它思想：清除其它所有的沒有選中元素的樣式,只設置當前選中元素的樣式 html程式碼

真的可以，用C語言實現面向物件程式設計OOP

ID：技術讓夢想更偉大作者:李肖遙解釋區分一下C語言和OOP 我們經常說C語言是面向過程的，而C＋＋是面向物件的，然而何為面向物件，什麼又是面向過程呢？不管怎麼樣，我們最原始的目標只有一個就是實現我們所需要的

使用keras實現非線性迴歸(兩種加啟用函式的方式)

我就廢話不多說了，大家還是直接看程式碼吧~ import keras import numpy as np import matplotlib.pyplot as plt

Linux下用C語言實現推箱子游戲

前面有Linux的常用命令和vim文字編輯器還沒有介紹，之後我會補上的。今天來介紹如何用C語言寫一個簡單的小遊戲，叫做“小老鼠推箱子”。雖然遊戲的編寫過程不復雜，但是我覺得能夠從中找到自己對於程式設計的不足和

用java語言實現word匯出文件服務

一· 需要製作一個需要匯出的word文件模板（使用wps匯出xml（2003））然後將檔案字尾名給為ftl----------------將檔案xx.ftl放在後臺程式碼的靜態資源目錄下（也就是template下）

用C語言實現猜數字遊戲

本文例項為大家分享了C語言實現猜數字的具體程式碼，供大家參考，具體內容如下

移動端JS實現拖拽兩種方法解析

移動端的專案經常會引入手勢庫來實現拖拽不過如果只是一兩個頁面用到拖拽，再引入一個手勢庫就很不划算

c語言訪問postgresql有兩種方式

c語言訪問postgresql有兩種方式 1、通過libpq2、通過ESQL 1、通過libpq ibpq 是一套允許客戶程式向PostgreSQL 伺服器服務程序傳送查詢並且獲得查詢返回的庫函式。 libpq同時也是其他幾個PostgreSQL 應用

python 二進位制儲存圖片規定尺寸_Python 用PIL庫旋轉圖片的兩種方式，改變影象尺寸...

技術標籤：python 二進位制儲存圖片規定尺寸首先需要安裝PIL庫，需要在CMD下pip3 install pillow就好了。

用C語言實現線性表的快速排序

技術標籤：資料結構演算法c語言程式碼示例 #include<stdio.h> #include<stdlib.h>

用C語言實現三子棋

技術標籤：c語言前言首先我們需要建立兩個原始檔分別為test.c與game.c前者為遊戲的測試，後者為遊戲相關函式的定義，同時建立相應的名為game.h的原始檔宣告相關函式。

JavaScript中實現new的兩種方式引發的探究

前言當你 new 一個建構函式時發生了什麼？ “眾所周知”的三步：建立一個空物件，將它的引用賦給 this，繼承函式的原型；通過 this 將屬性和方法新增至這個物件；最後返回 this 指向的新物件，也就是例項。

R語言實現統計plink格式資料基因頻率

1、 dir() dat <- read.table(\"outcome.ped\") dat <- dat[,-(1:6)] loci <- data.frame() loci[1:(nrow(dat) * 2), 1] <- 1

用R語言實現歐式距離的兩種標準化

相關推薦