1. 程式人生 > >求和向量與中心化矩陣

求和向量與中心化矩陣

symbol 元素 mmu 公式 之間 bold 標量 erl 數據

一、求和向量

所有元素等於1 的向量稱為求和向量(summuing vector)。記為$\mathbf{1}=[1,1, \cdots, 1]^{\mathbf{T}}$ 。以$n=4$為例,求和向量$\mathbf{1}=[1,1, \cdots, 1]^{\mathrm{T}}$ 之所以稱為求和向量,乃是因為n 個標量的求和都可以表示為求和向量與另外一個向量之間的內積。

求和向量與自己的內積是一個等於該向量維數的標量,即有:

\begin{equation}
\mathbf{1}_{n}^{\mathrm{T}} \mathbf{1}_{n}=n
\end{equation}

求和向量之間的外積是一個所有元素為1 的矩陣,例如:

\begin{equation}
\mathbf{1}_{2} \mathbf{1}_{3}^{\mathrm{T}}=\left[ \begin{array}{l}{1} \\ {1}\end{array}\right][1,1,1]=\left[ \begin{array}{lll}{1} & {1} & {1} \\ {1} & {1} & {1}\end{array}\right]=\boldsymbol{J}_{2 \times 3}
\end{equation}

更一般地,有:$\mathbf{1}_{p} \mathbf{1}_{\mathbf{q}}^{\mathrm{T}}=\boldsymbol{J}_{\boldsymbol{p} \times \boldsymbol{q}}$(所有元素為1 的矩陣)

二、中心化矩陣

矩陣$\boldsymbol{C}_{n}=\boldsymbol{I}_{n}-\overline{\boldsymbol{J}}_{n}=\boldsymbol{I}_{n}-\frac{1}{n} \boldsymbol{J}_{n}$稱為中心化矩陣(centering matrix)。

容易驗證,中心化矩陣既是對稱矩陣,又是幕等矩陣,即有:

\begin{equation}
C_{n}=C_{n}^{\mathrm{T}}=C_{n}^{2}
\end{equation}

此外,中心化矩陣還具有以下特性:

\begin{equation}
\left.\begin{aligned} C_{n} 1 &=0 \\ C_{n} J_{n} &=J_{n} C_{n}=0 \end{aligned}\right\}

\end{equation}

首先,一組數據$x_{1}, \cdots, x_{n}$ 的均值可以用求和向量表示,即有:

\begin{equation}
\overline{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i}=\frac{1}{n}\left(x_{1}+\cdots+x_{n}\right)=\frac{1}{n} x^{\mathrm{T}} \mathbf{1}=\frac{1}{n} \mathbf{1}^{\mathrm{T}} x
\end{equation}

式中,$\boldsymbol{x}=\left[x_{1}, \cdots, x_{n}\right]^{\mathbf{T}}$為數據向量。

其次,利用中心化矩陣的定義式及其性質公式,可以得到:

\begin{equation}
\begin{aligned} C x &=x-\overline{J} x=x-\frac{1}{n} 11^{\mathrm{T}} x=x-\overline{x} 1 \\ &=\left[x_{1}-\overline{x}, \cdots, x_{n}-\overline{x}\right]^{\mathrm{T}} \end{aligned}
\end{equation}

換言之,矩陣C 對數據向量x的線性變換Cx: 是原數據向量的各個元素減去n 個數據的均值的結果。這就是中心化矩陣的數學含義所在。

此外,如果求向量Cx: 的內積,則有:

\begin{equation}
\begin{aligned}(\boldsymbol{C} \boldsymbol{x})^{\mathrm{T}} \boldsymbol{C x} &=\left[\boldsymbol{x}_{1}-\overline{\boldsymbol{x}}, \cdots, \boldsymbol{x}_{\boldsymbol{n}}-\overline{\boldsymbol{x}}\right]\left[x_{\mathbf{1}}-\overline{\boldsymbol{x}}, \cdots, \boldsymbol{x}_{\boldsymbol{n}}-\overline{\boldsymbol{x}}\right]^{\mathbf{T}} \\ &=\sum_{i=1}^{n}\left(\boldsymbol{x}_{\boldsymbol{i}}-\overline{\boldsymbol{x}}\right)^{2} \end{aligned}
\end{equation}

根據式(3)知$\boldsymbol{C}^{\mathrm{T}} \boldsymbol{C}=\boldsymbol{C} \boldsymbol{C}=\boldsymbol{C}$,上式又可簡化為

\begin{equation}
\boldsymbol{x}^{\mathrm{T}} \boldsymbol{C x}=\sum_{i=1}^{\mathbf{n}}\left(x_{i}-\overline{\boldsymbol{x}}\right)^{2}
\end{equation}

右式是我們熟悉的數據$x_{1}, \cdots, x_{n}$的協方差。即是說,一組數據的協方差可以用核矩陣為中心化矩陣的二次型$\boldsymbol{x}^{\mathbf{T}} \boldsymbol{C} \boldsymbol{x}$ 表示。

求和向量與中心化矩陣