白化 - Ufldl

Revision as of 00:11, 30 March 2013 (view source)

Kandeng (Talk | contribs)

(→中文译者)

← Older edit

Latest revision as of 05:37, 8 April 2013 (view source)

Wikiroot (Talk | contribs)

Line 1:

-

== 介绍 ==

-

我们已经了解了如何使用PCA降低数据维度。在一些算法中还需要一个与之相关的预处理步骤，这个预处理过程称为'''白化'''（一些文献中也叫'''~~shpering~~'''）。举例来说，假设训练数据是图像，由于图像中相邻像素之间具有很强的相关性，所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性；更正式的说，我们希望通过白化过程使得学习算法的输入具有如下性质：(i)特征之间相关性较低；(ii)所有特征具有相同的方差。

+

我们已经了解了如何使用PCA降低数据维度。在一些算法中还需要一个与之相关的预处理步骤，这个预处理过程称为'''白化'''（一些文献中也叫'''sphering'''）。举例来说，假设训练数据是图像，由于图像中相邻像素之间具有很强的相关性，所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性；更正式的说，我们希望通过白化过程使得学习算法的输入具有如下性质：(i)特征之间相关性较低；(ii)所有特征具有相同的方差。

Line 25:

Line 24:

-

:<math>\textstyle x_{\rm rot}</math> 协方差矩阵对角元素的值为 <math>\textstyle \lambda_1</math> 和 <math>\textstyle \lambda_2</math> ~~绝非偶然，并且非对角元素值为0~~; 因此, <math>\textstyle x_{{\rm rot},1}</math> 和 <math>\textstyle x_{{\rm rot},2}</math> 是不相关的, 满足我们对白化结果的第一个要求 (特征间相关性降低)。

+

<math>\textstyle x_{\rm rot}</math> 协方差矩阵对角元素的值为 <math>\textstyle \lambda_1</math> 和 <math>\textstyle \lambda_2</math> 绝非偶然。并且非对角元素值为0; 因此, <math>\textstyle x_{{\rm rot},1}</math> 和 <math>\textstyle x_{{\rm rot},2}</math> 是不相关的, 满足我们对白化结果的第一个要求 (特征间相关性降低)。

为了使每个输入特征具有单位方差，我们可以直接使用 <math>\textstyle 1/\sqrt{\lambda_i}</math> 作为缩放因子来缩放每个特征 <math>\textstyle x_{{\rm rot},i}</math> 。具体地，我们定义白化后的数据 <math>\textstyle x_{{\rm PCAwhite}} \in \Re^n</math> 如下：

Line 78:

Line 77:

-

~~{{PCA}}~~

+

==中英文对照==

+

白化 whitening

+

冗余 redundant

+

方差 variance

+

平滑 smoothing

+

降维 dimensionality reduction

+

正则化 regularization

+

反射矩阵 reflection matrix

+

去相关 decorrelation

+

Line 84:

Line 101:

杨海川（yanghaichuan@outlook.com）, 王文中（wangwenzhong@ymail.com）, 谭晓阳（x.tan@nuaa.edu.cn）

+

白化

From Ufldl

Latest revision as of 05:37, 8 April 2013

Views

Personal tools

ufldl resources

wiki

Search

Toolbox

@@ Line 1: / Line 1: @@
 == 介绍 ==
-我们已经了解了如何使用PCA降低数据维度。在一些算法中还需要一个与之相关的预处理步骤，这个预处理过程称为'''白化'''（一些文献中也叫'''shpering'''）。举例来说，假设训练数据是图像，由于图像中相邻像素之间具有很强的相关性，所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性；更正式的说，我们希望通过白化过程使得学习算法的输入具有如下性质：(i)特征之间相关性较低；(ii)所有特征具有相同的方差。
+我们已经了解了如何使用PCA降低数据维度。在一些算法中还需要一个与之相关的预处理步骤，这个预处理过程称为'''白化'''（一些文献中也叫'''sphering'''）。举例来说，假设训练数据是图像，由于图像中相邻像素之间具有很强的相关性，所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性；更正式的说，我们希望通过白化过程使得学习算法的输入具有如下性质：(i)特征之间相关性较低；(ii)所有特征具有相同的方差。
@@ Line 25: / Line 24: @@
-:<math>\textstyle x_{\rm rot}</math> 协方差矩阵对角元素的值为 <math>\textstyle \lambda_1</math> 和 <math>\textstyle \lambda_2</math> 绝非偶然，并且非对角元素值为0; 因此, <math>\textstyle x_{{\rm rot},1}</math> 和 <math>\textstyle x_{{\rm rot},2}</math> 是不相关的, 满足我们对白化结果的第一个要求 (特征间相关性降低)。
+<math>\textstyle x_{\rm rot}</math> 协方差矩阵对角元素的值为 <math>\textstyle \lambda_1</math> 和 <math>\textstyle \lambda_2</math> 绝非偶然。并且非对角元素值为0; 因此, <math>\textstyle x_{{\rm rot},1}</math> 和 <math>\textstyle x_{{\rm rot},2}</math> 是不相关的, 满足我们对白化结果的第一个要求 (特征间相关性降低)。
 为了使每个输入特征具有单位方差，我们可以直接使用 <math>\textstyle 1/\sqrt{\lambda_i}</math> 作为缩放因子来缩放每个特征 <math>\textstyle x_{{\rm rot},i}</math> 。具体地，我们定义白化后的数据 <math>\textstyle x_{{\rm PCAwhite}} \in \Re^n</math> 如下：
@@ Line 78: / Line 77: @@
-{{PCA}}
+==中英文对照==
+白化	whitening
+冗余	redundant
+方差	variance
+平滑	smoothing
+降维	dimensionality reduction
+正则化	regularization
+反射矩阵	reflection matrix
+去相关	decorrelation
@@ Line 84: / Line 101: @@
 杨海川（yanghaichuan@outlook.com）, 王文中（wangwenzhong@ymail.com）, 谭晓阳（x.tan@nuaa.edu.cn）
+{{预处理：主成分分析与白化}}
+{{Languages|Whitening|English}}