池化

From Ufldl

Jump to: navigation, search
Line 42: Line 42:
【二审】:
【二审】:
下图显示池化如何应用于一个图像的四块不重合区域。
下图显示池化如何应用于一个图像的四块不重合区域。
 +
(图片地址:是动态图http://deeplearning.stanford.edu/wiki/images/0/08/Pooling_schematic.gif)
(图片地址:是动态图http://deeplearning.stanford.edu/wiki/images/0/08/Pooling_schematic.gif)
 +
 +
 +
Pooling for Invariance
 +
-----------------------------------------------------------------------------
 +
If one chooses the pooling regions to be contiguous areas in the image and only pools features generated from the same (replicated) hidden units. Then, these pooling units will then be translation invariant. This means that the same (pooled) feature will be active even when the image undergoes (small) translations. Translation-invariant features are often desirable; in many tasks (e.g., object detection, audio recognition), the label of the example (image) is the same even when the image is translated. For example, if you were to take an MNIST digit and translate it left or right, you would want your classifier to still accurately classify it as the same digit regardless of its final position.
 +
 +
【初译】:
 +
不变式的汇聚
 +
如果人们选择图像中的连续范围作为汇聚区域,并且只是汇聚相同(重复)的隐藏单元产生的特征。那么,这些汇聚单元就成为转换不变式。这就意味着即使图像经理了一个小的转换之后,相同的(汇聚的)特征仍然是有效的。转换不变式这种特征通常在许多任务中(例如:对象检测,声音识别)是我们期望得到的,即使在图像做了转换之后,样例(图像)的标记仍然保持不变。例如,如果你取得一个MNIST位置数据并且把它向左侧或右侧转换,那么不论最终的位置在哪里,你可能都会期望你的分类方法仍然能够把它当做相同的位置数据而精确地区分开。
 +
 +
【一审】:
 +
不变式的池化
 +
-----------------------------------------------------------------------------
 +
如果人们选择图像中的连续范围作为池化区域,并且只是池化相同(重复)的隐藏单元产生的特征。那么,这些池化单元就称为平移不变式(translation invariant)。也就意味着即使图像经理了一个小的平移之后,相同的(池化的)特征仍然是有效的。平移不变式这种特征通常在许多任务中(例如:对象检测,声音识别)是我们所期望得到的,即使在图像做了平移之后,样例(图像)的标签仍然保持不变。例如,如果你使用一个MNIST的手写数字的数据,并且把它向左侧或右侧平移,那么不论最终的位置在哪里,你可能都会期望你的分类器仍然能够对其进行正确分类。
 +
(*MNIST是一个手写数字库识别库: http://yann.lecun.com/exdb/mnist/)
 +
 +
【二审】:
 +
池化的不变性
 +
-----------------------------------------------------------------------------
 +
如果人们选择图像中的连续范围作为池化区域,并且只是池化相同(重复)的隐藏单元产生的特征,那么,这些池化单元就具有平移不变性(translation invariant)。这就意味着即使图像经历了一个小的平移之后,依然会产生相同的(池化的)特征。在很多任务中(例如物体检测、声音识别),我们都更希望得到具有平移不变性的特征,因为即使图像经过了平移,样例(图像)的标记仍然保持不变。例如,如果你处理一个MNIST数据集的数字,把它向左侧或右侧平移,那么不论最终的位置在哪里,你都会期望你的分类器仍然能够精确地将其分类为相同的数字。
 +
(*MNIST是一个手写数字库识别库: http://yann.lecun.com/exdb/mnist/)
 +
 +
-----------------------------------------------------------------------------
 +
Formal description
 +
Formally, after obtaining our convolved features as described earlier, we decide the size of the region, say  to pool our convolved features over. Then, we divide our convolved features into disjoint  regions, and take the mean (or maximum) feature activation over these regions to obtain the pooled convolved features. These pooled features can then be used for classification.
 +
-----------------------------------------------------------------------------
 +
 +
【初译】:
 +
形式化定义:
 +
形式上,在获取到我们的前面讨论过的卷积特征后,我们确定区域的大小,假设是大小为 的区域来汇聚我们的卷积特征。那么,我们把卷积特征区分放到 个互不相连的区域,然后取得平均(或最大)的这些区域有效特征来获取汇聚后的卷积特征。这些汇聚的特征即可以用来做分类方法。
 +
 +
【一审】:
 +
形式化描述:
 +
一般来说,在获取到我们前面讨论过的卷积特征后,我们要确定池化区域的大小,假设选择大小为 的来池化我们的卷积特征。那么,我们把卷积特征区划分为数个大小为 的互不连接的区域,然后取得这些区域的平均(或最大)有效特征来获取池化后的卷积特征。这些池化后的特征即可以用来为分类器所使用。
 +
 +
【二审】:
 +
形式化描述:
 +
一般来说,在获取到我们前面讨论过的卷积特征后,我们要确定池化区域的大小(假设为 )来池化我们的卷积特征。那么,我们把卷积特征划分到数个大小为 的不相交区域上,然后用这些区域的平均(或最大)特征来获取池化后的卷积特征。这些池化后的特征便可以用来做分类。
 +
 +
-----------------------------------------------------------------------------
 +
中英对照:
 +
 +
【初译】:
 +
 +
 +
【一审】:
 +
特征(features)
 +
样例(example)
 +
过度拟合(over-fitting)
 +
平移不变式(translation invariant)
 +
池化(pooling)
 +
 +
【二审】:
 +
特征(features)
 +
样例(example)
 +
过拟合(over-fitting)
 +
平移不变性(translation invariant)
 +
池化(pooling)
 +
提取(extract)
 +
物体检测(object detection)

Revision as of 11:33, 7 March 2013

Personal tools