池化

From Ufldl

Jump to: navigation, search
Line 23: Line 23:
To address this, first recall that we decided to obtain convolved features because images have the "stationarity" property, which implies that features that are useful in one region are also likely to be useful for other regions. Thus, to describe a large image, one natural approach is to aggregate statistics of these features at various locations. For example, one could compute the mean (or max) value of a particular feature over a region of the image. These summary statistics are much lower in dimension (compared to using all of the extracted features) and can also improve results (less over-fitting). We aggregation operation is called this operation pooling, or sometimes mean pooling or max pooling (depending on the pooling operation applied).  
To address this, first recall that we decided to obtain convolved features because images have the "stationarity" property, which implies that features that are useful in one region are also likely to be useful for other regions. Thus, to describe a large image, one natural approach is to aggregate statistics of these features at various locations. For example, one could compute the mean (or max) value of a particular feature over a region of the image. These summary statistics are much lower in dimension (compared to using all of the extracted features) and can also improve results (less over-fitting). We aggregation operation is called this operation pooling, or sometimes mean pooling or max pooling (depending on the pooling operation applied).  
 +
-----------------------------------------------------------------------------
-----------------------------------------------------------------------------
【初译】:
【初译】:
为了解决这个问题,首先回忆一下,我们之所以决定获取卷积后的特征是因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述一个大的图像,一个很自然的想法就是把在多个位置都适用的特征做一次聚合统计。例如,人们可以计算图像的一个区域上某个特定特征的平均值(或最大值),这些总结性的统计的就会使特征的数目大大降低(对比于适用所有的导出特征)。这种聚合的操作就叫做汇聚(pooling),有时也成为平均汇聚或者最大汇聚(取决于计算汇聚的方法)
为了解决这个问题,首先回忆一下,我们之所以决定获取卷积后的特征是因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述一个大的图像,一个很自然的想法就是把在多个位置都适用的特征做一次聚合统计。例如,人们可以计算图像的一个区域上某个特定特征的平均值(或最大值),这些总结性的统计的就会使特征的数目大大降低(对比于适用所有的导出特征)。这种聚合的操作就叫做汇聚(pooling),有时也成为平均汇聚或者最大汇聚(取决于计算汇聚的方法)
 +
 +
-----------------------------------------------------------------------------
【一审】:
【一审】:
为了解决这个问题,首先回忆一下,我们之所以决定使用卷积后的特征是因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述大的图像,一个很自然的想法就是对在多个位置都适用的特征做一次聚合统计。例如,人们可以计算图像一个区域上的某个特定特征的平均值(或最大值),这些总结性的统计数据的维度相对较低(比之于使用所有的导出特征)。这种聚合的操作就叫做池化(pooling),有时也称为平均池化或者最大池化(取决于计算池化的方法)
为了解决这个问题,首先回忆一下,我们之所以决定使用卷积后的特征是因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述大的图像,一个很自然的想法就是对在多个位置都适用的特征做一次聚合统计。例如,人们可以计算图像一个区域上的某个特定特征的平均值(或最大值),这些总结性的统计数据的维度相对较低(比之于使用所有的导出特征)。这种聚合的操作就叫做池化(pooling),有时也称为平均池化或者最大池化(取决于计算池化的方法)
 +
-----------------------------------------------------------------------------
【二审】:
【二审】:

Revision as of 11:47, 7 March 2013

Personal tools