稀疏编码自编码表达

From Ufldl

Jump to: navigation, search
([良好的s初始值])
Line 121: Line 121:
无疑,这样的初始化有助于算法的改进,因为上述的第一步希望找到满足<math>Ws \approx x</math>的矩阵<math>s</math>;第二步对<math>s</math>作规范化处理是为了保持较小的稀疏惩罚值。这也表明,只采用上述步骤的某一步而不是两步对<math>s</math>做初始化处理将严重影响算法性能。 (TODO:此链接将会对为什么这样的初始化能改进算法作出更详细的解释)
无疑,这样的初始化有助于算法的改进,因为上述的第一步希望找到满足<math>Ws \approx x</math>的矩阵<math>s</math>;第二步对<math>s</math>作规范化处理是为了保持较小的稀疏惩罚值。这也表明,只采用上述步骤的某一步而不是两步对<math>s</math>做初始化处理将严重影响算法性能。 (TODO:此链接将会对为什么这样的初始化能改进算法作出更详细的解释)
-
=== The practical algorithm[可运行算法] ===
+
=== [可运行算法] ===
-
With the above two tricks, the algorithm for sparse coding then becomes:
+
有了以上两种技巧,稀疏编码算法修改如下:
<ol>
<ol>
-
<li>Initialize <math>A</math> randomly
+
<li>随机初始化<math>A</math>
-
<li>Repeat until convergence
+
<li>重复以下步骤直至收敛
   <ol>
   <ol>
-
     <li>Select a random mini-batch of 2000 patches
+
     <li>随机选取一个有2000个patches的迷你块
-
     <li>Initialize <math>s</math> as described above
+
     <li>如上所述,初始化<math>s</math>
-
    <li>Find the <math>s</math> that minimizes <math>J(A, s)</math> for the <math>A</math> found in the previous step
+
     <li>根据上一步给定的<math>A</math>,求解能够最小化<math>J(A, s)</math>的<math>s</math>
-
    <li>Solve for the <math>A</math> that minimizes <math>J(A, s)</math> for the <math>s</math> found in the previous step
+
-
  </ol>
+
-
</ol>
+
-
 
+
-
With this method, you should be able to reach a good local optima relatively quickly.
+
-
 
+
-
[初译]
+
-
 
+
-
考虑到以上两点,稀疏编码算法修改如下:
+
-
<ol>
+
-
<li>随机初始化 <math>A</math>
+
-
<li>重复以下步骤直至收敛:
+
-
  <ol>
+
-
    <li>随机选取一个2000 patches大小的迷你块
+
-
    <li>如上所述初始化<math>s</math>
+
-
    <li>根据上一步给定的<math>A</math>,求解能够最小化<math>J(A, s)</math>的<math>s</math> 
+
-
    <li>根据上一步得到的<math>s</math>,求解能够最小化<math>J(A, s)</math>的<math>A</math>
+
-
  </ol>
+
-
</ol>
+
-
 
+
-
通过上述方法,可以相对快速的得到局部最优解。
+
-
 
+
-
[一审]
+
-
 
+
-
考虑到以上两点,稀疏编码算法修改如下:
+
-
<ol>
+
-
<li>随机初始化 <math>A</math>
+
-
<li>重复以下步骤直至收敛:
+
-
  <ol>
+
-
    <li>随机选取一个2000 patches大小的迷你块
+
-
    <li>如上所述初始化<math>s</math>  
+
-
     <li>根据上一步给定的<math>A</math>,求解能够最小化<math>J(A, s)</math>的<math>s</math>
+
     <li>根据上一步得到的<math>s</math>,求解能够最小化<math>J(A, s)</math>的<math>A</math>  
     <li>根据上一步得到的<math>s</math>,求解能够最小化<math>J(A, s)</math>的<math>A</math>  
   </ol>
   </ol>

Revision as of 07:10, 21 March 2013

Personal tools