相关文章推荐

朝气蓬勃的伤疤 · (五)conda环境打包给沙箱环境 - ...· 5 月前 ·

坚强的鸵鸟 · 使用 Gamepad API - Web ...· 7 月前 ·

笑点低的荒野 · List<t>.FindIndex 方法 ...· 11 月前 ·

傻傻的小蝌蚪 · sql server 查询日期最大和最小值· 1 年前 ·

潇洒的伤疤 · ubuntu下安装openMPI - ...· 1 年前 ·

一、参数初始化分类及原理

神经网络的训练过程中的参数学习是基于梯度下降法进行优化的。梯度下降法需要在开始训练时给每一个参数赋一个初始值。这个初始值的选取十分关键。一般 我们希望数据和参数的均值都为 0，输入和输出数据的方差一致。 在实际应用中，参数服从 高斯分布 或者 均匀分布 都是比较有效的初始化方式。
A well chosen initialization can:
- Speed up the convergence of gradient descent
- Increase the odds of gradient descent converging to a lower training (and generalization) error
Poor initialization can：
- lead to vanishing/exploding gradients , which also slows down the optimization algorithm
Random initialization is used to break symmetry and make sure different hidden units can learn different things

推荐文章

朝气蓬勃的伤疤 · (五)conda环境打包给沙箱环境 - jasonzhangxianrong - 博客园

5 月前

坚强的鸵鸟 · 使用 Gamepad API - Web API | MDN

7 月前

笑点低的荒野 · List<t>.FindIndex 方法 (System.Collections.Generic) | Microsoft Learn</t>

11 月前

傻傻的小蝌蚪 · sql server 查询日期最大和最小值

1 年前

潇洒的伤疤 · ubuntu下安装openMPI - starry_sky - 博客园

1 年前

二、参数初始化代码实践