梯度

Gradient Grad
向量微分算子数乘标量函数

基本定义

几何意义:

dfds=fu|f|

梯度为一个向量,表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大。

f=fxi+fyj

梯度与场

的概念和梯度密切相关

F(M)=P(M)i+Q(M)j+R(M)k

如果向量场 F(M) 是某个数量场 f(M) 的梯度,则称数量场 f(M) 是向量场 F(M)势函数,向量场 F(M)势场

实例

求数量场 mr 的梯度场,m>0,r=x2+y2+z2 为原点与点 M(x,y,z) 的距离

gradmr=mr2(xri+yrj+zrk)=mr2er

物理意义:位于原点质量为 m 的质点对位于点 M 的引力

梯度下降

Gradient Descend
学习率
批量梯度下降:每一步更新使用所有的训练样本
小批量梯度下降:每一步更新使用一定量的训练样本
随机梯度下降:每一步更新使用某个样本
batch_size: 每次所取样本的个数