什么是梯度下降

2025-12-25 | 0 评论 | 0 浏览

类比法

它的本质是： 通过不断试错，找到让模型误差最小的参数组合 。

想象你站在浓雾中的山顶，目标是尽快下到谷底（也就是损失最小的地方），但你看不清路。

这时候，你只能用脚感受脚下山坡的 最陡下降方向 （这就是‘梯度’），然后朝那个方向迈出一步。

每走一步，就重新感受一次坡度，再调整方向——这样一步步走下去，最终就会接近谷底。

在机器学习里：

所以，梯度下降不是魔法，而是一种 基于局部信息、迭代逼近最优解的优化策略 。”

梯度下降（Gradient Descent）是 一阶优化算法 ，用于最小化目标函数（通常是模型的损失函数 L( θ )），其核心思想是：
沿着当前参数处损失函数梯度的反方向迭代更新参数，以逐步逼近局部极小值点 。

从数学上看，参数更新规则为：

θ t **+1=θ t − η ∇θL(**θ t )

其中：

残差连接

标题：什么是梯度下降
作者：guobing
地址：http://guobingwei.tech/articles/2025/12/25/1766654030425.html