引言

引言#

在深入探讨计算图、反向传播和梯度下降之前，我们先明确本章的学习目标：

学习目标

机器学习的目标是让计算机从数据中自己发现规律，而不是我们一条条写规则。核心挑战是如何自动调整模型参数，让它能更好地拟合数据、做出准确预测。

机器学习的核心挑战

神经网络训练涉及几个关键环节，每个环节都需要特定的数学工具：

这些概念相互配合，构成了现代深度学习框架的核心机制 [GBC16]。

本章我们将从计算图开始，建立"数据流"的直觉视角。然后理解激活函数如何用非线性变换在空间中划分决策边界。接着探讨损失函数如何定义优化目标、塑造损失曲面的几何形状。之后理解反向传播算法如何高效地完成"信用分配"——把最终误差分摊给每个参数。最后探索梯度下降与优化算法如何在损失曲面上寻找最优解。

掌握这些核心机制后，总结与展望将回顾本章要点，然后下一章我们将用PyTorch构建实际的神经网络，在MNIST任务上观察这些理论如何转化为训练动态。

Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep learning. MIT Press, 2016.

贡献者与修订历史

查看详细修订记录

59126f4 2026-04-26 - Heyan Zhu: docs(math-fundamentals): update content structure and add citations
756a793 2026-04-25 - Heyan Zhu: docs(math-fundamentals): update content structure and improve explanations
0c291d7 2025-12-10 - Heyan Zhu: docs: restructure course materials and add new content