迁移学习与微调：站在巨人的肩膀上

迁移学习与微调：站在巨人的肩膀上#

还记得完整训练流程中那个 MNIST 分类器吗？我们用 60,000 张图片训练，达到了不错的准确率。但现实世界中的很多任务没有这么多数据——医学影像可能只有几百张，工业缺陷图片可能只有几十张。

神经网络训练基础告诉我们，小数据集上从头训练深度网络极易过拟合。但如果有一种方法，能让你用100 张图片就达到别人用10,000 张图片训练的效果呢？

这就是迁移学习（Transfer Learning）——站在巨人的肩膀上，借用别人已经学到的知识来解决你的问题。

迁移学习是深度学习中最重要的技术范式之一，通过复用预训练模型的知识，有效解决数据稀缺、计算资源受限等实际问题。

学习目标

完成本章后，你将能够：

本章是 PyTorch 实践：把理论变成代码中技能的高级应用：

核心认知：迁移学习不是新技术，而是前面所有知识的综合运用——你仍然在使用相同的 PyTorch API，只是站在了巨人的肩膀上。

本章系统介绍迁移学习的基础与实践：阐述迁移学习的核心动机与领域/任务的形式化定义；从迁移情境和方法两个维度分类；深入讲解特征提取、微调、分层学习率等核心技术；最后提供实操指南与常见问题解决方案。

学习路径：理解思想 → 掌握分类 → 动手实践 → 解决实际问题

前置章节	本章应用
神经网络模块：搭建计算图	加载预训练模型、替换分类头
优化器：用梯度更新参数	分层学习率、参数冻结
完整训练流程	完整训练流程、早停机制
神经网络训练基础	过拟合诊断、正则化策略
卷积神经网络	归纳偏置（Inductive Bias）与预训练权重的关系

学习本章前，请确保你已经掌握

本讲义假设你已经熟悉神经网络训练的基本流程，包括：

还没掌握？

如果你还没有这些基础，建议先学习 PyTorch 实践：把理论变成代码章节。

贡献者与修订历史

查看详细修订记录

bba351e 2026-04-29 - Heyan Zhu: docs: update chapter summaries and learning paths for consistency
b5be2d6 2026-04-28 - Heyan Zhu: docs: update documentation and improve content organization
b7ed915 2026-02-28 - Heyan Zhu: docs: add transfer learning