• 4. 深度学习计算

    4. 深度学习计算

    上一章介绍了包括多层感知机在内的简单深度学习模型的原理和实现。本章我们将简要概括深度学习计算的各个重要组成部分,如模型构造、参数的访问和初始化等,自定义层,读取、存储和使用GPU。通过本章的学习,我们将能够深入了解模型实现和计算的各个细节,并为在之后章节实现更复杂模型打下坚实的基础。

    • 4.1. 模型构造
      • 4.1.1. 继承Block类来构造模型
      • 4.1.2. Sequential类继承自Block
      • 4.1.3. 构造复杂的模型
      • 4.1.4. 小结
      • 4.1.5. 练习
      • 4.1.6. 参与讨论
    • 4.2. 模型参数的访问、初始化和共享
      • 4.2.1. 访问模型参数
      • 4.2.2. 初始化模型参数
      • 4.2.3. 自定义初始化方法
      • 4.2.4. 共享模型参数
      • 4.2.5. 小结
      • 4.2.6. 练习
      • 4.2.7. 参与讨论
    • 4.3. 模型参数的延后初始化
      • 4.3.1. 延后初始化
      • 4.3.2. 避免延后初始化
      • 4.3.3. 小结
      • 4.3.4. 练习
      • 4.3.5. 参与讨论
    • 4.4. 自定义层
      • 4.4.1. 不含模型参数的自定义层
      • 4.4.2. 含模型参数的自定义层
      • 4.4.3. 小结
      • 4.4.4. 练习
      • 4.4.5. 参与讨论
    • 4.5. 读取和存储
      • 4.5.1. 读写NDArray
      • 4.5.2. 读写Gluon模型的参数
      • 4.5.3. 小结
      • 4.5.4. 练习
      • 4.5.5. 参与讨论
    • 4.6. GPU计算
      • 4.6.1. 计算设备
      • 4.6.2. NDArray的GPU计算
      • 4.6.3. Gluon的GPU计算
      • 4.6.4. 小结
      • 4.6.5. 练习
      • 4.6.6. 参考文献
      • 4.6.7. 参与讨论