5、路线图

这本书分为两个部分。

第一部分，机器学习的基础知识，涵盖以下主题：

什么是机器学习？它被试图用来解决什么问题？机器学习系统的主要类别和基本概念是什么？
典型的机器学习项目中的主要步骤。
通过拟合数据来学习模型。
优化成本函数（cost function）。
处理，清洗和准备数据。
选择和设计特征。
使用交叉验证选择一个模型并调整超参数。
机器学习的主要挑战，特别是欠拟合和过拟合（偏差和方差权衡）。
对训练数据进行降维以对抗 the curse of dimensionality（维度诅咒）
最常见的学习算法：线性和多项式回归， Logistic 回归，k-最近邻，支持向量机，决策树，随机森林和集成方法。

第二部分，神经网络和深度学习，包括以下主题：

什么是神经网络？它们有啥优势？
使用 TensorFlow 构建和训练神经网络。
最重要的神经网络架构：前馈神经网络，卷积网络，递归网络，长期短期记忆网络（LSTM）和自动编码器。
训练深度神经网络的技巧。
对于大数据集缩放神经网络。
强化学习。

第一部分主要基于 scikit-learn ，而第二部分则使用 TensorFlow 。

注意：不要太急于深入学习到核心知识：深度学习无疑是机器学习中最令人兴奋的领域之一，但是你应该首先掌握基础知识。而且，大多数问题可以用较简单的技术很好地解决（而不需要深度学习），比如随机森林和集成方法（我们会在第一部分进行讨论）。如果你拥有足够的数据，计算能力和耐心，深度学习是最适合复杂的问题的，如图像识别，语音识别或自然语言处理。