• Keras Pipeline *
    • Keras Sequential/Functional API 模式建立模型
    • 使用 Keras Model 的 compile 、 fit 和 evaluate 方法训练和评估模型

    Keras Pipeline *

    以上示例均使用了 Keras 的 Subclassing API 建立模型,即对 tf.keras.Model 类进行扩展以定义自己的新模型,同时手工编写了训练和评估模型的流程。这种方式灵活度高,且与其他流行的深度学习框架(如 PyTorch、Chainer)共通,是本手册所推荐的方法。不过在很多时候,我们只需要建立一个结构相对简单和典型的神经网络(比如上文中的 MLP 和 CNN),并使用常规的手段进行训练。这时,Keras 也给我们提供了另一套更为简单高效的内置方法来建立、训练和评估模型。

    Keras Sequential/Functional API 模式建立模型

    最典型和常用的神经网络结构是将一堆层按特定顺序叠加起来,那么,我们是不是只需要提供一个层的列表,就能由 Keras 将它们自动首尾相连,形成模型呢?Keras 的 Sequential API 正是如此。通过向 tf.keras.models.Sequential() 提供一个层的列表,就能快速地建立一个 tf.keras.Model 模型并返回:

    1. model = tf.keras.models.Sequential([
    2. tf.keras.layers.Flatten(),
    3. tf.keras.layers.Dense(100, activation=tf.nn.relu),
    4. tf.keras.layers.Dense(10),
    5. tf.keras.layers.Softmax()
    6. ])

    不过,这种层叠结构并不能表示任意的神经网络结构。为此,Keras 提供了 Functional API,帮助我们建立更为复杂的模型,例如多输入 / 输出或存在参数共享的模型。其使用方法是将层作为可调用的对象并返回张量(这点与之前章节的使用方法一致),并将输入向量和输出向量提供给 tf.keras.Modelinputsoutputs 参数,示例如下:

    1. inputs = tf.keras.Input(shape=(28, 28, 1))
    2. x = tf.keras.layers.Flatten()(inputs)
    3. x = tf.keras.layers.Dense(units=100, activation=tf.nn.relu)(x)
    4. x = tf.keras.layers.Dense(units=10)(x)
    5. outputs = tf.keras.layers.Softmax()(x)
    6. model = tf.keras.Model(inputs=inputs, outputs=outputs)

    使用 Keras Model 的 compile 、 fit 和 evaluate 方法训练和评估模型

    当模型建立完成后,通过 tf.keras.Modelcompile 方法配置训练过程:

    1. model.compile(
    2. optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
    3. loss=tf.keras.losses.sparse_categorical_crossentropy,
    4. metrics=[tf.keras.metrics.sparse_categorical_accuracy]
    5. )

    tf.keras.Model.compile 接受 3 个重要的参数:

    • oplimizer :优化器,可从 tf.keras.optimizers 中选择;

    • loss :损失函数,可从 tf.keras.losses 中选择;

    • metrics :评估指标,可从 tf.keras.metrics 中选择。

    接下来,可以使用 tf.keras.Modelfit 方法训练模型:

    1. model.fit(data_loader.train_data, data_loader.train_label, epochs=num_epochs, batch_size=batch_size)

    tf.keras.Model.fit 接受 5 个重要的参数:

    • x :训练数据;

    • y :目标数据(数据标签);

    • epochs :将训练数据迭代多少遍;

    • batch_size :批次的大小;

    • validation_data :验证数据,可用于在训练过程中监控模型的性能。

    Keras 支持使用 tf.data.Dataset 进行训练,详见 tf.data 。

    最后,使用 tf.keras.Model.evaluate 评估训练效果,提供测试数据及标签即可:

    1. print(model.evaluate(data_loader.test_data, data_loader.test_label))