python-使用张量板回调时Keras不输出任何输出,高内存和CPU使用率并且不使用GPU-Python开发

我在Keras的处境很糟糕,这真的让我感到震惊.我正在尝试使用带有额外卷积,全局平均池和密集层的预训练的Inception来训练CNN.我正在使用ImageDataGenerator加载数据.数据生成器工作正常,我已经测试过了.该模型也编译良...

我在Keras的处境很糟糕,这真的让我感到震惊.
我正在尝试使用带有额外卷积,全局平均池和密集层的预训练的Inception来训练CNN.我正在使用ImageDataGenerator加载数据.

数据生成器工作正常,我已经测试过了.该模型也编译良好.但是,当我运行fit_generator时,没有输出输出,CPU处于100％的状态,内存开始缓慢填充,直到溢出为止.尽管我有一个GPU,并且已经在tensorflow(这里是后端)中使用了很多次,但Keras完全忽略了它.

考虑到批处理大小可能是个问题,我将其设置为1,但并不能解决问题.图像尺寸为299×299,无论如何都不大.

我将以下代码作为参考发布,尽管在我看来这没有什么不妥：

def get_datagen():
    return ImageDataGenerator(rotation_range=30,
                        width_shift_range=0.2,
                        height_shift_range=0.2,
                        horizontal_flip=True,
                        fill_mode='nearest'
                        )

# Setup and compile the model.
model = InceptionV3(include_top=False, input_shape=(None, None, 3))

# Set the model layers to be untrainable
for layer in model.layers:
    layer.trainable = False

x = model.output
x = Conv2D(120, 5, activation='relu')(x)
x = GlobalAveragePooling2D()(x)
predictions = Activation('softmax')(x)

model_final = Model(inputs=model.inputs, outputs=predictions)

model_final.compile(optimizer='adam', loss='categorical_crossentropy',metrics=['accuracy'])

# Define the dataflow.
train_gen = get_datagen()
val_test_gen = get_datagen()

train_data = train_gen.flow_from_directory(train_folder, target_size=(299, 299), batch_size=1)
val_data = val_test_gen.flow_from_directory(validation_folder, target_size=(299, 299), batch_size=1)
test_data = val_test_gen.flow_from_directory(test_folder, target_size=(299, 299), batch_size=1)

train_size = train_data.n
val_size = val_data.n
test_size = test_data.n

# Define callbacks.
model_checkpoint = ModelCheckpoint('../models/dbc1/', monitor='val_accuracy', verbose=1, save_best_only=True)
early_stopping = EarlyStopping(monitor='val_accuracy', patience=3, verbose=1, mode='max')
tensorboard = TensorBoard(log_dir='../log/dbc1', histogram_freq=1, write_grads=True, )


model_final.fit_generator(train_data, steps_per_epoch=1, epochs=100, 
                          callbacks=[model_checkpoint, early_stopping, tensorboard],
                         validation_data=val_data, verbose=1)

编辑

tensorboard回调似乎是这里的问题.当我删除它时,一切正常.有人知道为什么会这样吗？

解决方法:

在某些条件下使用histogram_freq = 1时,似乎存在问题(可能与keras#3358有关).

您可以尝试设置histogram_freq = 0并在keras存储库中提交问题.您没有梯度直方图,但是至少您可以训练：

model.fit(...,
          callbacks=[
              TensorBoard(log_dir='./logs/', batch_size=batch_size),
              ...
          ])

我注意到,并非所有训练有素的模型都不会出现此问题.如果不需要使用InceptionV3,则建议您切换到其他模型.到目前为止,我发现以下代码(使用VGG19从您的代码改编而成)适用于keras == 2.1.2,tensorflow == 1.4.1：

from keras.applications import VGG19
from keras.applications.vgg19 import preprocess_input

input_shape = (224, 224, 3)
batch_size = 1

model = VGG19(include_top=False, input_shape=input_shape)
for layer in model.layers:
    layer.trainable = False

x, y = model.input, model.output
y = Conv2D(2, 5, activation='relu')(y)
y = GlobalAveragePooling2D()(y)
y = Activation('softmax')(y)

model = Model(inputs=model.inputs, outputs=y)
model.compile('adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

g = ImageDataGenerator(rotation_range=30,
                       width_shift_range=0.2,
                       height_shift_range=0.2,
                       horizontal_flip=True,
                       preprocessing_function=preprocess_input)

train_data = g.flow_from_directory(train_folder,
                                   target_size=input_shape[:2],
                                   batch_size=batch_size)
val_data = g.flow_from_directory(validation_folder,
                                 target_size=input_shape[:2],
                                 batch_size=batch_size)
test_data = g.flow_from_directory(test_folder,
                                  target_size=input_shape[:2],
                                  batch_size=batch_size)

model.fit_generator(train_data, steps_per_epoch=1, epochs=100,
                    validation_data=val_data, verbose=1,
                    callbacks=[
                        ModelCheckpoint('./ckpt.hdf5',
                                        monitor='val_accuracy',
                                        verbose=1,
                                        save_best_only=True),
                        EarlyStopping(patience=3, verbose=1),
                        TensorBoard(log_dir='./logs/',
                                    batch_size=batch_size,
                                    histogram_freq=1,
                                    write_grads=True)])

基础教程推荐