TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

Niteowl

2020-07-15

关注关注

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

最近，一位从事NLP工程师Gupta发现了TensorFlow存在的一个严重bug：

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。

这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。

具体来说，就是在API中使用自定义层，会导致trainable_variables中的权重无法更新。而且这些权重也不会放入non_trainable_variables中。

也就是说，原本需要训练的权重现在被冻结了。

让这位工程师感到不满的是，他大约一个月前在GitHub中把这个bug报告给谷歌，结果谷歌官方到现在还没有修复。

解决办法

如何检验自己的代码是否会出现类似问题呢？请调用model.trainable_variables来检测自己的模型：

for i, var in enumerate(model.trainable_variables): 
    print(model.trainable_variables[i].name)

看看你所有的可变权重是否正确，如果权重缺失或者未发生变化，说明你也中招了。

Gupta还自己用Transformer库创建模型的bug在Colab笔记本中复现了，有兴趣的读者可以前去观看。

https://colab.research.google.com/gist/Santosh-Gupta/40c54e5b76e3f522fa78da6a248b6826/missingtrainablevarsinference_var.ipynb

对此问题，Gupta给出的一种解决方法是：改为使用Keras子类创建模型。改用此方法后，所有的权重都将出现在trainable_variables中。

为了绝对确保用函数式API和子类方法创建的模型完全相同，Gupta在每个Colab笔记本底部使用相同的输入对它们进行了推理，模型的输出完全相同。

但是，使用函数式API模型进行训练会将许多权重视为冻结，而且这些权重也没有出现在non_trainable_variables中，因此无法为这些权重解冻。

为了检查谷歌最近是否修复了该漏洞，Gupta还安装了Nightly版的TF 2.3.0-rc1，保持框架处于最新状态，但如今bug依然存在。

网友：还是用PyTorch吧

刚刚，Keras创始人在Twitter上回复，这不是Keras的bug，并建议程序员使用单元测试。

对于Gupta所说的bug，有网友说，他在TensorFlow和Keras之间传递权重的时候，出现了类似的错误，从此转而使用PyTorch。

另外还有不少网友也反映，谷歌的框架不太完善，管理方式一团糟，是在让用户帮他们测试TensorFlow的bug。

反观PyTorch，说明文档通俗易懂，最近官方还出了免费电子书，难道用PyTorch不香吗？

keras tensorflow 权重

Niteowl

0 关注 0 粉丝 0 动态

关注关注

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

Keras安装 {Keras 由浅入深}

dependencies:cuDNN .HDF5 and h5py .graphviz and pydot .用tensorflow能够使得传统的keras程序有较好的扩展性。

dataastron 2020-06-25

tensorflow 测量工具，与自定义训练

# 新建测量器m = tf.keras.metrics.Accuracy()# 写入测量器m.update_state([0,1,1],[0,1,2])# 读取统计信息m.result() # 准确率为0.66# 清除m.reset_states() a

lybbb 2020-05-05

利用Keras中的权重约束减少深度神经网络中的过拟合

权重约束提供了一种方法，用于减少深度学习神经网络模型对训练数据的过度拟合，并改善模型对新数据的性能。有多种类型的权重约束，例如最大和单位向量规范，有些需要必须配置的超参数。如何使用Keras API创建向量范数约束。约束是按层指定的，但是在层中应用和强制执

zhongkeli 2020-07-14

keras读取h5文件load_weights、load代码操作

关于保存h5模型、权重网上的示例非常多，也非常简单。主要有以下两个函数：。load_model代码包含load_weights的代码，区别在于load_weights时需要先有网络、并且load_weights需要将权重数据写入到对应网络层的tensor中

jiuniangyuanzikk 2020-06-14

Python中读取图片的6种方式

Python进行图片处理，第一步就是读取图片，这里给大家整理了6种图片的读取方式，并将读取的图片装换成numpy.ndarray()格式。首先需要准备一张照片，假如你有女朋友的话，可以用女朋友的，没有的话，那还学啥Python，赶紧找对象去吧!#将图片转换

xiaoxiaokeke 15评论 2020-11-04

比Keras更好用的机器学习“模型包”：0代码上手做模型

做机器学习模型时，只是融合各种算法，就已经用光了脑细胞？一位毕业于哥廷根大学、做机器学习的小哥也发现了这个问题：原本只是想设计个模型，结果“实现比设计还麻烦”。也就是说，用户只需要知道各种机器学习模型的原理，但不需要再自己动手写代码。相比于Keras，这个

KyrieHe 2020-10-04

Keras创始人：过去6个月，深度学习岗位已崩溃

深度学习岗位在这6个月以来已经崩溃。对于那些投资深度学习的小企业来说，目前的情形已经很清楚了：深度学习岗位不是必须的，随着疫情的到来，它们将可能被裁撤。需要澄清一下，我个人认为这只是一个疫情期间经济衰退的现象，而不是又一个AI寒冬。知情网友在针对这场话题的

davidsmith 2020-09-04

机器学习带你横扫乐坛，你就是下一个方文山

我太爱北极猴子乐队了，但他们已经很久没有发行新单曲了。久久欠缺精神食粮的我某天晚上突然灵机一动，我可以自给自足呀!于是我写了个简单的代码，用Keras和TensorFlow训练了一个文本生成模型，写出一首全新的北极猴子的歌。不过条件有限，这玩意儿无法跟真正

xiaoxiaokeke 2020-08-04

Keras调用LSTM之函数接口介绍

activation: 要使用的激活函数，如果传入None，则不使用激活函数。默认分段线性近似 sigmoid 。use_bias: 布尔值，该层是否使用偏置向量。如果为 True，初始化时，将忘记门的偏置加 1。将其设置为 True 同时还会强制bi

xiaoxiaokeke 2020-07-28

Tensorflow-gpu训练SSD时遇到的问题及解决方法

问题一：使用GTX2080的显卡，在batch_size只有8的情况下，训练速度只有2-3秒每步。重新执行你的训练指令就可以了。在我的训练中，成功启动cuda后，速度提升了10倍。

诗蕊 2020-07-20

Keras之对鸢尾花识别

鸢尾花数据集是一个经典的机器学习数据集，非常适合用来入门。这四个特征确定了单株鸢尾花的下列植物学特征：。机器学习中，为了保证测试结果的准确性，一般会从数据集中抽取一部分数据专门留作测试，其余数据用于训练。One-Hot编码是分类变量作为二进制向量的表示。O

dataastron 2020-07-18

python中Keras下载mnist数据集

直接写代码进行加载数据集，如果没有下载数据集，它会自动进行下载。等待下载完成即可。首先我们直接访问链接进行下载，官方下载地址，将下载好的文件，复制到..\.keras\datasets 文件夹下即可。然后就可以直接使用上面的load_data()函数进行

xiaoxiaokeke 2020-06-27

随机森林 {Keras 由浅入深}

随机森林是集成学习中的一种方法。

KyrieHe 2020-06-25

决策树 {Keras 由浅入深}

决策树是基于区域的机器学习方法，是非线性的。构建决策树最重要的环节其实就是选择分类变量，分类变量的存在使得产生非线性解，决策树能够很好的解决非线性分类，但是树的生成的终止条件很难把握，并且由于生成的随机性，往往使得决策树过于敏感，容易发生过拟合。所以对于一

xiaoxiaokeke 2020-06-25

目标检测算法-YOLO-V4代码详解

Yolo-V4算法中对网络进行了改进，使用CSPDarknet53。对主干网络进行了修改，将原先的Darknet53改为CSPDarknet53，其中是将激活函数改为Mish激活函数，并且在网络中加入了CSP结构。对特征提取过程的加强，添加了SPP，PAN

CodeWang 2020-06-21

使用GPU在AIStudio服务器进行猫狗分类 Keras框架

　　本地没有GPU环境，今天在百度AIStudio的GPU服务器上竟然跑起来了Keras版本的猫狗分类，服务器配置如图：　　具体操作步骤。　　1.首先打开百度AI Studio，并建立自己的工程。　　2.数据准备，下载猫狗分类数据集在本地电脑，选取猫狗各2

xiaoxiaokeke 2020-06-16

使用Keras实现简单线性回归模型操作

神经网络可以用来模拟回归问题，实质上是单输入单输出神经网络模型，例如给下面一组数据，用一条线来对数据进行拟合，并可以预测新输入 x 的输出值。然后用 Sequential 建立 model，再用 model.add 添加神经层，添加的是 Dense 全连

zhongkeli 2020-06-14

keras 读取多标签图像数据方式

其中label包括两类标签，label1第一类：上衣，裤子，外套。label2第二类，蓝色，黑色，红色。这样两个输出label1，label2都是是分类，我们可以直接把label1和label2整合为一个label，直接编码，比如[蓝色，上衣]编码为[01

lujiandong 2020-06-14

安科网

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

Niteowl

解决办法

网友：还是用PyTorch吧

Niteowl

相关推荐

2020年深度学习框架对比速读

TensorFlow 2入门指南，初学者必备！

Keras安装 {Keras 由浅入深}

tensorflow 测量工具，与自定义训练

利用Keras中的权重约束减少深度神经网络中的过拟合

keras读取h5文件load_weights、load代码操作

Python中读取图片的6种方式

比Keras更好用的机器学习“模型包”：0代码上手做模型

Keras创始人：过去6个月，深度学习岗位已崩溃

机器学习带你横扫乐坛，你就是下一个方文山

Keras调用LSTM之函数接口介绍

Tensorflow-gpu训练SSD时遇到的问题及解决方法

Keras之对鸢尾花识别

python中Keras下载mnist数据集

随机森林 {Keras 由浅入深}

决策树 {Keras 由浅入深}

目标检测算法-YOLO-V4代码详解

使用GPU在AIStudio服务器进行猫狗分类 Keras框架

使用Keras实现简单线性回归模型操作

keras 读取多标签图像数据方式

Niteowl