Tensorflow Graph概述

TensorFlowers

2018-07-20

关注关注

Tensorflow Graph概述

本文讨论tensorflow如何执行您的机器学习模型。我们将简要概述tensorflow graph的组件，然后深入研究如何跨单个和多个设备执行此图。

tensorflow graph具有以下特性。每个节点都有零个或多个输入，并表示一个操作的实例化。

从图的边缘流出的值称为张量。这些张量在经过这些节点时会经历各种变换。

张量是任意维度数组，其中在图形构建时间内推断出基础元素类型。这使得Tensorflow非常快，因为它通过这个图表知道未来会发生什么操作。因此，这些知识允许进行各种编译时优化。

特殊的边称为控制依赖—没有数据流通过这些边，但是它们表明，控制依赖的源节点必须在目标节点执行之前完成执行

此属性允许客户端在关系发生之前执行。例如，这对于控制峰值内存使用非常有用。

操作和内核

一个操作定义了一个计算：例子可能是 -

加
矩阵乘法

操作可以具有属性。属性的一个用例是使操作具有多态性（在相同数据类型的元素之间执行操作）

内核定义为：可以在特定类型的设备（CPU，GPU，TPU）等上运行的操作的实现。

会话（Sessions）

客户端通过创建会话（Session）与Tensorflow系统交互。

会话接口有一个名为Extend的方法。这允许我们用附加的节点和边来修改计算图。
会话接口有另一个方法Run。

此函数计算所有必须执行的节点的传递闭包，以便计算所请求的输出。
然后，它按照尊重节点依赖关系的顺序排列节点

通常，Tensorflow的用途是

使用图表设置一次会话。
通过运行图或不同的子图的时间数以百万计的运行

注意:图的传递闭包是一个矩阵，它定义了图中每个节点之间的可达性。这个矩阵将被填入0和1。0定义不可达，1定义可达

变量

变量是持久张量。大多数张量运行后都无法生存。变量在运行操作后存活。变量的用例是存储神经网络的参数。在图形上调用Run时，将更新这些变量。

设备

工作人员处理一个或多个设备。这些设备可以是CPU内核、GPU等。它们通过设备名称和设备类型进行标识。设备名称可以是

/job:localhost/device:cpu:0

在分布式设置中，作业名称是指设备执行的作业。每个设备对象有两个功能:

分配/释放内存
安排高级层请求的内核的执行

张量（Tensors）

类型化多维数组，这些张量是Tensorflow的基本数据类型。张量可以是各种类型，范围从：

8位到64位
IEEE浮点和双精度类型
复数数据类型
字符串类型（任意字节数组）

执行图：实施视角

概观

客户端与主程序和一个或多个工作进程联系。

工作进程处理comptation设备如gpu和CPU核心。

在Tensorflow中有两个设置:

本地设置——客户机、主服务器和工作人员都在同一台计算机中。
分布式设置——客户机、主设备和工作人员都可以位于不同的设备中。在分布式环境中，我们在容器中运行这些不同的组件。这些容器通过像Kubernetes这样的集群调度系统进行调度。

单一设备设置

运行Tensorflow的最简单方案。

单个工作进程
单个设备

以尊重节点之间的依赖关系的方式处理节点。进一步来说

每个节点都保留需要处理多少个从属节点的计数。每次执行依赖项时，此计数都会递减。
当count为0时，节点被放入就绪队列，随后进行处理。

请注意：未指定就绪队列如何处理节点

多设备设置

一旦我们有多个设备。我们有两件事需要担心：

确定为每个节点放置计算的设备
管理这些设备之间的通信。

节点放置

节点放置算法计算出给予哪个设备的节点。该算法使用成本模型来做出决策。根据白皮书，节点放置算法使用贪婪启发式算法，通过成本模型和其他参数来决定放置节点的设备。这种贪婪的启发式算法考虑到了

执行计算的成本。
从其他设备向此节点传输输入的成本。

选择最快完成此计算的设备作为设备。遵循这个放置过程直到放置节点。

由于该论文是在2016年编写的，因此该算法现在可能已经改变。

将节点放入设备后，需要在这些设备之间建立通信协议。

设备间通信

Tensorflow删除不同设备中节点之间的边缘，并用发送和接收调用替换它们。在运行时，发送和接收调用协调一致地跨设备传输数据。

该方法具有以下优点：

数据仅通过接收调用发送一次，并且内存仅针对单个张量分配一次。因此，张量的所有用户都不需要单独的接收/发送呼叫。
通过这种方式处理通信，我们让设备中不同节点的调度分散到工作者中。主设备无需跟踪此情况，因为发送和接收呼叫处理不同工作人员和设备之间的同步。

在分布式设置中执行

分布式设置与多设备设置非常相似。因为发送和接收调用是通过TCP或RDMA调用实现的，以跨机器边界移动数据。分布式设置中的执行需要容错。通过两件事检测到故障：

发送和接收呼叫之间的通信出错。
从主进程到每个工作进程的定期运行状况检查。

检测到故障时，将中止整个图形执行并从头开始。

然而，Tensorflow系统支持重启后的检查点和恢复。

变量值通过名为Save节点的东西进行检查点

这些保存节点与变量连接。可以将这些节点配置为定期执行。在每N次迭代之后，或者在N秒之后。

同样，这些变量也与还原节点连接，以便在重新启动后恢复它们的值。

多设备训练技术

同步SGD

这个SGD依赖一个主服务器来跟踪模型的参数，以及几个执行一些计算的工作线程。然后这些worker会将数据发回给master，以更新参数。一旦master从worker接收到所有的参数，它就会积累这些梯度，然后将新的梯度的副本发送给每个worker，这样worker就可以处理下一批梯度了

异步SGD

上述方法很好，但我们可以做得更好。异步SGD只是意味着主机在接收到一些参数后，执行更新并将梯度推送给所有工作人员。它不等待所有worker完成任务。

模型并行训练

用于训练深LSTMS。这种类型的训练是对于同一批示例，在不同的计算设备上同时完成模型计算的不同部分。

模型计算流水线的并发步骤

另一种更好地利用训练深度神经网络的常用方法是在同一设备中管道模型的计算。它与ASGD完全相同，但是在同一设备中执行相同的模型而不是多个设备，以更好地使用设备并行操作的能力。

结论

总之,Tensorflow是一个系统,支持

多种设备的训练和推理，非常适合在分布式环境中使用。
其设计方式可以通过数据流图结构实现未来的优化。
通过使用压缩技术使设备之间的通信更简单。
放置算法特别有趣，作者说它有可能被深度学习算法取代。

tensorflow ul

TensorFlowers

0 关注 0 粉丝 0 动态

关注关注

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 2020-10-27

对比PyTorch和TensorFlow的自动差异和动态模型

使用自定义模型类从头开始训练线性回归，比较PyTorch 1.x和TensorFlow 2.x之间的自动差异和动态模型子类化方法，这篇简短的文章重点介绍如何在PyTorch 1.x和TensorFlow 2.x中分别使用带有模块/模型API的动态子类化模型

lybbb 2020-10-15

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 2020-09-29

TensorFlow推出新接口，简化 ML移动端开发流程

在移动设备上使用 TensorFlow Lite 模型运行推理不仅仅是与模型交互，还需要额外的代码来处理复杂的逻辑，如数据转换、预处理/后处理、加载关联文件等。今天，我们将为大家介绍TensorFlow Lite Task Library，这是一组功能强大

ghjk0 2020-09-24

如何在浏览器中使用TensorFlow？

TensorFlow 2.0引入的创新之一是JavaScript实现：TensorFlow.js。我没料到这会加快训练或推理速度，但确实如此，它通过WebGL API支持所有的GPU。TensorFlow.js是一个库，用于使用JavaScript开发

yamaxifeng 2020-09-09

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

如何使编程更加便捷？最近，谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。用过 TensorFlow 框架的应该都知道，在操纵张量时，需要跟踪多个维度、张量形状和数据类型兼容性，当然还需要考虑

lybbb 2020-08-28

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 2020-08-25

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

使用tensorflow进行音乐类型的分类

音乐流媒体服务的兴起使得音乐无处不在。我们在上下班的时候听音乐，锻炼身体，工作或者只是放松一下。这些数据可能来自出版歌曲的人手工标注。但这并不是一个很好的划分，因为可能是一些艺人想利用一个特定流派的流行趋势。在描述了所使用的数据源之后，我对我们使用的方法及

carbon0 2020-08-16

【tensorflow】常量和变量的定义

data1 = tf.constant # 声明常量。data2 = tf.Variable # 声明变量。print # 打印数据的

源式羽语 2020-08-09

如何在tensorflow中判断tensor(张量)的值

众所周知，在tensorflow程序中，tensor只是占位符，在会话层没有run出tensor的值之前，我们是无法获知tensor的值的。也就是说，下面的逻辑是无法实现的：。#a is a 1-D tensor, b is a 1-D tensor to

sherry颖 2020-08-01

TensorFlow会话常用的两种方式

需要注意的是我们可以使用两种方法来创建并使用session. 我们计算WX+b，其中W，X和b是从随机正态分布中抽取的。我们开始定义一个shape=（3,1）的常量X：。实现一个线性功能：。初始化X，类型为tensor的随机变量，维度为(3,1). res

songbinxu 2020-07-19

Ｍnist手写数字识别 Tensorflow

MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology . 训练集由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局的

sherry颖 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

TensorFlow中超大的30个机器学习数据集

由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台，适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南，以及开放数据集的语料库。为了帮助你找到所需的

Kindle君 2020-07-15

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

将visual c++ 升级到2019版本。安装完之后，即可解决该问题。

源式羽语 2020-07-04

Yolo v3 Introduction to object detection with TensorFlow 2

https://medium.com/analytics-vidhya/yolo-v3-introduction-to-object-detection-with-tensorflow-2-ce75749b1c47

源式羽语 2020-06-28

Sklearn 与 TensorFlow 机器学习实用指南第二版

十六、使用 RNN 和注意力机制进行自然语言处理

卖小孩的咖啡 2020-06-28

安科网

Tensorflow Graph概述

TensorFlowers

操作和内核

会话（Sessions）

变量

设备

张量（Tensors）

执行图：实施视角

多设备训练技术

结论

TensorFlowers

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何在PyTorch和TensorFlow中训练图像分类模型

对比PyTorch和TensorFlow的自动差异和动态模型

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

TensorFlow推出新接口，简化 ML移动端开发流程

如何在浏览器中使用TensorFlow？

2020年深度学习框架对比速读

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

TensorFlow Lattice：灵活、可控、可解释的机器学习

TensorFlow 2入门指南，初学者必备！

使用tensorflow进行音乐类型的分类

【tensorflow】常量和变量的定义

如何在tensorflow中判断tensor(张量)的值

TensorFlow会话常用的两种方式

Ｍnist手写数字识别 Tensorflow

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

TensorFlow中超大的30个机器学习数据集

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

Yolo v3 Introduction to object detection with TensorFlow 2

Sklearn 与 TensorFlow 机器学习实用指南第二版

TensorFlowers