ELBO 与 KL散度

OccamsRazor

2018-01-13

浅谈KL散度

一、第一种理解

相对熵（relative entropy）又称为KL散度（Kullback–Leibler divergence，简称KLD），信息散度（information divergence），信息增益（information gain）。

KL散度是两个概率分布P和Q差别的非对称性的度量。

KL散度是用来度量使用基于Q的编码来编码来自P的样本平均所需的额外的比特个数。典型情况下，P表示数据的真实分布，Q表示数据的理论分布，模型分布，或P的近似分布。

根据shannon的信息论，给定一个字符集的概率分布，我们可以设计一种编码，使得表示该字符集组成的字符串平均需要的比特数最少。假设这个字符集是X，对x∈X，其出现概率为P(x)，那么其最优编码平均需要的比特数等于这个字符集的熵：

H(X)=∑_x∈XP(x)log[1/P(x)]

在同样的字符集上，假设存在另一个概率分布Q(X)。如果用概率分布P(X)的最优编码（即字符x的编码长度等于log[1/P(x)]），来为符合分布Q(X)的字符编码，那么表示这些字符就会比理想情况多用一些比特数。KL-divergence就是用来衡量这种情况下平均每个字符多用的比特数，因此可以用来衡量两个分布的距离。即：

D_KL(Q||P)=∑_x∈XQ(x)[log(1/P(x))] - ∑_x∈XQ(x)[log[1/Q(x)]]=∑_x∈XQ(x)log[Q(x)/P(x)]

由于-log(u)是凸函数，因此有下面的不等式

D_KL(Q||P) = -∑_x∈XQ(x)log[P(x)/Q(x)] = E[-logP(x)/Q(x)] ≥ -logE[P(x)/Q(x)] = -log∑_x∈XQ(x)P(x)/Q(x) = 0

即KL-divergence始终是大于等于0的。当且仅当两分布相同时，KL-divergence等于0。

===========================

举一个实际的例子吧：比如有四个类别，一个方法A得到四个类别的概率分别是0.1,0.2,0.3,0.4。另一种方法B（或者说是事实情况）是得到四个类别的概率分别是0.4,0.3,0.2,0.1,那么这两个分布的KL-Distance(A,B)=0.1*log(0.1/0.4)+0.2*log(0.2/0.3)+0.3*log(0.3/0.2)+0.4*log(0.4/0.1)

这个里面有正的，有负的，可以证明KL-Distance()>=0.

从上面可以看出， KL散度是不对称的。即KL-Distance(A,B)!=KL-Distance(B,A)

KL散度是不对称的，当然，如果希望把它变对称，

Ds(p1, p2) = [D(p1, p2) + D(p2, p1)] / 2.

二、第二种理解

今天开始来讲相对熵，我们知道信息熵反应了一个系统的有序化程度，一个系统越是有序，那么它的信息熵就越低，反之就越高。下面是熵的定义

如果一个随机变量 ELBO 与 KL散度的可能取值为，对应的概率为，则随机变量的熵定义为

ELBO 与 KL散度

有了信息熵的定义，接下来开始学习相对熵。

1. 相对熵的认识

相对熵又称互熵，交叉熵，鉴别信息，Kullback熵，Kullback-Leible散度（即KL散度）等。设 ELBO 与 KL散度和

是 ELBO 与 KL散度取值的两个概率概率分布，则对的相对熵为

ELBO 与 KL散度

在一定程度上，熵可以度量两个随机变量的距离。KL散度是两个概率分布P和Q差别的非对称性的度量。KL散度是

用来度量使用基于Q的编码来编码来自P的样本平均所需的额外的位元数。典型情况下，P表示数据的真实分布，Q

表示数据的理论分布，模型分布，或P的近似分布。

2. 相对熵的性质

相对熵（KL散度）有两个主要的性质。如下

（1）尽管KL散度从直观上是个度量或距离函数，但它并不是一个真正的度量或者距离，因为它不具有对称性，即

ELBO 与 KL散度

（2）相对熵的值为非负值，即

ELBO 与 KL散度

在证明之前，需要认识一个重要的不等式，叫做吉布斯不等式。内容如下

ELBO 与 KL散度

3. 相对熵的应用

相对熵可以衡量两个随机分布之间的距离，当两个随机分布相同时，它们的相对熵为零，当两个随机分布的差别增

大时，它们的相对熵也会增大。所以相对熵（KL散度）可以用于比较文本的相似度，先统计出词的频率，然后计算

KL散度就行了。另外，在多指标系统评估中，指标权重分配是一个重点和难点，通过相对熵可以处理。

4.交叉熵与相对熵

ELBO 与 KL散度

参考：http://www.cnblogs.com/hxsyl/p/4910218.html

https://www.zhihu.com/question/41252833

ELBO（证据下界）

网上关于ELBO的内容较少，主要常出现在变分推断当中。

例如在用EM处理LDA主题模型时，

看看文档数据的对数似然函数 ELBO 与 KL散度如下，为了简化表示，用代替，用来表示对于变分分布的期望。

ELBO 与 KL散度

其中，从第(5)式到第(6)式用到了Jensen不等式：

ELBO 与 KL散度

一般把第(7)式记为：

ELBO 与 KL散度

由于 ELBO 与 KL散度是我们的对数似然的一个下界（第6式），所以这个L一般称为ELBO(Evidence Lower BOund)。那么这个ELBO和我们需要优化的的KL散度有什么关系呢？注意到：

ELBO 与 KL散度

在(10)式中，由于对数似然部分和我们的KL散度无关，可以看做常量，因此我们希望最小化KL散度等价于最大化ELBO。那么我们的变分推断最终等价的转化为要求ELBO的最大值。现在我们开始关注于极大化ELBO并求出极值对应的变分参数λ,ϕ,γ。

参考文献：https://zhuanlan.zhihu.com/p/29932017

font 散度 log sub

OccamsRazor

0 关注 3 粉丝 0 动态

相关推荐

win10家庭版找不到gpedit.msc的解决办法

最近在解决“管理员已阻止你运行此应用”时，需要用到“gpedit.msc”，在输入此命令却提示找不到。特将此问题的方法出来。在编辑器左侧依次找到“HKEY_CURRENT_USER\Software\Policies\Microsoft\MMC”。不过有的

IT之家 2020-03-11

Linux解压文件

1、*.tar 用 tar –xvf 解压2、*.gz 用 gzip -d或者gunzip 解压3、*.tar.gz和*.tgz 用 tar –xzf 解压4、*.bz2 用 bzip2 -d或者用bunzip2 解压5、*.tar.bz2用tar –xj

graseed 14评论 2020-10-28

VS Code + PlantUML实现跨平台设计

在日常的开发设计中，不可避免的要对系统进行一些UML相关的设计。UML通过一种可视化的方式，对系统进行建模、设计，它是一种统一建模语言。在Windows操作系统下，Visio是一种常用的建模工具。PlantUML 是一个开源项目,支持快速绘制时序图、用例图

zbkyumlei 10评论 2020-10-12

jackson gson

private static final ObjectMapper objectMapper = new ObjectMapper();

SXIAOYI 2020-09-16

让数据处理更简单？百度EasyData推出首个高级智能数据清洗功能

在进行AI模型开发时，数据的数量与质量直接影响模型效果。在实地数据采集之后，企业往往需要从大量数据中筛选出符合训练要求的相关数据，剔除质量差或不相关的数据，这个步骤被称为数据清洗。针对数据清洗这一具体功能，EasyData目前上线了去相似、去模糊、旋转、裁

jinhao 2020-09-07

总结一些，我在书写 CSS 的时候，经常犯的错误！

当我们非常专注写代码时候，我们往往会无意识的写出一些无效CSS代码。我把这种称为 “潜意识错误”。不过，这些错误都比较好解决，不需要花很多时间，只要纠正一下就行了。跟着本文看看，我会经常写哪些有趣的 CSS 错误。/*现这一点并不容易，你们看出错误在哪里吗

impress 2020-08-26

如何用Spring WebFlux构建Reactive REST API

在本文中，我们将讨论如何使用Spring WebFlux来构建响应式REST API。在正式讨论之前，让我们首先来看看系统的开发，传统REST在实现中遇到的问题，以及当前API的普遍需求。如今的系统讲求的是：分布式应用、云原生、高可用性和可扩展性。因此，

liuqipao 2020-07-07

css常用的简写技巧_css background简写、css border 简写、css font属性简写等

css样式中有很多简写方式，比如：设置背景，字体，边框，盒子等。我们都可以把css代码合并为一行，这篇文章将总结有哪些属性支持css简写。font:normal small-caps bold 14px/1.5em ‘宋体‘,arial,verdana;d

淡风wisdon大大 2020-06-06

数据科学家、开发者的新神器 Amazon SageMaker正式上线中国区

机器学习自诞生至今，已经被应用在很多领域，但目前来看对于从业人员来说仍然存在着一些阻力。首先是机器学习方向的学习门槛高，人工智能、机器学习这些知识，相对来说比较苦涩难懂，对学习人员的综合素养要求高；想要真正成为一名机器学习工程师。而近期登陆中国区的Amaz

yoohsummer 2020-06-01

雷林鹏分享：Apache POI字体/Fonts

　　本章介绍如何设置不同的字体，应用样式，并在Excel电子表格中显示的方向不同角度的文字。　　每个系统附带一个很大的字体如 Arial, Impact, Times New Roman,等字体集合也可以用新的字体更新，如果需要的话。同样也有各种风格，其中

chenjia00 2020-05-29

虹软开放平台算法上新助力全面拓展人脸识别细分化场景

自虹软视觉开放平台ArcFace3.0上线以来，凭借对人脸识别、活体检测、年龄检测、性别检测等核心算法模型的全面升级，其算法鲁棒性大幅提升，接入门槛显著降低，并继续秉承了免费、离线的核心，进而成为了广大开发者落地AI应用的利器。因此，虹软视觉开放平台也在近

baike 2020-05-19

JQuery省市联动效果实现过程详解

在我们的注册表单中,通常我们需要知道用户的籍贯,需要一个给用选择的项,当用户选中了省份之后,列出省下面所有的城市。<div id="div1">this is a text that will be replaced!var

扭来不叫牛奶 2020-05-08

代码（移动端rem初始化设置1rem=15px）

这是之前项目的rem基本设置，这样，在vscode中安装cssrem插件后，改成1rem=15px，其他的屏幕也将得到相应适配。

hxmilyy 2020-05-11

Blogs顶部添加欢迎信息

<div style="text-align: center; font-size:20px; margin-bottom:0px; margin-top:0px; opacity:0.5; ">欢迎来到Panda.Li个

黎豆子 2020-05-07

Markdown常用语法

---***7.引用Markdown提供了一个特殊符号>用于段首进行强调，被强调的文字部分将会高亮显示。引用也可以嵌套，如加两个>>三个>>>...>引用1>>引用2效果：引用1 引用2

xiongweiwei00 2020-04-29

JAVA数据结构与算法之数组与队列（二）

2) 遵循先入先出的原则。后存入的要后取出。1) 队列本身是有序列表，若使用数组的结构来存储队列的数据，则队列数组的声明如上图, 其中 maxSize 是该队列的最大容量。2）因为队列的输出、输入是分别从前后端来处理，因此需要两个变量 front 及 r

Cypress 2020-04-25

CSS之em、rem、px区别介绍

　　rem是相对于根目录的，所有它会随HTML元素的属性变化而变化

尚衍亮 2020-04-24

css动画 animation

animation-name:textgo;(动画名)animation-duration:3s;animation-timing-function:速度曲线// animation-iteration-count:动画次数//animation-dire

冰蝶 2020-04-20

CSS3（6）字体

使用 CSS3，网页设计师可以使用他/她喜欢的任何字体。只需简单的将字体文件包含在网站中，它会自动下载给需要的用户。在新的 @font-face 规则中，您必须首先定义字体的名称，然后指向该字体文件。

sdbxpjzq 2020-04-11

Win10 19592快速预览版怎么手动更新？

3月26日，微软在快速通道又推送了 Windows 10 Insider Preview 19592.1001系统更新。下面介绍Windows 10 19592 快速预览版更新教程。在管理员Windows PowerShell 窗口中输入 sfc /SCA

huangkanII 2020-03-25

OccamsRazor

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号