《数学之美》——第六章个人笔记

松鼠的窝

2018-04-24

关注关注

第六章信息的度量和作用

1 信息熵

从一个角度可以认为信息量就等于不确定性的多少。

信息熵（Entropy）,一般用符号H表示，单位是比特。

熵的定义:

变量的不确定性越大，熵也就越大。

文中有个关于冗余度的：重复的内容很多，信息量就小，冗余度就大。

2信息的作用

一个事物内部会存有随机性，也就是不确定性：U。引入信息 I 消除不确定性,而信息量取决于U的大小。当 I < U 时，可以消除一部分不确定性，也就是说新的不确定性：U' = U - I。

⭐条件熵

假设X和Y是两个随机变量，已知X的随机分布P(X),那么也就知道了X的熵。现在还知道Y和X的联合概率密度，以及在Y取不同值的前提下X的概率分布，即条件概率分布。定义在Y的条件下的条件熵为：

H(X) >= H(X丨Y)，也就是说多了Y的信息之后，关于X的不确定性下降了。在统计语言模型中，如果把Y看成是前一个字，那么在数学上就证明了二元模型的不确定性小于一元模型。同理，三元模型比二元好。（用条件熵解释了模型复杂度）

⭐信息的作用在于消除不确定性，NLP的大量问题就是寻找相关的信息。

3互信息

互信息（Mutual Information）:作为两个随机事件“相关性”的量化度量。

假定有两个随机事件X 和 Y ，它们的互信息定义如下：

4 延伸阅读：相对熵（交叉熵）

相对熵用来衡量两个取值为正数的函数的相似性，定义：

三个结论：

①对于两个完全相同的函数，它们的相对熵是零。

②相对熵越大，两个函数差异越大；反之，则相反。

③对于概率分布或者概率密度函数，如果取值均大于零，相对熵可以度量两个随机分布的差异性。

⭐相对熵是不对称的：

为了计算方便：将上面的不等式两边取平均，即

数学数学之美

松鼠的窝

0 关注 0 粉丝 0 动态

关注关注

机器学习中的数学意义

机器学习中的用于声称性能的指标标准很少被讨论。由于在这个问题上似乎没有一个明确的、广泛的共识，因此我认为提供我一直在倡导并尽可能遵循的标准可能会很有趣。它源于这个简单的前提，这是我的科学老师从中学开始就灌输给我的：。科学报告的一般规则是，您写下的每个数字都

xceman 2020-10-13

师生关系

我觉得我从小到大都很幸运，从小学到大学都遇见了很好的老师。她和其他老师相比是比较严厉的那种。如今已经步入大学校园，心智也逐渐成熟，对于老师一词的意义也有了更加深刻的理解。人的一生注定是要一辈子不断地去学习，去完善自己。正所谓，“”授人以鱼不如授人以渔“”。

算法与数学之美 2020-10-07

微软AI要参加IMO竞赛！小目标：数学金牌

今年，可能是最后一届“纯人类”参赛的IMO。这名潜入IMO赛事的AI名为Lean，由微软的研究人员开发。目前，他们正计划让Lean参与明年的国际奥数竞赛。也就是说，它将与世界各国的奥赛选手一起争夺IMO金牌。其实，微软研究人员让AI参加IMO的理由，原因是

Anscor 2020-10-05

学会Python后都能做什么？网友们的回答简直不要太厉害

如今，越来越多的人加入到学习Python的队伍当中。确实，Python早已不是程序员的专属技能，随着Python更多的可能性被挖掘出来，大家对Python的兴趣越来越浓，这也是近年来Python越来越火的原因。而在Python领域非常有研究的网友们，也在学

liwg0 2020-09-08

困扰数学家90年的猜想，被计算机搜索30分钟解决了

就连困扰人类90年的数学猜想也挡不住。来自斯坦福、CMU等高校的4名数学家，将一个数学难题转化成了对10亿个结果进行“暴力搜索”。凯勒猜想在不超过7维的空间上都是正确的。现在，任何人都可以去GitHub上克隆这串代码，验证这一数学定理。1992年，另外两位

数学爱好者 2020-08-31

使用GNU bc在Linux Shell中进行数学运算

在 shell 中使用 bc 更好地做算数，它是一种用于高级计算的数学语言。大多数POSIX系统带有GNU bc，这是一种任意精度的数字处理语言。它的语法类似于 C，但是它也支持交互式执行语句和处理来自标准输入的数据。因此，它通常是以下问题的答案：“我如何

thermodynamicB 2020-08-11

OpenGL 六 - 3D数学基础 - 向量、矩阵及OpenGL中的变换

夕加加 2020-07-20

参加数学建模大赛的计划

列出问题中涉及到的变量，包括适当的单位。注意不要混淆了变量和常量。检查单位从而保证你的假设有意义。用准确的数学表达式给出问题的目标。选择解决你的问题的一个一般的求解方法。一般地，这一步的成功需要经验、技巧和相对文献有一定的熟悉程度。将第一步中的得到的问题重

willowwgx 2020-07-18

一年级口算反思与总结

在一年级实际教学中，老师们都知道口算是一个重点，也是学生一项重要的教学能力考核。老师和家长常常简单把计算错误归结为粗心，以至于孩子出错也常常以粗心为借口。那么究竟是哪些原因导致了出错呢？所以针对孩子的错误类型，提出有效的纠正策略，帮助孩子避免和减少出错十分

kuoying 2020-07-16

中国AI技术领先，是因为数学好？美国杂志直指中美数学教育差距

美国 CS 专业超过 64% 博士生和近 70% 的硕士生是留学生，数学博士学位有一半授予了非美国公民，中国和印度学生占大部分。「知其然而不知所以然，他们仅仅擅长使用而不追求真理。」这名女生认为大多数亚洲人学习数学时注重运用却不关心原理推导，论据有一定的道

Anscor 2020-07-14

按成绩分班

根据输入的各科成绩分班。输入的是六门课成绩，比如：90,93,90,物理=89,化学=88,生物=91前三个值只固定对应语文、数学、英语三门课，所有不需要写课程名。后三门课要写上课程名，理科是物理、生物、化学；文科是政治、历史、地理，顺序可以不固定。eli

starletkiss 2020-07-08

数学公式

普通的方法就是For循环，循环次数为N,时间复杂度为O. 累加求和公式 sum = n(n+1)/2时间复杂度为O

willowwgx 2020-07-05

数学周测3讲解

然后在 \ 这方面的计算，只需要知道 \，把近似值背下来更好

算法与数学之美 2020-06-28

机器学习是否需要完整扎实的数学基础？

微积分、线性代数、概率与统计、矩阵和数值分析、优化方法线代，微积分，概率论，数理统计，一些算法思想的数学基础。这是基础，高等点做研究的，需要学习 random data，机器学习则偏向于概率统计，更多的是不确定性思维。机器学习把概率和图结合起来组成概率图模

kingzone 2020-06-27

机器学习背后的数学支柱，这5本书帮你搞定

机器学习从只适用于研发人员的工具变成了被广泛采纳使用的方法，多亏了开源机器学习和深度学习框架的爆炸性发展。现如今，机器学习领域比以往任何时候都更容易上手。同时，这也助力了我们目前所经历的科技的疯狂发展。弄清算法是如何真正工作的，可以帮助你在设计、开发和调试

xceman 2020-06-27

2020SDOI游记

T1：理清模型后发现数据有序维护起来会非常方便，就想到二叉搜索树。两种战士将合适温度“夹在中间”，就想到二分。正好前几天刚学了平衡树，就用它做了。但是很卡常，可惜没想到树状数组。考试前一天晚上被蚊子扰醒了4次，早上脑子也是很不好，写这一道题就用了3.5小时

算法与数学之美 2020-06-21

数学-高精度

之后，在比对转化的字符串的第一个字符是否为“0”，如果为0，则去掉它只保留小数点之后的数，利用substring，截取字符串。由于范围是10的100次方，因此我们设置大整数数组的长度为10000，足以包括。

kuoying 2020-06-21

入数据科学大坑，我需要什么样的数学水平？

作为一门基础性学科，数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算法的先决条件，也将帮助我们更深入透彻地了解算法的内在原理。所以，本文作者阐释了数据科学和机器学习为何离不开数学，并提供了统计学与概率论、多变量微积分、线性代数以及优

秒懂数学 2020-06-17

【经验】数学备考

不要一味的追求刷几遍，要清楚每遍刷题的目的。同时，这一阶段才是暴露薄弱点的一轮，错题一定要弄懂，弄透。

算法与数学之美 2020-06-17

P2788 数学1（math1）- 加减算式

using namespace std;int a;int sum=0;sum+=a;cout<<sum<<endl;return 0;

starletkiss 2020-06-13

安科网

《数学之美》——第六章个人笔记

松鼠的窝

第六章信息的度量和作用

1 信息熵

2信息的作用

3互信息

4 延伸阅读：相对熵（交叉熵）

松鼠的窝

相关推荐

机器学习中的数学意义

师生关系

微软AI要参加IMO竞赛！小目标：数学金牌

学会Python后都能做什么？网友们的回答简直不要太厉害

困扰数学家90年的猜想，被计算机搜索30分钟解决了

使用GNU bc在Linux Shell中进行数学运算

OpenGL 六 - 3D数学基础 - 向量、矩阵及OpenGL中的变换

参加数学建模大赛的计划

一年级口算反思与总结

中国AI技术领先，是因为数学好？美国杂志直指中美数学教育差距

按成绩分班

数学公式

数学周测3讲解

机器学习是否需要完整扎实的数学基础？

机器学习背后的数学支柱，这5本书帮你搞定

2020SDOI游记

数学-高精度

入数据科学大坑，我需要什么样的数学水平？

【经验】数学备考

P2788 数学1（math1）- 加减算式

松鼠的窝

《数学之美》——第六章 个人笔记

第六章 信息的度量和作用

1 信息熵

2信息的作用

3互信息

4 延伸阅读：相对熵（交叉熵）

相关推荐

《数学之美》——第六章个人笔记

第六章信息的度量和作用