微软AI要参加IMO竞赛！小目标：数学金牌

Anscor

2020-10-05

关注关注

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

今年，可能是最后一届“纯人类”参赛的IMO （国际奥数竞赛）。

因为在明年，AI可能也会加入这场金牌争夺战中，成为一名“种子选手”。

这名潜入IMO赛事的AI名为Lean，由微软的研究人员开发。

目前，他们正计划让Lean参与明年的国际奥数竞赛。

也就是说，它将与世界各国的奥赛选手一起争夺IMO金牌。

准备在IMO上一展身手的Lean

其实，微软研究人员让AI参加IMO的理由，原因是它是个很好的实验工具（工具人）。

微软研究员Selsam是挑战赛IMO Grand Challenge的创始人之一，他表示，这项比赛的目的是训练一个人工智能系统，以便在世界顶级数学竞赛中赢得金牌。

因为这里不仅有数学上“最简单”的难题（连高等数学都用不上，但就是做不出来），而且还汇集了来自世界各地的顶尖高手。

如果AI能像人一样证明这些数学定理，某种程度上也能说明，让它“像人一样思考”不会太过困难。

基于这个想法，微软的研究人员从2013年开始研发Lean，希望让AI能拥有自主判断、根据假设进行演绎的能力。

也就是说，它是个旨在缩小交互式定理证明、与自动定理证明之间的差距的开源项目。

自动定理证明：对数学中提出的定理或猜想，寻找一种证明或反证的方法。系统不仅能根据假设进行演绎，还要有一定的判定技巧。
交互式定理证明：借助计算机辅助证明工具，理解检验数学定理正确性，完成数学定理的证明。

Lean已经推出了3个版本，现在的第四个版本Lean 4还在完善中，现在的逻辑系统基于依赖类型理论，已经强大到足以证明所有的常规数学定理。

也就是说，想要让它自己证明IMO中提出来的、此前“没见过的”数学问题，依旧非常困难。

目前，Lean 4还没有彻底做好准备，作者Leonardo de Moura表示，如果让它参加今年的IMO，“可能只能得0分”。

因为，Lean目前甚至无法理解某些数学问题需要涉及哪些概念，而这些概念本身又是“什么意思”。

证明的“第一步”，就难住了算法

对于不少人来说，数学十分抽象、难以学好。

事实上，AI和你的感觉一样。

一般的工程应用问题中，AI得心应手，因为在预训练阶段，算法模型已经对一类问题有所了解。

也就是说，AI现阶段能干的活仍然有限，通常要给定条件和数据，经过持续的“刷题”，才能做“更复杂的计算”。

这是一个从“1”到“2”、“3”，甚至是无穷的过程。

但数学问题的证明本质并不一样，证明一个公理，或是一个复杂的等式，需要完全“白手起家”。

证明的第一步：提出一个合理证明路径。这个从0到1的关键，目前只有人类的大脑能胜任。

绝大部分AI，很难给出证明思路的第一步。

拿一个最简单最古老的数学公理来说，公元前300年，欧几里得就证明了质数有无限多个。

而要证明这一结论，关键是要认识到，总是可以通过乘所有已知的质数并加1来找到一个新的质数。有了这个思路，接下来的证明就很简单了。

但“想到这个思路”这一行为本身，对于AI来说，难度巨大。

说回IMO，正式比赛中的3道题目，尽管不涉及微积分等高等数学，但无一不是要求选手利用中学的所有数学知识，进行巧妙的构思给出解题方法。

比如这道2005年IMO真题：

当时不同国家的参赛选手至少给出了3种不同的证明，其中被广泛认可讨论的解法，采用柯西不等式简化的思路，篇幅大概需要半页A4纸。

而另一位来自摩尔多瓦的选手，极富创造性的用两行式子完成了证明：

上面一行是“因为”，下面一行就是“所以”，其简洁、精准甚至可以说“粗暴有效”震惊全场。

精巧的思路也获得了当年的IMO特别奖。

要说明的是，IMO特别奖不看总成绩，只颁给解题方法独到的选手。

这种石破天惊的“第一步”，对于现在的AI来说，几乎是不可能做到的。

这也许就是为什么微软的研究人员设定的目标是“冲击金奖”吧。

巧的玩不转，Lean采取什么方法跟人类大脑竞争呢？

Lean如何学数学？

Lean和所有AI算法一样，需要“喂数据”进行训练。

目前的Lean，不但无法设计出完整的IMO题目证明过程，它甚至无法理解其中一些问题所涉及的概念。

所以，Lean的首要任务是学习更多的数学知识。

训练数据来自Mathlib的库。Mathlib是一个数学基础数据库，它几乎包含了大学二年级以下所有数学知识。

但Mathlib在中学数学上仍有一些差距，团队正在对Mathlib数据库进行补全。

掌握知识只是第一步，如何灵活运用才是关键。

团队采取的方法与象棋、围棋AI等相同——遵循决策树，直到算法找到最优解。

许多IMO题目的关键是寻找某种证明的模式。深入数学证明的底层，是一系列非常具体的、有逻辑的步骤。

研究人员尝试通过IMO题目证明的全部细节来训练Lean。

但在这种方法也有局限，每个特定的题目证明对于算法来说太“专”，下一个不同类型题目仍然不会解。

为了解决这个问题，团队需要数学家写出之前IMO题目的详细形式化证明。然后，团队提炼证明中的采用的不同策略。

接下来，Lean的任务，就是在这些策略中寻找一个 “胜利 “的组合。

这项任务实际上比描述起来困难的多，团队这样比喻它：

在围棋中，目标是找到最好的一步棋。而在数学中，目标是找到最好的一盘棋，然后在这盘棋中找到最好的一步棋。

团队说，也许到了明年，获得金牌仍然是很困难的，但至少，Lean有机会参赛了。

对此，有网友感叹AI这些年神速的进展：先是国际象棋、又是围棋……现在，AI又要来攻占国际奥赛金牌了。

但也有网友持悲观态度，认为AI现阶段只能在某些方面趋近人类的水平。

目前AI的算法，都是建立在人类认知基础上的……所以像（证明数学定理）这样特殊的任务，我持消极态度，毕竟世界上只有少部分人能提供帮助。

“什么是数学思想？”

这个问题出乎意料的难以解释透彻。数学家在尝试解决新问题时，大脑的活动是难以描述的，更不要说落实在算法上。

尽管已经有AI团队朝数学思想的深层迈出了一步，但是从他们采取的策略来看，仍然是学习过往思路，选择成功率最高的“排列组合”。

这样的AI算法，要在创造力和突破性上超越人类，“火候”还差得远。

而隔壁的GPT，也在数学证明方向上取得了初步成果。

最近，OpenAI推出了用于数学问题的GPT-f，利用基于Transformer语言模型的生成能力进行自动定理证明。

由GPT-f发现的23个简短证明已被Metamath主库接收，这也是首次AI的数学证明获得业内认可。

GPT真的是要砸所有人的饭碗，连数学家都不放过。

那么，Lean和GPT-f，你更看好哪一个呢？

数学 imo

Anscor

0 关注 0 粉丝 0 动态

关注关注

机器学习中的数学意义

机器学习中的用于声称性能的指标标准很少被讨论。由于在这个问题上似乎没有一个明确的、广泛的共识，因此我认为提供我一直在倡导并尽可能遵循的标准可能会很有趣。它源于这个简单的前提，这是我的科学老师从中学开始就灌输给我的：。科学报告的一般规则是，您写下的每个数字都

xceman 2020-10-13

师生关系

我觉得我从小到大都很幸运，从小学到大学都遇见了很好的老师。她和其他老师相比是比较严厉的那种。如今已经步入大学校园，心智也逐渐成熟，对于老师一词的意义也有了更加深刻的理解。人的一生注定是要一辈子不断地去学习，去完善自己。正所谓，“”授人以鱼不如授人以渔“”。

算法与数学之美 2020-10-07

学会Python后都能做什么？网友们的回答简直不要太厉害

如今，越来越多的人加入到学习Python的队伍当中。确实，Python早已不是程序员的专属技能，随着Python更多的可能性被挖掘出来，大家对Python的兴趣越来越浓，这也是近年来Python越来越火的原因。而在Python领域非常有研究的网友们，也在学

liwg0 2020-09-08

困扰数学家90年的猜想，被计算机搜索30分钟解决了

就连困扰人类90年的数学猜想也挡不住。来自斯坦福、CMU等高校的4名数学家，将一个数学难题转化成了对10亿个结果进行“暴力搜索”。凯勒猜想在不超过7维的空间上都是正确的。现在，任何人都可以去GitHub上克隆这串代码，验证这一数学定理。1992年，另外两位

数学爱好者 2020-08-31

使用GNU bc在Linux Shell中进行数学运算

在 shell 中使用 bc 更好地做算数，它是一种用于高级计算的数学语言。大多数POSIX系统带有GNU bc，这是一种任意精度的数字处理语言。它的语法类似于 C，但是它也支持交互式执行语句和处理来自标准输入的数据。因此，它通常是以下问题的答案：“我如何

thermodynamicB 2020-08-11

OpenGL 六 - 3D数学基础 - 向量、矩阵及OpenGL中的变换

夕加加 2020-07-20

参加数学建模大赛的计划

列出问题中涉及到的变量，包括适当的单位。注意不要混淆了变量和常量。检查单位从而保证你的假设有意义。用准确的数学表达式给出问题的目标。选择解决你的问题的一个一般的求解方法。一般地，这一步的成功需要经验、技巧和相对文献有一定的熟悉程度。将第一步中的得到的问题重

willowwgx 2020-07-18

一年级口算反思与总结

在一年级实际教学中，老师们都知道口算是一个重点，也是学生一项重要的教学能力考核。老师和家长常常简单把计算错误归结为粗心，以至于孩子出错也常常以粗心为借口。那么究竟是哪些原因导致了出错呢？所以针对孩子的错误类型，提出有效的纠正策略，帮助孩子避免和减少出错十分

kuoying 2020-07-16

中国AI技术领先，是因为数学好？美国杂志直指中美数学教育差距

美国 CS 专业超过 64% 博士生和近 70% 的硕士生是留学生，数学博士学位有一半授予了非美国公民，中国和印度学生占大部分。「知其然而不知所以然，他们仅仅擅长使用而不追求真理。」这名女生认为大多数亚洲人学习数学时注重运用却不关心原理推导，论据有一定的道

Anscor 2020-07-14

按成绩分班

根据输入的各科成绩分班。输入的是六门课成绩，比如：90,93,90,物理=89,化学=88,生物=91前三个值只固定对应语文、数学、英语三门课，所有不需要写课程名。后三门课要写上课程名，理科是物理、生物、化学；文科是政治、历史、地理，顺序可以不固定。eli

starletkiss 2020-07-08

数学公式

普通的方法就是For循环，循环次数为N,时间复杂度为O. 累加求和公式 sum = n(n+1)/2时间复杂度为O

willowwgx 2020-07-05

数学周测3讲解

然后在 \ 这方面的计算，只需要知道 \，把近似值背下来更好

算法与数学之美 2020-06-28

机器学习是否需要完整扎实的数学基础？

微积分、线性代数、概率与统计、矩阵和数值分析、优化方法线代，微积分，概率论，数理统计，一些算法思想的数学基础。这是基础，高等点做研究的，需要学习 random data，机器学习则偏向于概率统计，更多的是不确定性思维。机器学习把概率和图结合起来组成概率图模

kingzone 2020-06-27

机器学习背后的数学支柱，这5本书帮你搞定

机器学习从只适用于研发人员的工具变成了被广泛采纳使用的方法，多亏了开源机器学习和深度学习框架的爆炸性发展。现如今，机器学习领域比以往任何时候都更容易上手。同时，这也助力了我们目前所经历的科技的疯狂发展。弄清算法是如何真正工作的，可以帮助你在设计、开发和调试

xceman 2020-06-27

2020SDOI游记

T1：理清模型后发现数据有序维护起来会非常方便，就想到二叉搜索树。两种战士将合适温度“夹在中间”，就想到二分。正好前几天刚学了平衡树，就用它做了。但是很卡常，可惜没想到树状数组。考试前一天晚上被蚊子扰醒了4次，早上脑子也是很不好，写这一道题就用了3.5小时

算法与数学之美 2020-06-21

数学-高精度

之后，在比对转化的字符串的第一个字符是否为“0”，如果为0，则去掉它只保留小数点之后的数，利用substring，截取字符串。由于范围是10的100次方，因此我们设置大整数数组的长度为10000，足以包括。

kuoying 2020-06-21

入数据科学大坑，我需要什么样的数学水平？

作为一门基础性学科，数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算法的先决条件，也将帮助我们更深入透彻地了解算法的内在原理。所以，本文作者阐释了数据科学和机器学习为何离不开数学，并提供了统计学与概率论、多变量微积分、线性代数以及优

秒懂数学 2020-06-17

【经验】数学备考

不要一味的追求刷几遍，要清楚每遍刷题的目的。同时，这一阶段才是暴露薄弱点的一轮，错题一定要弄懂，弄透。

算法与数学之美 2020-06-17

P2788 数学1（math1）- 加减算式

using namespace std;int a;int sum=0;sum+=a;cout<<sum<<endl;return 0;

starletkiss 2020-06-13

OI学习过程记录

然后，莫名奇妙1膜考了全校前二 + thuwc拿了省队一本。<1> 学会了一些更高级的算法/数据结构，比如后缀自动机、多项式求逆/取模/求exp等。<2> 几乎每天打模拟赛，且比赛难度从NOIP到NOI逐渐加大。<5>

SJCHEN 2020-06-12

安科网

微软AI要参加IMO竞赛！小目标：数学金牌

Anscor

准备在IMO上一展身手的Lean

证明的“第一步”，就难住了算法

Lean如何学数学？

“什么是数学思想？”

Anscor

相关推荐

机器学习中的数学意义

师生关系

学会Python后都能做什么？网友们的回答简直不要太厉害

困扰数学家90年的猜想，被计算机搜索30分钟解决了

使用GNU bc在Linux Shell中进行数学运算

OpenGL 六 - 3D数学基础 - 向量、矩阵及OpenGL中的变换

参加数学建模大赛的计划

一年级口算反思与总结

中国AI技术领先，是因为数学好？美国杂志直指中美数学教育差距

按成绩分班

数学公式

数学周测3讲解

机器学习是否需要完整扎实的数学基础？

机器学习背后的数学支柱，这5本书帮你搞定

2020SDOI游记

数学-高精度

入数据科学大坑，我需要什么样的数学水平？

【经验】数学备考

P2788 数学1（math1）- 加减算式

OI学习过程记录

Anscor