数学家们发现了一个无解的计算机问题
近日,据外媒报道,数学家们发现了一个他们无法解决的,与机器学习有关的计算机问题。
这并不是说他们不够聪明,而是这个问题根本没有答案。
这个问题与机器学习有关。机器学习是一些计算机用来“学习”如何完成特定任务的人工智能模型的类型。
当Facebook或Google识别出一张你的照片,并建议你给自己贴上标签时,它就是在使用机器学习。当自动驾驶汽车在繁忙的十字路口行驶时,这就是机器学习。神经科学家用机器学习“读”某人的想法。机器学习的关键是基于数学。因此,数学家可以从理论上研究和理解它。他们可以写出关于机器学习是如何工作的绝对证据,并在每一种情况下都加以应用。
在这种情况下,一些数学家设计了一个机器学习问题,称为“估计最大值”或“EMX”。
要理解EMX是如何工作的,想象一下:你希望在网站上投放广告,并最大限度地让这些广告有更大目标观众数量。你有向体育迷、爱猫者、汽车迷和运动爱好者等宣传的广告,但你不知道谁会访问这个网站。你如何选择一组广告,最大限度地增加你的目标观众数量?EMX必须找出答案。
然后研究人员问了一个问题:EMX什么时候能解决一个问题?
在其他机器学习问题中,数学家通常可以根据他们拥有的数据集来判断学习问题是否能在给定的情况下得到解决。谷歌用来识别人脸的基本方法能应用于预测股市趋势吗?数学家不知道,但有人可能认为会。
问题是,数学有些失灵了。自从1931年逻辑学家Kurt Gdel发表了他著名的不完全性定理以来,它就被打破了。他们表明,在任何数学系统中,都有某些问题是无法解答的。不是真的很难,而是因为有些问题是不可知的。数学家们了解到,他们理解宇宙的能力从根本上说是有限的。Gdel和另一位数学家Paul Cohen找到了一个例子:连续统假说。
连续统假设是这样的:数学家已经知道有不同大小的无穷大的数。例如,有无穷多个整数(如1、2、3、4、5等);还有无穷多的实数(其中包括1、2、3等数字,但也包括1.8和5,222.7和pi这样的数字)。但是,即使有无穷多的整数和无穷多的实数,但显然有比整数更多的实数。这就引出了这样的问题:是否有比整数集更大但比实数集更小的无穷大?连续统假说认为,有。
Gdel和Cohen表明,不可能证明连续统假说是正确的,但也不可能证明它是错误的。“连续统假设是真的吗?”是一个没有答案的问题。
1月7日发表在《自然》在线期刊上一篇论文指出,EMX与连续体假说有着千丝万缕的联系。
结果表明,只有在连续统假设成立的情况下,EMX才能解决问题。这意味着,“EMX能够学会解决这个问题吗?”这个问题的答案和连续体假设本身一样不可知。
好消息是,连续统假设的解对大多数数学来说并不是很重要。同样,这种永久的神秘可能也不会对机器学习造成重大障碍。
“因为EMX是机器学习中的一个新模型,我们还不知道它在开发真实世界算法方面的用处,”伊利诺伊大学芝加哥分校的数学教授Lev Reyzin说。在《自然》在线期刊发表的一篇文章中,Reyzin写道:“所以这些结果可能没有实际意义。”