惊世骇俗?人工智能完虐柯洁前你要知道这些事儿
【出品 | 网易智能 策划/ 编译| 秉翰 】去年三月一个会下围棋的AlphaGo让人工智能火了,今年三月准备虐菜柯洁的AlphaGo增强版又会带来什么?笔者的标题可能起的有点穿越,但是柯洁就算最近闭关学会了新的独门绝技,也不可能赢的了AlphaGo。围棋人工智能的学习能力绝对超出人类几个数量级。随着时间的发展在围棋这个项目上,无论是柯洁还是谁,人类只能越来越被完虐。这是“新进化论”所带来的不可阻挡的“自然”规律。
比赛以后的柯洁还能这么自信吗?
然而,对于真正的人工智能来说,AlphaGo也只能是惊鸿一瞥,深度神经网络为人工智能带来的是惊喜,但并不是变革。百度等公司全力“发神经”对于他们商业上的成功也许并不能带来什么助益。吴恩达带着成千上万块GPU也许能为百度带来一些令人惊喜的人工智能产品,却难再现与莆田系印钞般的盈利能力。人工智能只是完成了从胎儿到婴儿的蜕变,降临世上却要经历无数艰险才能为人。
然而,笔者并不是要吐槽目前各大公司面对人工智能大上快干的“神经病”行为。而是深入浅出的分析让人工智能惊艳世人的神经网络技术,以及人工智能在现实商业层面所面临的实际难题。让大家观摩柯洁与AlphaGo比赛之前来个热身,科学客观的看待人机大战。
为什么神经网络火了?
神经网络这东西并不是新鲜事物,AlphaGo牛X之前,也只是人工智能各种算法的一个分支。神经网络中的很多算法已经存在很多年,并不是突然之间像魔术那样出现而不可思议。最近开始吸引焦点,主要是因为可用的计算能力(CPU、GPU、AI专用计算单元)的快速发展,让海量矩阵乘法运算更容易被测试、验证和迭代。
但是Deepmind对AI下围棋这块的神经网络优化确实让人惊艳,而且Deepmind言之凿凿同样的技术完全可以应用到其他领域。于是乎,不明真相的群众们真的以为明天人工智能就要过来取代人类。各大互联网公司也是顺势而为立即做起了人工智能生意。
笔者并不怀疑Deepmind神经网络算法的通用性,但是不同领域的训练数据获取之于现实面还是无法解决的难题。而且某些领域数据的复杂度,也许只有量子计算才能在人类寿命可接受的范围内结束训练。
神经网络更像是打开图灵难题的钥匙
神经网络有两大好处,一是利用相对长的应用前训练时间换取了应用中的处理实时性。而是用训练数据的处理复杂度换取了预设逻辑的处理复杂度。而且AlphaGo让人们开始相信,也许神经网络真的是解决完全图灵测试的钥匙。
就宏观的愿望来说,神经网络是期望通过模拟现实中的生物思维来直接实现人工思维。人工神经网络是对人脑完成特定任务或感兴趣功能的方法进行建模的自适应机器,是一个由简单处理元构成的规模宏大的并行分布式处理器。天然具有存储经验和使之可用的特性。神经网络在两个方面与人类相似:1、神经网络获取的知识是从外界环境中学习得来的;2、互连神经元的连接强度,即突触权值,用于储存获取的知识。
现实生活中有很多问题并不能用预设逻辑来解决。当问题不可预测,如在手写字体识别;亦或处理的问题很容易变更需求;处理的任务只需要一个满意解而不是精确解的时候,这些情况对于人脑的模糊逻辑处理来说不是问题,但对于计算机程序却是难题。而神经网络通过已有大量可参考的经验数据,或者该任务自身能够产生足够的经验数据来完成一个最优解。它不保证任务完成的100%正确,但可以像人脑一样给出一个经验最优解。从模仿人类思维的角度来说,人工智能可能是所有机器学习算法通用性最高的一种,也是达阵图灵测试的最有可能途径。
神经网络解决一切? 那是在发神经
但是很多情况神经网络并不是人工智能的最优解决方案。什么问题都拿神经网络来套那是神经病。这里可以举个例子-基本的数字识别。
不管是神经网络还是基本的决策树,亦或是向量机,最根本的算法选择原则还是能够解决问题。很多产品处理都使用了热门的递归神经网络算法,但是如果能用简单的预设逻辑,贝叶斯算法以及向量机等可以达到很好的效果,也没有必要本末倒置。深度神经网络很可能成为未来解决人工智能问题的通用算法,但是神经网络所需要的大量数据制备整理也是旷日费时。神经网络相较于其他机器学习算法更像是用应用前的大量数据净化时间和训练时间来换取使用时的快速计算。
各种算法的性能比较,神经网络并不是最优解。数据来源:(人工智能,Stuart-Russel)
这里罗列些常用的机器学习算法,由于过于枯燥不做具体展开。以间隔理论分布为基础:聚类分析和模式识别,人工神经网络,决策树,感知器,支持向量机,集成学习AdaBoost,降维与度量学习,聚类,贝叶斯分类器。
以构造条件概率为基础:回归分析和统计分类,高斯过程回归,线性判别分析,最近邻居法,径向基函数核。
以概率图模型为基础:包括贝叶斯网和Markov随机场
近似推断技术:马尔可夫链,蒙特卡罗方法(AlphaGo也用到该算法),变分法。
为何人工智能科学家提出了如此之多的方法?其实答案很简单,没有任何一种方法可以在任何场景中达到最优解。神经网络火了,并不意味着未来人工智能就完全走向单一方向。神经网络配以其他方法辅助可能是更明智的选择。
人工智能的变现难题
吴恩达2014年被百度招徕至麾下,百度开始了人工智能时代。你可以说百度一直在模仿谷歌,但是在人工智能这件事上,百度真的是挖来了谷歌大脑的核心人物。吴恩达在百度的3年时间里发表了近20篇论文,每项成果要么融入百度的已有产品线,要么依据成果成立一家初创公司。从吴恩达回到百度第一个开发的医疗问诊机器人到最近推出的语音识别开发平台的唤醒二期产品,百度在人工智能领域的进步有目共睹,虽然没有Deepmind般惊世骇俗,但也成为业界执牛耳者。
如今借着AlphaGo的东风,各种人工智能公司如雨后春笋般出现。不仅各种大数据公司摇身一变成为AI先锋,就连依靠数据挖掘的媒体公司今日头条也对外宣称自己是一家人工智能公司。从外面看人工智能好似一座宝岛,万人争过独木桥只为在岛上掘出什么宝贝来。但是横亘在所有人工智能公司面前的最大问题就是如何变现。回到现实层面,这座岛上既没有金子,也没有银子,看起来连块像样的石头都没有。
就拿百度举个例子,吴恩达算是人工智能届图片识别领域的权威,然而恩达同志从未有过将产品商业化的成功案例。斯坦福做教授时靠学校养着,谷歌大脑期间当然由广告商养着,从来没有任何变现压力。来到百度之后,当然产品化节奏有所加快,但也只能是被养着的节奏。比如2015年就已经推出的百度问诊机器人,推广上遇到的问题还不算是问题,本来靠着百度那一套问诊和卖药的逻辑应该有着不错的前景,但是去年的魏则西事件基本将百度靠医疗暴力变现的逻辑彻底粉碎。于是,医疗事业部变成百度医疗大脑,问诊机器人产品也只能成为鸡肋。当然,百度的一些语音产品在技术层面还是有着很好的toB前景的,但这种前景相比百度的体量和对人工智能的付出,前景也不可能变成钱景。
开复同志说的好,AI创业的核心是人工智能科学家,但还要有一群懂变现的人围在旁边。这个事本身很困难,因为要把两群完全不同思维,而且成天价值观不一样每天打架的人放在一起。目前至少国内的风格是喜欢挖各种名校教授,有的基本不会编程,论文代码都是下面学生实现的。本来人工智能变现就难,你还弄了一群不行就回学校教书的人那变现就好似天方夜谈。
人工智能的到来不可阻挡,资本的进入更会加快人工智能落地的进程。但是,大风吹起,想要落地就不是那么容易。人工智能的曙光就在不远处,但是前路漫漫,黑暗无穷无尽。怎么破?回去敲代码,做优化,一切还是产品说话。