人工智能热潮为何姗姗来迟?

点击上方关注,All in AI中国

人工智能热潮为何姗姗来迟?

20世纪50年代,约翰·麦卡锡和马文·明斯基一起创立了人工智能这个词。同样在1958年,Frank Rosenblatt建立了一个原型神经元网络,他称之为感知器(Perceptron)。此外,深度学习计算机视觉神经网络的关键思想在1989年就已为人所知;同样,LSTM等时间序列的深度学习的基本算法已经在1997年开发出来,给出了一些例子。那么,为什么现在才出现这个人工智能热潮呢?

毫无疑问,可用的计算一直是主要的触发器,然而,其他因素也有助于释放人工智能和相关技术的潜力。接下来,我们将讨论影响它的最重要的一些因素。

数据是人工智能的燃料

人工智能热潮为何姗姗来迟?

人工智能需要大量的数据集来训练其模型,但幸运的是,由于成本的大幅降低和数据生成的可靠性的提高,数据的创建和可用性呈指数级增长。近年来由于存储硬件的改进,加上NoSQL [8]数据库管理技术的惊人进步,使得我们拥有庞大的数据集来训练人工智能模型。

除了最近互联网的出现带来的数据可用性的增加之外,专业数据资源催生了该地区的进步。许多开放式数据库很支持人工智能算法的快速发展。一个例子是ImageNet [9]数据库,它可以免费获得超过1000万张手工标记的图像。但ImageNet的特殊之处并不在于它的规模,而是每年都伴随着它在进行的竞争,这是一种激励研究人员和工程师的绝佳方式。

虽然在早期这些提案基于传统的计算机视觉算法,但在2012年,Alex Krizhevsky使用了一种深度学习神经网络,现在称为AlexNet,它将错误率降低到比前一版本的胜利者少一半。早在2015年,获胜算法已经与人类能力相媲美,而今天的深度学习算法远远超过了那些拥有人类的算法在这场竞争中的错误率。

但ImageNet只是最近用于训练深度学习网络的可用数据库之一;许多其他的都很受欢迎,例如:MNIST [10]、STL [11]、COCO [12]、Open Images [13]、 Visual Question Answering [14]、SVHN [15]、CIFAR-10/100 [16] Fashion-MNIST [17]、IMDB Reviews[18]、Twenty Newsgroups [19]、Reuters-21578 [20]、WordNet [21]、Yelp Reviews22]、Wikipedia Corpus [23]、Blog Authorship Corpus [24]、Machine Translation of European Languages[25]、Free Spoken Digit Dataset[26]、Free Music Archive[27]、Ballroom[28]、The Million Song[29]、LibriSpeech [30]、VoxCeleb [31]、The Boston Housing[32]、Pascal [33]CVPPP Plant Leaf Segmentation[34]、Cityscapes [35]。

当然在这里不得不提Kaggle [36]也很重要,这是一个数据分析竞赛的平台,公司和研究人员在这些竞争中贡献和分享他们的数据,同时来自世界各地的数据工程师也在竞相创建最佳的预测或分类模型。

进入计算民主化时代

人工智能热潮为何姗姗来迟?

但是,如果您的公司没有这种计算能力,会发生什么?到目前为止,人工智能主要是亚马逊、百度、谷歌或微软等大型科技公司的“玩具”,以及一些拥有这些功能的初创公司。对于许多其他业务和经济部分而言,人工智能系统迄今为止都过于昂贵且难以完全实现所需的硬件和软件。

但现在我们正在进入计算民主化的另一个时代,公司可以使用超过28,000平方米的大型数据处理中心(巴塞罗那足球俱乐部(巴萨)的四倍),里面有数十万台服务器。我们接下来谈谈云计算[37]。

云计算通过计算的民主化彻底改变了行业,并彻底改变了业务运营方式。现在是时候改变人工智能和深度学习的场景,这将为无法构建这种基础架构的中小型企业提供一个很好的机会,尽管云计算可以提供给他们;事实上,它提供了以前只有大型组织或政府才能使用的计算能力。

此外,云提供商现在提供所谓的人工智能算法即服务(AI-as-a-Service),通过云实现的人工智能服务,可以通过基于API的简单协议与公司的内部应用程序协同工作REST [38]。

这意味着几乎每个人都可以使用它,因为它是一项仅按使用时间付费的服务。这是具有破坏性的,因为现在它允许软件开发人员在瞬间使用并将几乎任何人工智能算法投入到生产中。

亚马逊、微软、谷歌和IBM正在引领这股AIaaS服务浪潮,从最初的阶段(培训)就迅速投入生产。在撰写本书时,Amazon AIaaS分为两个层次:亚马逊机器学习[39]的预测分析和快速模型构建和部署的SageMaker [40]工具。 Microsoft通过其Azure机器学习提供其服务,该机器学习分为两大类:Azure机器学习工作室[41]和Azure智能库[42]。 Google提供了Prediction API [43]和Google ML Engine [44]。 IBM通过其Watson Analytics [45]提供AIaaS服务。但是我们也不要忘记一些来自初创公司的解决方案,如PredicSis [46]或BigML [47]。

毫无疑问,人工智能将引领下一场革命。它的成功在很大程度上取决于公司的创造力,而不是硬件技术,当然还有部分原因要归功于云计算。

深度学习社区的开源世界

人工智能热潮为何姗姗来迟?

深度学习框架

几年前,深度学习是需要使用C ++和CUDA等语言的经验;如今,只要你有基本的Python技能就足够了。这要归功于大量开源软件框架的出现,例如Keras,是我们这本书的核心部分。这些框架极大地促进了模型的创建和训练,并允许将算法设计者的硬件特性抽象出来,以加速训练过程。目前最受欢迎的是TensorFlow、Keras和PyTorch。

特别是,TensorFlow最近采取了很多措施,无疑它是主导者之一。它最初是由谷歌Google Brain小组的研究人员和工程师开发的。该系统旨在促进机器学习研究,并更快地从研究原型过渡到生产系统。如果我们查看项目的Gihub页面[49],我们将会看到他们在撰写本书时有超过35,000个提交,超过1500个贡献者。

TensorFlow之后是Keras [50],这是一个用于神经网络的高级API,这使其成为开始这一主题的完美环境。代码在Python中指定,目前它可以在三个出色的环境中运行:TensorFlow、CNTK或Theano。 Keras拥有超过4500个提交,超过700个贡献者和超过30,000个stars[51]。

PyTorch和Torch [52]是用C语言实现的两个机器学习环境,使用OpenMP [53]和CUDA来利用高度并行的基础设施。 PyTorch是深度学习最受关注的版本,基于Python开发,由Facebook开发。它是该研究领域中的一种流行环境,因为它在神经网络的构建中具有很大的灵活性,并且具有TensorFlow等。在撰写本书时,Pytorch有超过12,000个提交,大约650个贡献者和超过17,000个stars[54]。

最后,虽然它不是深度学习的专属环境,但重要的是要提到Scikit-learn [55],它在深度学习社区中经常用于数据的预处理[56]。 Scikit-learn有超过22500个提交,超过1000个贡献者和近30,000个stars[57]。

但是,正如我们已经提出的那样,还有许多面向深度学习的框架。我们要强调的是Theano [58](蒙特利尔学习算法研究所),Caffe [59](University de Berkeley),Caffe2 [60](Facebook Research),CNTK [61](Microsoft),MXNET [62](由亚马逊等人支持),Deeplearning4j [63],Chainer [64],DIGITS [65](Nvidia),Kaldi [66],Lasagne [67],Leaf [68],MatConvNet [69],OpenDeep [70], Minerva [71]和SoooA [72]等等。

一个公开刊物的伦理

人工智能热潮为何姗姗来迟?

资料来源:ArXiv.org

在过去的几年里,在这一领域的研究,与其他科学领域相比,开放的文化出版已经生成,许多研究人员立即发表他们的研究成果(没有等待同行审查批准,通常在会议)在康奈尔大学的数据库如arxiv.org(arXiv)[73]。这意味着有很多软件可以开源,这使得这一领域的研究将非常迅速的开展,因为任何新发现都会立即让整个社区看到。

对于使用这些技术的用户来说,这是一个很好的机会。研究小组公开发表最新研究成果的原因多种多样。例如,在该领域的主要会议上被拒绝的文章只能作为arxiv的预印本传播。这是由G. Hinton, N. Srivastava, A. Krizhevsky, I. Sutskever和R. Salakhutdinov所写的一篇关于深度学习进展的关键论文,该论文引入了Dropout 机制[74]。这篇论文在2012年被NIPS拒绝[75]。

算法的进步

谷歌在发布结果时,巩固了其在业内领先的声誉,吸引了下一波人才,这是该主题推进的主要障碍之一。由于硬件的改进,我们已经提出和有更多的计算能力的科学家在该地区研究,它已经可以大大推进设计的新算法可以克服重要限制发现在前面的算法。例如,直到许多年前,从算法的角度训练多层网络还是非常困难的。但在过去的十年里,随着激活功能的改进、预训练网络的使用、训练优化算法的改进等方面的进步,我们取得了令人印象深刻的进步。

人工智能热潮为何姗姗来迟?

来源:https://arxiv.org/pdf/1712.00617.pdf


资源:

[7] 本节中的数据可以在2018年初撰写本节(该书的西班牙文版本)时获得。

[8] Wikipedia, NoSQL. [online]. Available at: https://es.wikipedia.org/wiki/NoSQL [Accessed: 15/04/2018]

[9] ImageNet的大规模视觉识别挑战 (ILSVRC). [online]. Available at: www.image-net.org/challenges/LSVRC. [Accessed: 12/03/2018]

[10] MNIST [online]. Available at: http://yann.lecun.com/exdb/mnist/[Accessed: 12/03/2018]

[11] STL [online]. Available at: http://ai.stanford.edu/~acoates/stl10/[Accessed: 12/03/2018]

[12] See http://ccodataset.org

[13] See http://github.com/openimages/dataset

[14] See http://www.visualqa.org

[15] See http://ufldl.stanford.edu/housenumbers

[16] See http://www.cs.toronto.edu/~kriz/cifar.htmt

[17] See https://github.com/zalandoresearch/fashion-mnist

[18] See http://ai.stanford.edu/~amaas/data/sentiment

[19] See https://archive.ics.uci.edu/ml/datasets/Twenty+Newsgroups

[20] See https://archive.ics.uci.edu/ml/datasets/reuters-21578+text+categorization+collection

[21] See https://wordnet.princeton.edu

[22] See https://www.yelp.com/dataset

[23] See https://corpus.byu.edu/wiki

[24] See http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm

[25] See http://statmt.org/wmt11/translation-task.html

[26] See https://github.com/Jakobovski/free-spoken-digit-dataset

[27] See https://github.com/mdeff/fma

[28] See http://mtg.upf.edu/ismir2004/contest/tempoContest/node5.html

[29] See https://labrosa.ee.columbia.edu/millionsong

[30] See http://www.openslr.org/12

[31] See http://www.robots.ox.ac.uk/~vgg/data/voxceleb

[32] See https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.names

[33] See http://host.robots.ox.ac.uk/pascal/VOC/

[34] See https://www.plant-phenotyping.org/CVPPP2017

[35] See https://www.cityscapes-dataset.com

[36] Kaggle [online]. Available at: ttp://www.kaggle.com [Accessed: 12/03/2018]

[37]云计算企业:云计算的优势和挑战。编辑书籍,2011年。

[38] Wikipedia. REST. [online]. Available at: https://en.wikipedia.org/wiki/Representational_state_transfer [Accessed: 12/03/2018]

[39] Amazon ML [online]. Available at: https://aws.amazon.com/aml/[Accessed: 12/03/2018]

[40] SageMaker [online]. Available at: https://aws.amazon.com/sagemaker/[Accessed: 12/03/2018]

[41] Azure ML Studio [online]. Available at: https://azure.microsoft.com/en-us/services/machine-learning-studio/ [Accessed: 12/03/2018]

[42] Azure Intelligent Gallery [online]. Available at: https://gallery.azure.ai[Accessed: 12/03/2018]

[43] Google Prediction API [online]. Available at: https://cloud.google.com/prediction/docs/ [Accessed: 12/03/2018]

[44] Google ML engine [online]. Available at: https://cloud.google.com/ml-engine/docs/technical-overview [Accessed: 12/03/2018]

[45] Watson Analytics [online]. Available at: https://www.ibm.com/watson/[Accessed: 12/03/2018]

[46] PredicSis [online]. Available at: https://predicsis.ai [Accessed: 12/03/2018]

[47] BigML [online]. Available at: https://bigml.com [Accessed: 12/03/2018]

[48] See https://www.kdnuggets.com/2018/02/top-20-python-ai-machine-learning-open-source-projects.html

[49] See https://github.com/tensorflow/tensorflow

[50] See https://keras.io

[51] See https://github.com/keras-team/keras

[52] See http://pytorch.org

[53] See http://www.openmp.org

[54] See https://github.com/pytorch/pytorch

[55] See http://scikit-learn.org

[56] See http://scikit-learn.org/stable/modules/preprocessing.html

[57] See https://github.com/scikit-learn/scikit-learn

[58] See http://deeplearning.net/software/theano

[59] See http://caffe.berkeleyvision.org

[60] See https://caffe2.ai

[61] See https://github.com/Microsoft/CNTK

[62] See https://mxnet.apache.org

[63] See https://deeplearning4j.org

[64] See https://chainer.org

[65] See https://developer.nvidia.com/digits

[66] See http://kaldi-asr.org/doc/dnn.html

[67] See https://lasagne.readthedocs.io/en/latest/

[68] See https://github.com/autumnai/leaf

[69] See http://www.vlfeat.org/matconvnet/

[70] See http://www.opendeep.org

[71] See https://github.com/dmlc/minerva

[72] See https://github.com/laonbud/SoooA/

[73] See https://arxiv.org

[74]https://arxiv.org/pdf/1207.0580.pdf

[75] See https://twitter.com/ChrisFiloG/status/1009594246414790657

人工智能热潮为何姗姗来迟?

相关推荐