10大热门人工智能开源工具（框架）

chenyuan

2018-06-16

摘要： 本文讲了10个热门的人工智能开源工具/框架。

下面是我们今天要讲的10个热门的人工智能开源工具/框架。

1.TensorFlow

10大热门人工智能开源工具（框架）

TensorFlow™是一个开源软件库，最初由Google Brain Team的研究人员和工程师开发。TensorFlow使用数据流图进行数值计算。图中的节点表示数学运算，边表示它们之间通信的多维数据数组（张量）。其架构灵活，你可以使用单个API将计算部署到桌面、服务器或移动设备中的一个或多个CPU或GPU。

TensorFlow提供了多种API。最低级别的API——TensorFlow Core——提供了完整的编程控制。高级API则建立在TensorFlow Core的顶部。这些更高级别的API通常比TensorFlow Core更容易学习和使用。此外，更高级别的API使得重复性的任务在不同的用户之间变得更容易、更一致。一个高级API就像tf.estimator，可以帮助您管理数据集、评估器、训练和推理。

TensorFlow中的数据中心单位是张量。一个张量由一组形成任意数量维数组的原始值组成。张量的阶就是它的维数。

一些使用Tensorflow的Google应用有：

1.RankBrain：在www.google.com上大规模部署用于搜索排名的深度神经网络。

2.Inception图像分类模型：基准模型和对高度精确的计算机视觉模型的后续研究，它是在获得2014年Imagenet图像分类挑战赛的模型基础之上进行构建的。

3.SmartReply:可自动生成电子邮件响应的Deep LSTM模型。

4.Massively Multitask Networks for Drug Discovery：Google与斯坦福大学合作的识别有效候选药的的深度神经网络模型。

5.用于OCR的设备级计算机视觉：基于设备级的计算机视觉模型实现光学字符识别，进行实时翻译。

2.Apache SystemML

利用大数据进行机器学习的最佳开源工具。

10大热门人工智能开源工具（框架）

SystemML是由IBM创建的机器学习技术，是Apache中的顶级项目之一，它是一个灵活、可扩展的机器学习系统。SystemML的重要特点如下：

1.使用类R和类Python语言定制算法。

2.有多种执行模式，包括Spark MLContext、Spark Batch、Hadoop Batch、Standalone和JMLC(Java机器学习连接器)。

3.基于数据和聚类特性的自动优化，保证了算法的高效率和可扩展性。

4.将SystemML视为机器学习的结构化查询语言SQL。SystemML的最新版本（1.0.0）支持：Java 8+、Scala 2.11+、Python 2.7/3.5+、Hadoop 2.6+以及Spark 2.1+。

5.可在Apache Spark上运行，在Apache Spark上，SystemML通过逐行查看代码，确保代码是否能够在Apache Spark聚类上运行。

未来对SystemML的开发将包括：使用GPU进行额外的深度学习，例如导入和运行神经网络架构以及用于训练的预训练模型。

SystemML的Java机器学习连接器(JMLC)

Java机器学习连接器（JMLC）API是一种编程接口，它在嵌入式时与SystemML进行交互。JMLC的主要目的是作为一个评分API，其中，评分函数是用SystemML的DML语言表示的。除了评分外，嵌入式SystemML还可在一台机器上运行的更大的应用程序的上下文中，执行聚类等无监督学习任务。

3.Caffe

Caffe是一种清晰而高效的深度学习框架。

10大热门人工智能开源工具（框架）

Caffe最初由杨庆佳在加州大学伯克利分校读博期间发起，后来由伯克利AI研究公司（BAIR）和社区贡献者联合开发。它主要专注于用于计算机视觉应用的卷积神经网络。对于计算机视觉相关的任务来说，Caffe是一个不错且较为流行的选择，您可以在Caffe Model Zoo上注册，下载很多已经成功建模的模型，直接用于开发。

优点

1.Expressive架构鼓励实用和创新。用配置定义的模型和优化，而不需要硬编码。通过设置单个标志在GPU机器上进行训练，然后部署聚类或移动设备，实现CPU和GPU之间的切换。

2.可扩展代码更有助于开发。在Caffe开发好的的第一年，就有1,000多个开发者分享了出去，对其做了重大贡献。

3.Caffe的高速使理论实验和实际应用得到了完美的结合。Caffe使用单个NVIDIA K40 GPU每天可处理超过6000万张图像。

4.社区：Caffe已经为视觉、语音和多媒体领域的学术研究项目，启动原型，甚至大规模工业应用提供支持。

4.Apache Mahout

Apache Mahout是一个分布式线性代数框架，提供了一些经典的机器学习算法。

10大热门人工智能开源工具（框架）

Mahout旨在帮助开发人员方便快捷的实现自己的算法。Apache Spark是一种即拿即用的分布式后台，或者也可以将其扩展到其他分布式后台。其特点如下：

1.数学表达Scala DSL。

2.支持多种分布式后端（包括Apache Spark）。

3.包含用于CPU / GPU / CUDA加速的模块化本地求解器。

4.Apache Mahout应用的领域包括：协作过滤（CF），聚类和分类。

功能

1.Taste CF.Taste 是 Sean Owen 在 SourceForge 上发起的一个针对协同过滤（CF）的开源项目，并在 2008 年被赠予 Mahout。

2.支持 Map-Reduce 的集群实现包括：k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift算法等。

3.分布式朴素贝叶斯和互补朴素贝叶斯的分类实现。

4.用于进化编程的分布式适应度函数。

5.矩阵和矢量库。

5.OpenNN

OpenNN是一个用c++编写的开源类库，它实现了神经网络建模。

Opennn (开放神经网络图书馆)以前被称为Flood，它是以R. Lopez在2008年泰罗尼亚技术大学的博士论文《在工程变分问题的神经网络》为基础开发的。

10大热门人工智能开源工具（框架）

Opennn使用一组函数实现了数据挖掘，并且，可以使用一个API将这些函数嵌入到其他软件工具中，使软件工具和预测分析任务之间进行交互。Opennn的主要优点就是它的高性能。由于采用c++开发，因此它有更好的内存管理和更高的处理速度，并利用 OpenMP 和 GPU 加速度（CUDA）实现 CPU 并行化。

Opennn包中含有单元测试、许多示例和大量文档。为神经网络算法和应用的研究开发提供了一个有效的框架。神经网络设计是一个基于OpenNN的专业预测分析工具，这就意味着神经网络设计的神经引擎是基于 OpenNN 建立的。

OpenNN旨在从数据集和数学模型中进行学习。

数据集

特征回归

模式识别

时间序列预测

数学模型

最佳控制

最佳形状设计

数据集和数学模型

反向问题

6.Torch

Torch是一个开源机器学习库、科学计算框架和基于Lua编程语言的脚本语言。

10大热门人工智能开源工具（框架）

功能

1.一个强大的 n 维数组

2.有很多索引、切片、转换的程序。

3.可使用 LuaJIT编写简单的C扩展。

4.线性代数程序

5.神经网络和基于能量的模型

6.数字优化程序

7.GPU支持，更加快速和高效

8.可嵌入，带有 iOS 和 Android 的后台端口

Torch供 Facebook 人工智能研究小组、 IBM、 Yandex 和 Idiap 研究所使用。现在，它已经扩展到 Android 和 iOS系统上，研究人员也使用Torch来构建硬件实现数据流。

Pytorch是一个Python的开源机器学习库，用于自然语言处理等应用，主要由 Facebook 的人工智能研究小组开发，Uber 的概率编程软件"Pyro"就是在Pytorch上创建的。

7.Neuroph

Neuroph是一种用 Java 编写的面向对象的神经网络框架。

10大热门人工智能开源工具（框架）

Neuroph可用于在Java程序中创建和训练神经网络，它提供了Java类库以及用于创建和训练神经网络的GUI工具easyNeurons。Neuroph是一个轻量级的Java神经网络框架，可用于开发常见的神经网络架构。它包含一个设计良好的开源Java库，其中包含少量与基本神经网络概念对应的基础类。它还有一个很好的GUI神经网络编辑器来快速创建Java神经网络组件。目前，已经在Apache 2.0许可下作为开源发布出来。

Neuroph的核心类与人工神经元、神经元层、神经元连接、权重、传递函数、输入函数和学习规则等基本神经网络概念对应。Neuroph支持常见的神经网络体系结构，例如具有反向传播，Kohonen和Hopfield网络的多层感知器。所有的这些类都可以进行扩展和定制，以自定义创建神经网络和学习规则。Neuroph同时也支持图像识别。

8.Deeplearning4j

Deeplearning4j是第一个为Java和Scala编写的商业级开源分布式深度学习库。

Deeplearning4j旨在成为顶尖的即拿即用设备，而不是只是做一些配置，这使得非专业人员也能够快速的构建模型。

DL4J可以通过Keras（包括TensorFlow，Caffe和Theano）从大多数主要框架中导入神经网络模型，它为数据科学家、数据工程师和DevOps提供了跨团队工具包，弥合了Python生态系统和JVM之间的障碍。现在，Keras是Deeplearning4j的Python API。

功能

1.分布式 cpu 和 gpu

2.Java, Scala and Python APIs

3.适用于微服务体系结构

4.通过降低迭代次数进行并行训练

5.在Hadoop 上可伸缩

6.在AWS扩展上提供Gpu 支持

库

1.Deeplearning4J: 神经网络平台

2.ND4J: Numpy for the JVM

3.DataVec：机器学习ETL操作的工具

4.JavaCPP：Java和C ++之间的桥梁

5.Arbiter：机器学习算法的评估工具

6.RL4J：JVM的深度增强学习

9.Mycroft

Mycroft声称是世界上第一个开源助手，适用于从科学项目到企业软件应用程序的任何事情。

10大热门人工智能开源工具（框架）

Mycroft可以在任何地方运行——台式计算机上、在汽车内或在树莓派上运行。这是可以自由混合、自由扩展和改进的开源软件。

10.OpenCog

OpenCog是一个旨在构建开源人工智能框架的项目。

10大热门人工智能开源工具（框架）

OpenCog是认知算法的多元化组合，每种组合都体现了它们的创新之处。但是，认真遵守认知协同原则才是OpenCog整体架构强大的原因。OpenCog最初是基于2008年“Novamente Cognition Engine”（NCE）发布的源代码。

1.一个图表数据库，它包含术语、原子公式、句子和关系作为超图。

2.一个模理论解算器，作为通用图形查询引擎的一部分，用于执行图和超图模式匹配。

3.一种称为元优化语义进化搜索的概率遗传程序（MOSES），最初由在Google工作的Moshe Looks开发。

4.有一个基于 OpenPsi 和 Unity 的虚拟世界中的交互学习应用体系。

5.有一个由Link Grammar和RelEx组成的自然语言输入系统，它们都采用类AtomSpace来表示语义和句法的关系。

6.有一个称为SegSim的自然语言生成系统，它实现NLGen和NLGen2。

7.Psi 理论的实现，用于处理情绪状态、驱动和冲动，称为 OpenPsi。

本文为云栖社区原创内容，未经允许不得转载。

人工智能机器学习开放源代码 apache 框架

安科网

10大热门人工智能开源工具（框架）

chenyuan

1.TensorFlow

2.Apache SystemML

3.Caffe

4.Apache Mahout

5.OpenNN

6.Torch

7.Neuroph

8.Deeplearning4j

9.Mycroft

10.OpenCog

chenyuan

相关推荐

如何通过7个步骤构建机器学习模型

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

理解AI：为什么要在人工智能系统中寻求可解释性呢？

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

IT自动化和人工智能将在2021年走向何方?

强化学习到底是什么，它如何运作？

数字营销：AI如何“看透”人类行为模式？

当教练、做监工…… 人机协同下的AI更懂你

Facebook借助人工智能对内容审核排序

人脸识别技术发展现状及未来发展趋势

零基础也能看懂的人工智能教程

关于人工智能的解读，看这一篇就够了

谷歌正在测试一个人工智能系统，帮助视障人士参加跑步比赛

chenyuan