专家们常用的15个机器学习工具
即将开播:4月29日,民生银行郭庆谈商业银行金融科技赋能的探索与实践
本文转载自公众号“读芯术”(ID:AI_Discovery)
机器学习是一项令人惊叹的技术,而发挥其潜能的关键在于,你得掌握正确的使用方法。精通机器学习工具有利于处理数据、训练模型、发现新方法以及创建自己的算法。
如今,大量的机器学习工具、平台和软件不断涌现。而实际上你只需要选择一种进行深耕,乱花渐欲迷人眼,面对纷繁复杂的工具,难免会挑花了眼。本文将介绍专家们最常用的15个机器学习工具,不如来get专家同款工具吧!
Accord.net
Accord.net是一个计算机器学习框架,配有图像和音频包。这样的软件包有助于训练模型和创建交互式应用程序,例如试听、计算机视觉等。由于工具名中包含.net,因此该框架的基础库是C#语言。
图源:accord-framework
Accord库在测试和处理音频文件中非常有用。
RapidMiner
对于于非程序员用户而言,RapidMiner算是福音,它是一个数据科学平台,具有非常出色的界面。RapidMiner独立于平台,可以在跨平台操作系统上工作。
借助该工具,人们可以使用自己的数据测试自己的模型。
此外,RapidMiner的界面也非常人性化。用户只需要拖放即可。这也是它对非程序员非常友好的主要原因。
Scikit-Learn
Scikit-Learn是一个开放源代码的机器学习包。它是一个多用途集成平台,可以用来进行回归、聚类、分类、降维和预处理。Scikit-Learn创建于三个主要的Python库之上,即NumPy、Matplotlib和SciPy。除此之外,它还有助于测试以及模型训练。
TensorFlow
TensorFlow是一个开源框架,适用于大规模及数值机器学习。它是机器学习和神经网络模型的集合,也是Python的好朋友,它比较大的特点是可以在CPU和GPU上运行。
TensorFlow常用于自然语言处理和图像分类。
Weka
Weka也是开源软件,用户可以通过图形用户界面访问Weka。该软件非常人性化,也常被应用于研究和教学中。此外,Weka还允许用户访问其他机器学习工具,例如:R、Scikit-Learn等。
Knime
Knime是一个基于图形用户界面(Graphical UserInterface,GUI)的开源机器学习工具。即使没有任何编程知识,你仍然可以利用Knime提供的工具。Knime通常用于与数据相关的目的,比如数据操纵、数据挖掘等。
Knime通过创建并执行不同的工作流程来处理数据,它的存储库带有很多不同节点,将这些节点带入Knime门户就能创建并执行节点的工作流程。
Pytorch
Pytorch是一个深度学习框架,既快速又灵活,这是因为Pytorch可以很好地命令GPU。它是机器学习最重要的工具之一,因为它被用于机器学习最重要的方面,包括构建深度神经网络和张量计算。
Pytorch完全基于Python。除此之外,它还是NumPy的优秀替代工具。
Google Cloud AutoML
Google Cloud AutoML的目标是使所有人都能使用人工智能。Google Cloud AutoML为用户提供了预训练模型,以便创建各种服务,例如文本识别、语音识别等。
Google Cloud AutoML在公司中非常受欢迎。公司希望将人工智能应用于行业的各个领域,但由于市场上成熟的AI人才,因此它的企业应用一直面临着困难。
Jupyter Notebook
Jupyter notebook是使用比较广泛的机器学习工具之一,是一个非常快速的处理工具,也是一个高效的平台。它支持三种语言:Julia、R、Python。
Jupyter的名称也是由这三种编程语言组合而成。Jupyter Notebook允许用户以笔记本的形式存储和共享动态代码,也可以通过GUI访问它,例如winpythonnavigator和anacondanavigator等。
Azure Machine Learning studio
Azure机器学习工作室由Microsoft发布,就像Google的Cloud AutoML一样,这是Microsoft的产品,可为用户提供机器学习服务。
Azure机器学习工作室是建立模块和数据集连接的一种非常简单的方法。,Azure还旨在为用户提供AI功能。与TensorFlow一样,它也可以在CPU和GPU上运行。
Orange3
Orange3是一款数据挖掘软件,它是Orange软件的新版本。Orange3协助预处理、数据可视化以及其他与数据相关的工作。用户可以通过AnacondaNavigator访问Orange3。在Python编程中,这确实很有帮助。此外,它还可以充当一个不错的用户界面。
MLLIB
与Mahout一样,MLLIB也是Apache Spark的产品。它用于回归、特征提取、分类、过滤等。通常也称之为Spark MLLIB,它具有非常好的速度和效率。
IBM Watson
IBM Watson是IBM提供的使用Watson的网页界面,Watson是基于自然语言处理的人机交互问答系统。Watson应用于各个领域,例如自动学习、信息提取等。
IBM Watson通常用于研究和测试,其目的是为用户提供类似人的体验。
Apache Mahout
Mahout由基于Hadoop的开源平台Apache启动,通常用于机器学习和数据挖掘,它使诸如回归、分类和聚类之类的技术成为可能。它还利用了基于数学的函数,如向量等。
Pylearn2
Pylearn2是建立在Theano之上的机器学习库,它们之间有许多相似的功能。它还可以执行数学计算。Pylearn2也能够在CPU和GPU上运行。需要注意的是,在进入Pylearn2之前,用户必须熟悉Theano。