一文看懂人工智能的六个关键概念和实施AI项目的七个注意事项
人工智能并不能解决所有问题,但如果应用得当,它可以在短时间内产生很大的变化。
您或许已经听说过机器学习和人工智能(AI)的前景。这两个技术概念,已经引起了全世界的关注。自动驾驶汽车、人形机器人、设备预测维护——这些应用不仅仅限于消费者领域,工业界也开始疯狂了。看看最近主要工业出版物的诸多头条新闻就知道了。这种趋势仍将继续,实际上,未来它可能无处不在。因此,您不妨了解一下。
AI的兴起
传统上,分析是统计学家的专长。在工业领域普及计算机之前,分析师使用铅笔和纸完成分析工作。而现在的分析,是描述数据科学的总称。
例如,沿着一条简单的线找到一个点,通常属于标准数据分析的范畴。该线被认为是“回归”。沿着线找到点是“回归分析”。执行简单的回归分析司空见惯。
机器学习可以看作是AI 的子集,尽管这两个术语通常可以互换使用。机器学习是AI的统计方面,其中还包括认知计算和建模。每个类别的边界可能是模糊的。
表征AI的另一种方法,是使用真实世界数据得出结论的计算机代码。如果以此方式建立系统,则可以根据这些结论自动做出决策。然后,可以将更多信息输入系统并做出更多的决策。对AI 的描述,反映了当今流行文化的对AI 的理解,它反映了人类的思想方式。我们接受信息,得出结论并做出决定。
人类思想常常可以用“如果,那么”的形式来表达,当然也可以用其它形式表示。与此类似,我们也可以用用其中一种算法来实例化AI。根据功能对算法进行分组很有用。我们来了解一下机器学习算法的主要类别。
聚类分析
一些算法将事物进行“分组”。例如,假设正在生产零部件。质保部门或在线测量系统将把两个测量功能与零件关联:宽度和高度。将这些数据用于生成图表。可以使用颜色来明确分类方案。如果您使用的是Excel 向导,则可以自己生成图形,在新零件通过时将其绘制到图表上(见图1)。
图1 可以使用颜色对零件进行分类,但是如果相关参数太多而无法使用传统的可视化技术显示,该怎么办?本文图片来源:inductiveAutomation
随着将更多信息添加到架构中,集群功能变得更强大。假设添加了有关次品的信息。结果显示,蓝色组代表的次品占比将近80%,而绿色组则占大约20%。
但是为什么要停在那里?假设我们也开始收集长度信息。想象一下在三个维度上绘制图表。先进的绘图程序可以做到这一点,因此可以继续手动输入和分组信息。当分组得到改善后,蓝色组显示的次品占比达到85%。
此时,如果使用机器学习算法完成聚类,它将执行分类,但是只能自动执行可以手动完成的操作。那为什么机器学习是更好的选择?
更多维度
这个时候,如果需要增加另一个维度怎么办?也许电导率是有意义的参数,或者是湿度读数,或者是阳极氧化电流。但是3D 图只能具有三个维度。另一方面, 使用机器学习算法意味着可以绘制四个、五个、六个甚至一百个维度的图形。
聚类算法根据每个零件的属性绘制图形,将彼此接近的零件识别为一组。一旦完成此操作,就更容易看到哪些属性或属性的组合最有可能产生次品。
这意味着可以根据其它属性自动对分组进行进一步细化,并且可能对蓝色组进行充分细化,以预测95%或99%的次品。对于最有可能需要返工的产品,洞察力得到了显著改善。可能的选择是在采取不必要的步骤之前,将其从生产环节中撤出,从而可以节省时间和成本。
决策树
决策树是另一种在概念上具有重大意义的简单技术。在数据挖掘中决策树训练是一个常用的方法。目标是创建一个模型来预测样本的目标值。在日常生活中,我们经常会建立决策树,以回答诸如以下问题:交通状况如何?天气如何?我今天应该给妈妈打电话吗(请参见图2)?构建一个算法是一项简单任务。首先,确定描述过程的数据以及有关结果的信息。结果生成的算法,将构建一棵映射预测结果的树。它会通过多种可能性(也许是数千甚至更多种),来构想出尽可能准确的树。
图2 决策树从简单元素开始,但可以用来预测高度复杂过程的结果。
模型与训练
其它重要的分析概念,还包括建模和训练。当将过程数据输入到机器学习算法中时,就会进行训练,从而生成模型,进而识别出好的和坏的过程示例。
想象一下,有人坐下来用笔写出一个决策树。然后他们写了一个又一个决策树。之后,就可以确定最佳决策树,然后放弃其它决策树。最终的决策树就是模型。对于聚类算法,该模型将仅被称为“聚类模型”或“模型”。
换句话说,使用最佳决策树可以利用一组数据基于处理流程来获得预测。回到前面的示例,第一个语句可能是“如果宽度小于23.5,那么xxx”,第二个语句可能是,“如果高度大于43.3,那么xxx。”机器学习算法创建问题,以获得它所能得到的最佳答案。
决策树在预测性维护应用中具有很大的实用性。如前所述,回归分析可能很简单。但当涉及到机器学习算法时,它可能会很复杂。
回归分析
同样,回归分析的基础可以通过在一条线上找到一个点来说明。要画一条线,首先要确定画一条什么类型的线。它是曲线吗?是直线吗?它有很多曲线吗?如果将其绘制在x-y 二维平面中,这很容易做到。当将机器学习应用于复杂数据和更多维度时,它会大放异彩。手工绘制100 个维度,永远是不切实际的,但是一种算法可以轻松地解决这一问题,并且可以轻松找到最佳拟合回归(如果存在的话)。
回归分析在过程调整和生产预测中非常有用。并非所有数据都适合进行回归分析(例如,聚类数据),但是对于那些某个因素会影响其它因素的项目可能非常有用。
深度学习
也许您听说过深度学习和神经网络,那您真的了解它们是什么吗?深度学习是机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。神经网络是包含数千或数百万个节点的模型,这些节点是计算机代码的小块,每个块都可以接受输入并产生输出。所谓神经网络是因为它们旨在模拟神经元在大脑中的工作方式。就像我们大脑中的神经元一样,节点之间的某些连接相对较强,其它可能相对较弱。
图3 可以将神经网络设计为大致类似于大脑的工作方式。
对于神经网络,算法不只是配置节点。它们自我构建,从而可以建立具有数百万个节点的模型来处理数据。
当神经网络“消化”数据时,它会变形和变化,直到在预测结果或提供分类方面达到设定目标为止。经过训练,它可以做几乎所有事情。可能需要获取最近的传感器读数并经计算获得问题出现的可能性。或者,它可以评估一组1 和0,以确定是否描绘了一只猫。所有这些数百万个节点,都以某种方式“理解”了图像。对每个节点只是简单的数学运算,但节点的排列和权重都可以以某种形式用于获得结论。
这就是为什么很少能有人真正理解它们的原因。要求数据科学家解释神经网络,他们可能能够解释数学问题。如果请同一位数据科学家解释如何在这些字节中识别“怪兽”,他可能会用“魔法”来解释。
神经网络如此令人印象深刻,它们在工业领域也提出了难题。如果算法告诉您要做某事,您会做吗?如果是决策树、回归分析或聚类模型分配建议,则可以跟踪获得结论的方式。但是,神经网络可能不会让你了解获得系统的“原因”。它只是给出一个可以相信与否的答案。如果这些决定可能会导致停机或生产瓶颈,则可能会遭到质疑,为什么要使用算命先生的魔法水晶球来制定决策。
未来就在这里
世界正在变化,人工智能和机器学习技术将不断发展,并且在更多行业得到应用。人工智能技术已经证明了其价值,采用的企业看到了已经获得的领先优势。人工智能并不能解决所有问题,但如果应用得当,它可以在短时间内产生很大的变化。所以放开手脚,大胆的去建立模型吧,你会在过程中找到答案的。
实施AI项目的7个注意事项
如果你正在学习或计划实施机器学习或人工智能项目,有一些事要优先考虑。
01识别问题
首先选择要改进的过程、区域或技术。在机器学习或AI 似乎可以提供帮助的地方,找到最需要解决的问题和目标。
02收集数据
数据越多越好。成千上万的数据点,尽可能多的帮助训练模型。确保使用高质量的数据。不良数据很容易引发算法失败。数据预处理和数据清理,是影响成功的关键因素。
03整理统计数据
了解采样技术以及因果关系和相关性。了解结果的质量,有助于避免发生错误。
04具有专业知识
了解过程或技术对于了解结果是否合理至关重要。数据科学家很棒,但是仅仅关注某些数据,不会取得好的结果。
05创建模型
这可以与现有的任何机器学习软件一起使用。现代的监控和数据采集(SCADA)系统,内置了一些流行的机器学习算法。许多云产品和平台都将这种类型的算法作为选项。
06部署模型
通常,可以在机器旁边或内部运行模型,甚至构建在云上或利用其它工具。寻找运行模型的最佳方法。如果是关键过程的一部分,则在本地运行是理想选择。