数据机器学习在故障检测中的应用
前言:传统工业中,维修时花费的大部分时间都在故障的诊断上,而不是进行实际的补救,因为故障诊断是机器维修中最具挑战性的阶段。在能源行业中,精确的故障诊断直接影响到供能的稳定性。
随着传感器技术,数据存储和互联网的飞速发展,工厂变得越来越智能,并且生成更多的过程数据。针对大量数据的数据分析需求应运而生,通过基于数据的机器学习技术能有效改善故障诊断。
本文将简要介绍几种在故障诊断领域广泛应用的机器学习技术及其各自的应用方向,并对每种技术的优缺点进行简单分析。包括:贝叶斯网络(BN),人工神经网络(ANN),支持向量机(SVM)和隐马尔可夫模型(HMM)技术。
贝叶斯网络(BN,Bayesian Network)
贝叶斯网络是故障检测的一种常用的机器学习技术。BN是有向无环图,即网络结构要求节点之间不能形成任何闭环,其节点表示随机变量,其条件相关性由链接节点的有向弧表示。
BN是白盒模型,因为图形表示使用户可以直观地轻松理解模型变量之间的交互。这对于建模不确定性十分有益,并且可以较容易地使用来自多个来源的数据(通常在制造系统中找到)来对多个原因和结果的层次级别进行建模。训练BN的主要挑战在于树结构的构建。
BN广泛应用于故障监测及可靠性分析领域,1995年 Microsoft公司将 BN 运用于打印机的故障诊断,通过不断计算在不同步骤下可能需要的维修方案的功效确定最优的维修路径。在半导体行业,Yang&Lee和Nguyen等人使用BN评估工艺变量对晶圆质量的影响,从而使用历史工艺数据诊断缺陷晶圆的根本原因。可靠性分析一般包括分析故障发生的概率和时间、系统冗余,需要综合考虑系统的多状态单元、动态变化、运行条件等因素。在能源领域,例如电厂运行可靠性,核能系统的可行性中都有着成功应用。此外BN 还广泛应用于发动机转子、电网、车辆电源系统、液压泵、电力变压器、太阳能发电厂、移动通信网络、制造过程的故障诊断。
人工神经网络(ANN, Artificial Neural Network)
人工神经网络是一种非参数的机器学习算法,受人类中枢神经系统功能的启发。自适应特性提供了强大的建模功能,适用于特征之间的非线性关系。
人工神经网络目前没有一个统一的正式定义。不过,具有下列特点的统计模型可以被称作是“神经化”的:
- 具有一组可以被调节的权重(被学习算法调节的数值参数)这些可调节的权重可以被看做神经元之间的连接强度。
- 可以估计输入数据的非线性函数关系
人工神经网络与生物神经网络的相似之处在于,它可以集体地、并行地计算函数的各个部分,而不需要描述每一个单元的特定任务。
单个神经元示意图,f为函数关系,w为权重
ANN的非参数性质及其以高精度对非线性复杂问题进行建模的能力,使ANN可应用于故障诊断问题。该模型易于初始化,因为不需要像BN一样指定网络结构。但是,缺点包括“黑匣子”性质,这使得模型难以解释。此外,人工神经网络通常无法处理输入中的不确定性,并且计算量大,因此在训练过程中收敛通常会较慢。人工神经网络容易过度拟合,需要大量的多样化数据集进行训练以防止出现此问题。
ANN以大规模并行能力,适应学习能力,分布式信息存储、鲁棒性等特点,在故障监测及诊断领域大受关注。大量多样的神经网络算法被开发及利用。神经网络算法可以说是机器学习技术中的明星。其应用范围十分广泛,在能源领域有着相对成熟的应用,包括负荷预测,各类故障诊断等等。
支持向量机(SVM, supportvector machine)
SVM使用不同的核函数(例如径向基函数(RBF)或多项式内核)来找到一种能将数据最好地分离的超平面,并且在与小型训练集一起使用时具有良好的分类性能。支持向量机的成功应用领域包括面部识别,手写字符识别,语音识别,图像检索,预测等。
SVM是建模线性和非线性关系的出色技术。与其他非参数技术(例如ANN)相比,计算时间相对较快。大型训练数据集的可用性是机器学习中的一个挑战,但是,即使在训练数据量有限的情况下,SVM也有不错的效果。
支持向量机在故障定位中的应用不像BN和ANN常见。支持向量机是工业生产系统的非常有效的监视和诊断工具,例如使用该技术来诊断在不同切削条件下的端面铣削过程中的刀具破损故障。以及SVM在风力发电机组中的故障监测,此外在医学领域,SVM被用于各种疾病的诊断,例如用于癌症及糖尿病的监测。在能源领域,支持向量机还被应用于负荷预测,例如房屋冷热负荷预测,风电发电量预测及用户负荷预测等。
隐马尔可夫模型(HMM, Hidden Markov Model)
隐马尔可夫模型是马尔可夫链模型的扩展,用于估计动态过程中状态转换和测量输出的概率分布,假定过程的状态不可观察。描述一个含有隐含未知参数的马尔可夫过程,是一个双重随机过程(包括马尔可夫链和一般随机过程)。