盘点在现实中运用领域最多的9项机器学习应用!
1. 目的
随着世界迈向数字时代,我们能看到的现代创新之一就是机器学习。这种令人难以置信的人工智能形式已经在各行各业中得到应用。例如,图像和语音识别、医学诊断、预测、分类、学习关联、统计套利、提取、回归。今天,我们来看看当今现代世界中所有的这些机器学习应用程序。
如果你不熟悉机器学习,那么你可以阅读之前关于机器学习简介的博客。(http://data-flair.training/blogs/machine-learning-tutorial/)
2. 机器学习应用程序
让我们逐一讨论所有现实世界的机器学习应用。
2.1 图像识别
机器学习最常见的用途之一就是图像识别。在很多情况下,你可以把对象归类为数字图像。对于数字图像,测量描述了图像中每个像素的输出。
在黑白图像的情况下,每个像素的强度用作一次测量。因此,如果黑白图像具有N×N个像素,则像素总数和测量结果为N2。
在彩色图像中,每个像素被认为提供了3个主要颜色分量(即RGB)的强度测量。所以N×N色图像有3个N2测量值。
· 用于人脸检测——可能是人脸,也可能不是人脸。在每个人的数据库中,每个人可能都有一个单独的类别。
· 对于字符识别 - 我们可以将一段文字分割成较小的图像,每个图像包含一个字符。这些类别可能包含26个英文字母,10个数字和一些特殊字符。
2.2 语音识别
语音识别(SR)是将口头文字翻译成文本的过程。它也被称为"自动语音识别"(ASR)、"计算机语音识别"或"文本语音"(STT)。
在语音识别中,软件应用程序可以识别口语词汇。这个应用中的测量可能是一组表示语音信号的数字。我们可以把信号分割成包含不同单词或音素的部分。在每个段中,我们可以用不同时频段的强度或能量表示语音信号。
虽然信号表示的细节超出了程序的范围,但我们可以用一组实际值来表示信号。
语音识别应用包括语音用户界面。语音用户界面如语音拨号、呼叫路由、域名设备控制等。它也可以用作简单的数据输入、准备结构化文件、文本语音的处理。
2.3 医疗诊断
ML提供了方法、技术和工具,可以帮助解决各种医疗领域的诊断和预后问题。它被用于分析临床参数及其组合对预后的重要性。例如,预测疾病进展、提取对结果研究的医学知、对治疗的计划和支持以及全面的患者管理。ML也被用于数据分析,例如通过适当处理不完善的数据、对重症监护室使用的连续数据的解释以及智能报警,从而进行有效和高效的监测来检测数据的规律性。
有人认为,ML方法的成功实施可以帮助将基于计算机的系统整合到医疗保健环境中,为促进和加强医学专家的工作提供机会,并最终提高医疗保健的效率和质量。
在医学诊断中,主要运用在确定一种疾病的存在,对其进行准确的识别上。正在发生的每种疾病都有一个单独的类别,而没有出现的疾病有另一个类别。在这里,机器学习通过分析患者的数据来提高医学诊断的准确性。
本应用中的测量结果通常是某些医学测试(例如血压、温度和各种血液测试)或医学诊断(例如医学图像)的结果,各种症状的存在/不存在/强度以及关于患者的基本身体信息(年龄、性别、体重等)。根据这些测量结果,医生缩小了患者的可能所患疾病的范围。
2.4 统计套利
在金融领域,统计套利指的是短期内通常涉及大量证券的自动交易策略。在这样的策略中,用户尝试基于诸如历史相关性和一般经济变量之类的量来实施一组证券的交易算法。这些测量结果可以作为分类或估算问题进行转换。基本假设是价格将向历史平均水平移动。
我们采用机器学习方法来获得指数套利策略。特别是,我们将线性回归和支持向量回归(SVR)应用到了交易所交易基金和股票流的价格上。通过使用主成分分析(PCA)来减少特征空间的维数,我们观察了SVR在应用中的优点并注意到了存在的问题。为了生成交易信号,我们将先前回归的残差构建模型,查看平均回复过程。
在分类的情况下,可能会存在被出售、购买等任何情况。作者估计一个人可能会先试图预测未来时间范围内每个证券的预期收益。在这种情况下,通常需要使用预期收益的估计来作出交易决策(买入、卖出等)。
2.5 学习关联
学习关联是对产品之间各种关联进行深入研究的过程。一个很好的例子是,在分析与顾客行为有关时,看似不相关的产品可能会揭示出彼此之间的关联。
机器学习的一个应用——通常研究人们购买的产品之间的关联,也被称为购物篮分析。如果买家购买'X',他或她是否会因为它们之间的关系而购买'Y'?当新产品在市场上推出时,了解了这些关系,就会发展出新的关系。了解这些关系可能有助于向客户推荐相关产品。客户购买它的可能性更高,它也可以帮助捆绑产品获得更好的销售。
通过机器学习产品之间的关联就是学习关联。一旦我们通过检查大量销售数据找到了一个关联,大数据分析师可以在学习条件概率的过程中推导出一个概率检验的测试。
2.6 分类
分类是把每个人从被研究的人群中分成许多类的过程。这是自变量。
分类有助于分析人员使用对象的度量来识别该对象所属的类别。为了建立一个有效的规则,分析师使用数据,而数据又是由许多具有正确分类的对象组成。
例如,在银行决定发放贷款之前,它会评估客户偿还贷款的能力。通过考虑客户的收入、年龄、储蓄和财务历史等因素,我们可以做到这一点。这些信息来自过去的贷款数据。因此,Seeker用于创建客户属性和相关风险之间的关系。
2.7 预测
以银行为例,计算出任何贷款申请人违约偿还贷款时出错的概率。为了计算出错的概率,系统首先需要对某些组中的可用数据进行分类。它是由分析师人员定的一套规则来描述。
一旦我们完成分类,根据需要我们可以计算出概率。这些概率计算可以在所有扇区上针对各种目的进行计算。
当前预测是最热门的机器学习算法之一。让我们举一个零售的例子,之前我们可以获得诸如上个月/年/ 5年/圣诞节的销售报告。这些类型的报告被称为历史报告。但是目前企业更感兴趣的是找出下个月/年/排灯节等的销售情况。
因此,企业可以及时作出必要的决策(与采购、库存等有关)。
2.8 提取
信息抽取(IE)是机器学习的另一个应用。它是从非结构化数据中提取结构化信息的过程。例如网页、文章、博客、商业报告、电子邮件和关系数据库维护信息提取产生的输出。
提取过程将输入作为一组文档并生成结构化数据。这个输出是关系数据库中的汇总表格,例如excel表格和表格。
现在,提取已经成为大数据行业的关键。
正如我们所知道的那样,大量的数据正在生成,大部分数据都是非结构化的。第一个关键挑战是处理非结构化数据。现在,将非结构化数据转换为基于某种模式的结构化数据,以便可以将相同的数据存储在RDBMS中。
除此之外,当前的数据收集机制也在发生变化。早些时候,我们以批次方式收集数据,例如"一天结束"(EOD),但现在企业需要在数据生成后立即收集数据,即实时收集数据。
2.9 回归
我们也可以将机器学习应用于回归中。
假设x = x1,x2,x3,... xn为输入变量,y为输出变量。在这种情况下,我们可以使用机器学习技术根据输入变量(x)生成输出(y)。你可以使用模型来表示各种参数之间的关系,如下所示:
Y = g(x)其中g是取决于模型特定特征的函数。
在回归中,我们可以利用机器学习的原理来优化参数,为了减少近似误差并计算出尽可能接近的结果。
我们也可以使用机器学习来优化功能,选择改变输入以获得更好的模型。这为我们提供了一个新的、改进的模型。这就是所谓的响应面设计。
3. 结论
总之,机器学习在人工智能领域是一个令人难以置信的突破。这些对机器学习的应用是我们生活日新月异的主要"推手"。