常见机器学习用例TOP 7,在你身边无处不在!
想象一下——你明天要去面试一个向往已久的机器学习岗位。一切都必须按计划进行,否则就会功亏一篑。
所以,你告诉智能小助手:
- 定一个明天早上7点的闹钟
- 在Uber上预约一个直达面试地点的快车,早上8:30来接我
- 计算一下车费
- 在谷歌地图上看看路上要花多长时间
- 最后列出面试前还需要再多看几眼的资料
这样的好处是什么?你不需要忙前忙后或是亲自花时间打字。只需要给虚拟智能小助手发送指令,机器学习算法就会让系统开始为你工作!
这不是某个科幻场景(也不是机器终于有了“人心”)——这是正在发生的事实。随着计算能力的进步,机器学习应用不断发展,而我们也正在经历一场真正的全球变革。
那么,今天我们就来看看,在日常生活中有哪些最常见的机器学习用例(有时我们甚至没有意识到这些例子涉及机器学习)。
本文涵盖了以下常见的机器学习用例:
1. 机器学习在智能手机中的用例
你知道吗,智能手机中的大多数功能都是由机器学习支持的。
没错!从帮你定闹钟、找餐厅的语音助手到通过面部识别解锁手机等一系列简单的功能-机器学习已经真正融入到了我们最喜欢的设备当中。
(1) 语音助手
还记得前文提到的虚拟智能小助手吗?它的原理就是语音识别概念——这是机器学习领域中的一个新兴话题。
现在语音助手已经很普遍了。你肯定用过(或者至少听过)以下常见的语音助手:
- 苹果的Siri
- 谷歌助手
- 亚马逊的Alexa
- 谷歌Duplex
- 微软的Cortana
- 三星的Bixby
这些语音助手有什么共同点?它们都是由机器学习算法支持的!这些语音助手使用自然语言处理(NLP)识别语音(即我们所说的话),然后使用机器学习将其转换为数字,并据此做出响应。
随着机器学习技术的进步,这一领域已经日渐成熟,这些语音助手也会越来越智能。你可以观看下文的精彩教程,学习建立自己的语音识别系统:
学习如何构建自己的语音-文本模型(运用Python) 传送门:
https://www.analyticsvidhya.com/blog/2019/07/learn-build-first-speech-to-text-model-python/
(2) 智能手机相机
等等,机器学习跟智能手机相机有什么关系?事实上关系可大了。
我们每天点开看到的精美图片和这些图片的深度,都有机器学习的足迹。机器学习分析给定图片中的每个像素,以检测对象、模糊背景和采取一系列美化技巧。
这些机器学习算法可以改进和增强智能手机的摄像头:
- 对象检测可以定位和识别图像中的对象(或人)
- 填补图片中缺失的部分
- 使用特定类型的神经网络利用生成对抗网络(GANs)来增强图像,甚至通过想象图像的样子来扩展其边界等。
有兴趣了解更多相关信息来学习如何使用机器学习构建自己的智能手机摄像头软件?无需等待!以下教程可以完美地带你入门:
谷歌像素相机背后的深度学习技术介绍!
传送门:
https://www.analyticsvidhya.com/blog/2019/02/tutorial-semantic-segmentation-google-deeplab/
(3) 苹果和谷歌应用商店的推荐
苹果(Apple App Store)和谷歌(Goole Play Store)应用商店都有推荐这个功能。“为您推荐”这个功能的依据就是已经下载过的应用程序(或是以前使用过的)。
例如,如果你下载了一些与体育和美食相关的应用程序,那么“为您推荐”通常都会推送类似的应用程序。谷歌应用商店可以根据你的喜好进行个性化,同时推送你更有可能下载的应用程序。
那么苹果和谷歌商店是如何做到的呢?四个大字——推荐引擎。这是目前机器学习中非常热门的概念。构建推荐引擎的方法多种多样,你可以根据以下教程选择适合自己的方法:
• 从零开始构建推荐引擎综合指南(在Python中)
传送门:https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/
(4) 面部解锁——智能手机
大多数人对这个功能都相当熟悉了。我们拿起手机,通过识别面部就可以自动解锁。这个功能智能、高效、省时,非常高级。
很多人不知道的是,智能手机其实是使用一种叫做面部识别的技术来实现这一功能的。而这种技术的核心理论—你知道的—就是机器学习。
面部识别的应用非常广泛,世界各地的很多企业都已经从中获益:
- 脸书通过这种技术识别图像中的人物
- 政府用来识别和抓捕罪犯
- 在机场,面部识别系统可以核实乘客、机组人员等等
未来的几年里,人脸识别模型的应用只会越来越广泛,所以为什么不现在就来学习一下如何构建你自己的人脸识别系统呢?
面部识别简易指南(使用python代码):
https://www.analyticsvidhya.com/blog/2018/08/a-simple-introduction-to-facial-recognition-with-python-codes/
2. 交通中的机器学习用例
在过去的十年中,机器学习在交通运输领域中的应用已经达到了一个全新的高度,其发展正好赶上了打车软件(如Uber、Lyft、Ola等等)的兴起。
这些公司将机器学习用于很多产品当中,从规划最佳路线到决定打车的价格。让我们看看在交通领域一些较多使用机器学习的用例。
(1) 打车的动态定价
你是否会因为打车公司大幅涨价而难过呢?打车的价钱似乎永远在涨。为什么会这样?
事实上,这涉及到动态定价的概念——这是一个绝妙的机器学习用例。为了理解这一点,让我们举一个简单的例子。
想象一下你开了一家打车公司,需要给城市里的每一条线路制定打车价格,既要能吸引顾客,又能提高自己的盈利底线。一种方法是手动为每条线路设定价格。这显然不是理想的方法。
因此,动态定价就会发挥关键作用。这意味着要根据不断变化的市场状况调整价格。因此,价格的变化取决于位置、时间、天气、整体客户需求等因素,这就是打车价格经常飙升的根本原因。
动态定价也是旅游、酒店、交通和物流等诸多行业越来越青睐的一种方法。
(2) 交通与通勤-Uber
动态定价不是像Uber这样的打车公司使用机器学习的唯一用例。他们主要依靠机器学习来确定从A点到B点的最佳路线。
对于我们来说,这似乎是一个很简单的事情。输入位置和目的地,然后最近的司机就会来接我们。但这一简单操作的背后是Uber后端复杂的结构和服务网络。
这些公司运用了多种机器学习技术来优化打车路线。
读一读下面这篇Uber的文章,它详细阐述了机器学习如何确定更快捷的路线:
Uber如何设计快捷的路线:https://eng.uber.com/engineering-an-efficient-route/
(3) 谷歌地图
你肯定已经猜到会有这个例子了。谷歌地图是机器学习的一个经典用例。以下是一些已广泛使用的功能:
- 路线:从A点到B点
- 路线预计耗时
- 沿线交通状况
- “探索附近”功能:餐厅、加油站、自动取款机、酒店、购物中心等
谷歌使用大量的机器学习算法来生成所有这些功能。机器学习已经深深地融入了谷歌地图,这就是为什么每次更新后路线都变得更加智能化的原因。
路线预计耗时功能已经接近完美。如果地图显示“40分钟”到达目的地,你可以确定实际耗时就差不多是40分钟。
3. 热门流行Web服务中的机器学习用例
你肯定会喜欢这一部分。我们每天都要多次使用一些应用。可能直到最近才意识到,正是由于机器学习的强大和灵活性,这些应用才可以正常工作。
以下是一些你非常熟悉的用例。让我们从机器学习的角度来看一看。
(1) 邮件过滤
每天工作都阅读大量邮件?或者邮箱充斥着随机和垃圾邮件?我们都经历过。
如果我们能编写一条规则,让邮箱通过邮件主题过滤邮件,这样是不是就轻松多了?营销邮件会自动转到垃圾邮件。而工作邮件则会进入我的主收件箱(等等)。这会让我们的生活轻松许多。
事实证明,这正是大多数电子邮件服务正在做的!他们使用机器学习来解析电子邮件的主题行并对其进行相应分类。以Gmail为例,谷歌使用的机器学习算法已经接受了数百万封电子邮件的训练,因此可以无缝地为终端用户(我们)工作。
Gmail在提供默认邮箱标签的同时,也允许用户自定义标签:
- 主要邮件
- 社交邮件
- 推销邮件
机器学习算法会在收到电子邮件后立即将其归类到这三个标签中的一个。如果Gmail将其视为“主要”邮件,用户会立即收到新邮件提醒。
当然,Gmail也使用机器学习来判断电子邮件是否是垃圾邮件。这一功能深受我们喜爱。多年来,谷歌的算法在判断电子邮件是否是垃圾邮件方面越来越智能。这就是给机器学习算法提供大量数据的好处——而谷歌最不缺的就是数据。
(2) 谷歌搜索引擎
这是所有机器学习用例中最热门的一个。每个人都用过谷歌搜索,绝大多数人每天会多次使用。但是谷歌搜索的工作原理是什么?
谷歌搜索已经成为了一座无法逾越、不可攻克的大山。只有设计过谷歌搜索的人才知道它的工作原理到底是什么。可以肯定的是——谷歌运用机器学习来驱动其搜索引擎。
谷歌不断训练的数据量和不断完善的数据量是无法想象的。世界上没有计算器可以算出谷歌在过去20年里处理过多少问题。对于数据科学家来说,这是一个稀世宝库!
现在想象一下,你得建立一个自己的谷歌搜索引擎。你会使用什么规则?你会涵盖什么内容?你要如何排列网站?下面这篇文章可以帮你打开思路:
谷歌网页排名简易解读!
传送门:https://www.analyticsvidhya.com/blog/2015/04/pagerank-explained-simple/
(3) 谷歌翻译
谷歌使用机器学习来理解用户输入的句子,将它们转化为请求语言,再显示输出结果。机器学习深深植根于谷歌的生态系统,我们都从中受益。
幸运的是,我们知道谷歌是如何利用机器学习来驱动它的翻译引擎的。以下文章可以帮助你理解并尝试这一话题:
关于神经机器学习的自然语言处理必读教程——技术驱动谷歌翻译:
https://www.analyticsvidhya.com/blog/2019/01/neural-machine-translation-keras/
(4) 领英、脸书的推荐和广告
社交媒体平台是机器学习的经典用例。跟谷歌一样,这些平台已经将机器学习集成到它们的结构当中了。从家庭订阅到你看到的种种广告,所有这些功能的运行都要归功于机器学习。
你经常看到的一个功能是“可能认识的人”。这是所有社交媒体平台(Twitter、Facebook、LinkedIn等)的常见功能。这些公司使用机器学习算法来查看你的个人资料、兴趣、你当前的朋友、他们的朋友以及所有其他变量。
然后,该算法就可以生成与特定模式匹配的人员列表。最后向你推荐这些人,希望你可能认识他们(或者至少拥有非常相似的个人资料)。
由于领英的这个功能,你可以与很多人都建立联系。这一机器学习的用例对每个参与其中的人都有好处。
我们看到的广告也是采用了相似的原理。这些平台追踪你的品位、兴趣,特别是你最近的浏览或购买记录,然后投送量身定制的广告。如果你也是数据科学的爱好者,脸书或领英的机器学习算法可能会激发你深入学习的兴趣。
下次使用社交媒体时可以留意这一点。这都归功于机器学习!
4. 销售与营销中的机器学习用例
世界上的顶尖公司都在利用机器学习来实现自上到下的战略转变。两个受影响最大的领域就是营销和销售。
现在,如果你在营销和销售领域工作,至少需要知道一种智能商业工具(如Tableau或Power BI)。此外,营销人员还需要知道如何在日常工作中利用机器学习来提高品牌知名度、盈利底线等。
因此,这里有三个在市场营销和销售中很常见的用例,机器学习正在改变这一领域的工作方式。
(1) 推荐引擎
我们之前简单地谈到了推荐引擎。这些推荐系统无处不在。但是,它们是市场营销和销售领域有什么用途呢?工作原理又是什么?
让我们看一个简单的例子来更好地理解这一问题。在IMDb(和网飞)出现之前,我们都是去DVD商店或是在谷歌上搜索电影观看。店员通常会推荐一些影片,然后我们就选几个从来没看过的电影碰碰运气。
由于推荐引擎的出现,碰运气的日子一去不复返。我们可以登录一个网站,然后就会根据个人品味和以前的浏览历史推荐产品和服务。一些常见的推荐引擎有:
- 电子商务网站,如亚马逊和Flipkart
- 图书网站,如Goodreads
- 电影服务网站,如IMDb和网飞
- 酒店网站,如makemytrip、booking.com等
- 零售服务网站,如StitchFix
- 食杂网站,如Zomato和Uber Eats等
数不胜数。推荐引擎无处不在,而营销和销售部门比以往任何时候都更依赖于这些引擎来吸引(和留住)新客户。
推荐各位阅读这篇初学者教程,学习如何构建自己的推荐引擎:
从零开始构建推荐引擎综合指南(在Python中):
https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/
(2) 个性化营销
推荐引擎只是个性化营销总体概念的一部分。这一概念的意义就在于其名称本身——它是一种根据个人需要量身定制的营销技术。
试想:你接过多少电话向你推销“免费的”借贷或信用卡服务?这些电话不想了解你的需求,清一色地推荐同一种服务。这种传统的营销已经过时,远远落后于数字革命。
现在,想象一下这些电话都是根据你的兴趣量身定制的。如果你是一个购物狂,并且购物记录可以看出这一点,或许你会接到一个电话给你提供一项新的服务——增加你的信用额度。或者,如果你是一个机器学习爱好者,你可能会收到一封邮件推荐适合你的课程。
事实上,个性化营销的潜力是巨大的。机器学习可以识别不同的客户群,并为每个客户群定制营销活动。你可以通过开放率、点击率等指标定期检查活动情况。
强烈建议各位阅读以下指南,它可以帮助你重新包装数字营销策略:
每位数据科学人士都必读的:数字营销与分析综合指南
传送门:https://www.analyticsvidhya.com/blog/2018/12/guide-digital-marketing-analytics/
(3) 客户售后询问(以及聊天机器人)
如果你有过售后经历(谁没有呢?),那么你肯定可以从个人的角度理解这一点。那些可怕的电话、无休止的等待、悬而未决的查询——所有这些都给用户带来了极其糟糕的体验。
而机器学习有助于消除这些障碍。利用自然语言处理(NLP)和情感分析的概念,机器学习算法能够理解我们在说什么以及说话时的语气。
用户询问可以分为两类:
- 语音询问
- 文字询问
对于前者,机器学习算法可以检测客户的消息和情绪,根据客户的询问重新指派合适的售后人员,然后有针对性地解决用户问题。
另一方面,文本询问的工作基本都由聊天机器人承包。现在几乎所有企业都在自己的网站上设置了聊天机器人。他们避免了漫长的等待,并提供即时的回答——因此,这是一种非常实用的终端用户体验。
我们收集了两篇关于如何构建自己的聊天机器人的文章,简单易懂,值得一看:
- 学习如何运用Rasa迅速构建和部署聊天机器人(以IPL为例):https://www.analyticsvidhya.com/blog/2019/04/learn-build-chatbot-rasa-nlp-ipl/
- 运用Python构建聊天机器人——信息查询的未来:https://www.analyticsvidhya.com/blog/2018/01/faq-chatbots-the-future-of-information-searching/
5. 安全领域中的机器学习用例
机器学习也正在扰乱安全行业。在传统的安全行业中,保安们常常连续几个小时坐在那里记下车牌号,阻止可疑的人——但这种做法正慢慢被淘汰。
企业正在使用机器学习来更好地分析威胁和应对袭击。这些用例既适用于现实威胁,也适用于网络威胁(银行欺诈、金融威胁等)。
(1) 视频监控
你肯定听说过或读过某个国家正在使用监控来追踪其公民(谷歌上一搜就有)。全世界的机构都在利用视频监控来执行各种任务,例如侦测入侵者、识别暴力威胁、抓捕罪犯等。
然而,这些都不是手动完成的,不然就太费时了。相反,这些监控摄像头中都安装了机器学习算法软件。
这些机器学习算法使用各种计算机视觉技术(如目标检测)来识别潜在威胁和抓捕罪犯。
以下是安全领域中常见的机器学习用例:
“天眼”是一个可以侦测人群中暴力分子的机器学习项目:
https://www.analyticsvidhya.com/blog/2018/06/eye-in-the-sky-is-a-machine-learning-project-that-detects-violent-people-in-crowds/
(2) 网络安全(Captchas测试)
“我不是机器人”——这句话是不是听起来很熟悉?当一个网站怀疑浏览者是机器人时,就是弹出这个按钮。
这些测试被称为CAPTCHA,全称为Completely Automated Public Turing test(全自动区分计算机和人类的图灵测试)。我们需要识别红绿灯、树木、人行横道和各种各样的物体来证明我们确实是人类。
同时,网站还设置各种各样的困难,例如红绿灯和树木被其它物体遮盖、汽车变得模糊、人行横道在较远处。为什么这些网站要如此刁难我们?原因还是机器学习。
网站Verge说得很好:
“CAPCHA测试很容易被拿来给人工智能做训练,所以任何图形测试都只能是暂时的,这也是CAPCHA的开发者一开始就承认的。所有研究者、骗子和普通人解决了数十亿的难题,但是人工智能不费吹灰之力就可以做到,在某个时刻,这些机器将超越我们。”
因此,谷歌正在使用机器学习让CAPTCHA测试更难破译。研究人员正在使用图像识别技术来破解这些CAPTCHA测试,从而增强其后端的安全性。
6. 金融领域中的机器学习用例
机器学习中的大多数岗位都面向金融领域。这也无可厚非——毕竟金融是终极的数字领域。许多银行机构直到最近还在使用逻辑回归(一种简单的机器学习算法)来处理这些数字。
金融领域的机器学习用例有很多。现在就看看两个可能遇到过的常见用例。
(1) 抓捕银行诈骗
你遭受过信用卡诈骗吗?这是一段痛苦的经历。银行要你填写的文件数量加剧了欺诈对你的冲击。
幸好,机器学习正在不同层次解决这一问题。从欺诈侦测到欺诈预防,机器学习算法正在改变银行的工作方式,以改善客户体验。
目前的挑战就是要跟上网络威胁的水平。这些网络攻击者在每个阶段都比我们抢先一步,甚至两步。一旦最新的机器学习解决方案出现,这些攻击者就会在新方案的基础上完善手段。
尽管如此,机器学习确实有助于简化流程。这些算法能够识别欺诈交易并标记它们,这样银行就可以尽快与客户取得联系,检查他们是否进行了交易。
一个很好的例子就是看看消费者的消费模式。如果用户的某次消费不符合该模式(金额太高或来自不同国家等),则算法就会提醒银行并暂停交易。
以下两篇由网络安全和机器学习专家撰写的文章解释了如何构建强大的恶意软件检测模型:
- 利用深度学习的力量确保网络安全(第一部分):https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/
- 利用深度学习的力量确保网络安全(第二部分):https://www.analyticsvidhya.com/blog/2019/05/using-power-deep-learning-cyber-security-2/
(2) 个性化银行
另一个用例就是推荐引擎!这里的推荐引擎是专门针对银行领域的。读到这里,你肯定非常熟悉个性化了——所以在继续阅读之前,先思考一下个性化银行是什么意思。
我们读过一些文章,描述银行针对不同的客户群体提供量身定制的服务。而个性化银行则将这一概念提升到一个全新的水平。
理想的个性化情形是使用机器学习来预测客户的需求,并瞄准客户群中的每一个客户。波士顿咨询的一份报告指出:
“银行业的个性化主要目的不是销售,而是每天、甚至是一天多次为客户提供服务、信息和建议。在销售中,销售人员与顾客的沟通较少,与此相反,频繁的互动是客户银行体验的关键。”
以下是这份报告的全文:
银行业的个性化真正意味着什么?:
https://www.bcg.com/publications/2019/what-does-personalization-banking-really-mean.aspx
7. 其他热门的机器学习用例
这一部分的用例无法归类到上述几个部分当中。我也会持续更新这一部分,所以就让我们从一个非常有趣的用例开始——自动驾驶汽车!
自动驾驶汽车
在本文讨论的所有用例中,我最喜欢自动驾驶汽车。这是我们在硬件和机器学习方面所取得的最高成就。
自动驾驶汽车的优点在于,机器学习的三个主要方面——监督、无监督和强化学习——都贯穿在汽车的设计当中。