2018年前7大数据科学趋势
当今世界的数据科学综合了各种功能 - 人工智能,深度学习,量子计算,大数据,物联网等等,这些应用程序一起用作网络。2017年由大数据接管的AI范围内的增长来管理。数据已经开始流行,原因是开放源代码体系正在慢慢削弱甲骨文和微软等已有名称的市场和技术份额。随着更新和可扩展计划的不断普及,让我们看看2018年的主要趋势。
强化学习
虽然监督,无监督和半监督的训练方法以前引起了很多关注,但强化学习似乎越来越重要。例如,Google Deep Mind团队最近发布了一篇论文,解释他们如何使用强化学习来培训AlphaGo Zero,这是他们的人工智能引擎的最新重点,可以玩棋盘游戏Go。由于完全没有人为干预且没有历史数据可供参考,AlphaGo Zero只需要三天的培训就可以匹配第一版AlphaGo的能力来击败世界冠军。在40天之内,强化学习推动了这个AI成为世界上最好的Go球员,人类或机器。
边缘分析
过去,大多数数据科学家对驻留在云端或集中式数据中心的数据进行了分析。然而,物联网的发展引发了对边缘分析的更多兴趣。当你有数以千计的设备和传感器获取数据时,将数据传输到另一个地方进行分析会消耗太多的网络带宽,并且成本限制。对于这些用例,企业正开始在网络边缘进行更多的数据处理和分析,或者在生成数据的设备和传感器附近或非常接近。边缘计算的作用是保持信息来源附近的处理,内容收集和传递的紧密性。它有助于减少延迟,带宽和连接问题。
数据保护
两个独立因素正在增加企业对数据保护的兴趣。首先,看似无数的高调数据泄露事件凸显了网络攻击违反了备受尊敬的公司的防御的事实,并且这些攻击对于受害者而言可能代价极高。其次,欧盟的“一般数据保护条例”(GDPR)法将于明年生效。为了遵守规定,世界各地的公司将需要改进他们的安全和隐私程序。作为他们工作的一部分,数据科学家经常访问敏感信息。随着企业实施更强大的安全措施,数据科学家可能会发现自己需要适应不断变化的协议和程序,他们可能需要更加努力地匿名化和保护用于分析的数据。
Blockchain
Gartner和其他几家分析公司预测,区块链将在未来一年内起飞。对于金融服务业来说特别重要的是,Blockchain是像比特币这样的加密货币的基础技术。这是一个高度安全的分布式分类帐,一旦将其添加到分类账后,数据就不会更新或删除。一些专家预测,区块链很快就可以用来记录各种不同的企业交易。如果发生这种情况,数据科学家可能需要新的工具和程序来帮助他们分析区块链数据,但他们也可以访问比以往任何时候都更可靠的数据源。
云分析
云分析不是什么新鲜事,趋势也不会很快消失。相反,在基于云计算的数据科学工具方面的支出似乎飞涨。事实上,IDC预测:“到2020年,新的云计算模式将为特定的分析工作负载提供服务,从而使云上的支出增长率与本地分析相比提高5倍。”机器学习和人工智能应用特别适合云,组织可以访问高端系统,使他们能够以合理的价格非常快速地处理和分析数据。
人工智能
迄今为止,人工智能的大多数用途都集中在“狭窄的人工智能”上。也就是说,他们针对的是一项特定任务,比如提出产品推荐或预测下一季度的企业利润率。然而,研究人员对通用人工智能越来越感兴趣。这些系统将能够分析任何问题,并不断从他们的成功和失败中汲取教训。从本质上讲,它们具有相当于人类智能和适应性。大多数专家认为,真正的普通人工智能还有很长的路要走,但不久之前,任何形式的人工智能就像科幻小说一样。在未来数年内寻找与普通人工智能相关的更多公告。
元学习
最近,元学习出现在学术论文和博客中,出现频率很高。理论家和数据科学家尚未确定元学习的行业标准定义,因为它适用于人工智能,尽管该术语已经应用了一段时间。元学习涉及学习如何学习的系统。这些系统从以前的深度学习过程中提取和分析元数据,并从这些经验中学习。目的是创建一个能够将学习从一个领域推广到另一个领域的系统,从而向创建一般AI的方向迈进了一步。