Informatica 9.5释放Hadoop潜能
全球领先的独立企业数据集成软件提供商Informatica公司(纳斯达克代码:INFA)近日宣布了Informatica 9.5的多项进展,使得Hadoop成为企业级之选。
通过交互性、生产力及可管理性,Informatica 9.5提供全新及扩展功能,释放了Hadoop的潜能,使用户能够提高大数据的投资回报:
· 通过数据接入拓展了其交互性,包括社交媒体数据,并且可将其通过批量或实时的方式导入Hadoop。
· 通过在Informatica中利用图形数据设计数据集成任务及流程,提高了生产力,并且可将设计直接部署在Hadoop中进行自主执行。
· 借助通用数据整合平台,提高了所有企业数据的可管理性,包括Hadoop中的数据。
Informatica首席技术官 James Markarian表示:“在IT环境中,Hadoop不可能作为一个孤岛存在。为了让Hadoop可以跨越不同平台并成为一种主流技术,用户需要将Hadoop作为他们IT大环境中的一部分来管理,通过Hadoop重复使用他们的开发技巧、资产及数据,并统筹管理全部数据。Informatica 9.5 为企业带来了他们所需的交互性、生产力以及可管理性,以便快速采用Hadoop并最大化他们的大数据投资回报。”
通过访问社交数据以扩展交互性,带来对Hadoop近乎实时的管理
鉴于社交计算继续急速增长的步伐,许多企业正在转向利用社交数据,从而更加清晰地洞悉用户及市场。Informatica 9.5 带来了扩展的社交数据集成功能,以帮助获取社交数据,并且可以以批量、数据流或者复制的方式将数据按任意延迟速度导入Hadoop中。新功能包括:
· 对社交数据更好的连接性:Informatica 9.5可提供对Twitter数据流的支持,以及一个数据流API支持RSS、ATOM或其它网页来源协议。
· 近乎实时的数据复制至Hadoop:Informatica 9.5 提供了Informatica 快速克隆及数据复制HDFS支持功能,以大量快照及近乎实时数据复制的方式将数据导入Hadoop。
通过在Informatica中进行设计并在Hadoop中自主运行,提高生产力
借助通用数据整合平台,Informatica 9.5进一步提高了企业集成并管理全部数据的能力,其核心在于通过在Informatica HParser中设计数据整合关键任务,然后在Hadoop中进行自主运行而无需编写代码。
为实现这个目标,针对大数据分析,Informatica 9.5 为Informatica HParser加入了增强的性能,包括:
· 通过Protobuf,为数据交互及系列格式提供拓展支持:借助Informatica 9.5,用户现在可以自主地进行Google Protobuf分析,并且通过Informatica HParser在Hadoop上进行转换。
在七月即将发布的Hadoop beta版本中,更多新的Hadoop-native功能可以带来更高的生产力,正式版本计划在2012年第四季度发布:
· 针对数据恢复、数据集成以及数据清洗的Native Hadoop支持。
· Hadoop自然语言处理(NLP) 功能提供了强大的社交数据处理及分析能力。
· Hadoop中的社交数据识别及处理功能可将对象相互关联并丰富主数据。
利用通用数据集成平台,提升所有数据的可管理性
如果没有企业级的管理功能,企业无法从Hadoop上获得全部收益。Informatica 9.5 为Hadoop带来了Informatica 的可管理性优势,包括:
· 针对Hadoop的基于策略的数据归档,可降低存储以及法规遵循的成本,并且通过丰富的企业历史信息带来新的洞察力。
· 对开发、部署、监控及管理Hadoop和非Hadoop任务提供混合负载支持,建立一个复合IT环境,该功能会在beta版本中出现。