Kudu Hadoop 数据存储系统 项目简介
Apache Kudu 简介为了应对先前发现的这些趋势,有两种不同的方式:持续更新现有的Hadoop工具或者重新设计开发一个新的组件。其目标是: 对数据扫描(scan)和随机访问(random access)同时具有高性能,简化用户复杂的混合架构; 高CPU效率,最大化先进处理器的效能; 高IO性能,充分利用先进永久存储介质; 支持数据的原地更新,避免额外的数据处理、数据移动我们为了实现这些目标,首先在现有的开源项目上实现原型,但是最终我们得出结论:需要从架构层作出重大改变。而这些改变足以让我们重新开发一个全新的数据存储系统。于是3年前开始开发,直到如今我们终于可以分享多年来的努力成果:Kudu,一个新的数据存储系统。