greenplum + pgsql和Hadoop+hive+hbase

在做的项目用的架构是greenplum+postgresql,Hadoop+Hive+hbase模式

 A. Hadoop + Hive 
支持新增节点,过程中不需要重启
支持jdbc访问hive数据库
支持sql的方式获取数据
在技术过程中,数据是以批量的方式来执行。如果Hadoop集群中架设了tez引擎,则计算数据会提高不少
如果想支持即席查询,则需要drill,impala组件辅助
集群规模可达到上万
容灾性比较好,一两台机器出现问题不影响整体
可视化工具方面比较少,常用hue,zepplin等
能与当前的Hadoop生态其他组件完全融合,有很多弹性的选择。
开源生态最健壮

B. GreenPlum + PostGreSQL
支持新增节点,但过程中需要重启
集群规模很少有上千的,一般都是几十上百台
支持jdbc访问数据库
支持sql的方式获取数据
支持即席查询
与当前的传统BI工具可很好的结合

相关推荐