greenplum + pgsql和Hadoop+hive+hbase
在做的项目用的架构是greenplum+postgresql,Hadoop+Hive+hbase模式
A. Hadoop + Hive
支持新增节点,过程中不需要重启
支持jdbc访问hive数据库
支持sql的方式获取数据
在技术过程中,数据是以批量的方式来执行。如果Hadoop集群中架设了tez引擎,则计算数据会提高不少
如果想支持即席查询,则需要drill,impala组件辅助
集群规模可达到上万
容灾性比较好,一两台机器出现问题不影响整体
可视化工具方面比较少,常用hue,zepplin等
能与当前的Hadoop生态其他组件完全融合,有很多弹性的选择。
开源生态最健壮
B. GreenPlum + PostGreSQL
支持新增节点,但过程中需要重启
集群规模很少有上千的,一般都是几十上百台
支持jdbc访问数据库
支持sql的方式获取数据
支持即席查询
与当前的传统BI工具可很好的结合
相关推荐
eternityzzy 2020-07-19
genshengxiao 2020-06-26
victorzhzh 2020-06-16
archive 2020-05-28
taisenki 2020-05-27
archive 2020-07-30
成长之路 2020-07-28
taisenki 2020-07-05
tugangkai 2020-07-05
SignalDu 2020-07-05
zlsdmx 2020-07-05
tomson 2020-07-05
tugangkai 2020-07-04
tomson 2020-07-05
Zhangdragonfly 2020-06-28
成长之路 2020-06-26