hadoop spark hive storm的发展过程
1、数据能存下来,hdfs(分布式文件系统)
2、能进行资源调度 yarn
3、能对存下来的大数据进行计算,mapreduce(多个硬盘同时处理)
4、更灵活更快的计算框架 spark sparksql
5、简化map reduce的开发, hive(使用sql的数据仓库)
6、机器学习 Mahout
7、实时处理 storm(缺点是只能处理事先定好的数据和逻辑)
基本架构:hdfs+yarn spark hive mahout
相关推荐
Oeljeklaus 2020-05-29
tugangkai 2020-05-09
eternityzzy 2020-07-19
archive 2020-05-28
zzjmay 2020-05-17
genshengxiao 2020-06-26
victorzhzh 2020-06-16
taisenki 2020-05-27
archive 2020-07-30
成长之路 2020-07-28
taisenki 2020-07-05
tugangkai 2020-07-05
SignalDu 2020-07-05
zlsdmx 2020-07-05
tomson 2020-07-05
tugangkai 2020-07-04