1. Spark 概念
Apache Spark是一个大规模数据处理的统一分析引擎。
Apache Spark运行工作载荷在100倍速以上。
Apache Spark的组件包括:Spark SQL、Spark Streaming、MLib、GraphX。
Apache Spark应用模式:standalone、cluster mode, on EC2, on Hadoop YARN, on Mesos, or on Kubernetes。
Apache Spark可存取数据: Access data in HDFS, Alluxio, Apache Cassandra, Apache HBase, Apache Hive, and hundreds of other data sources。
Apache Spark主页: http://spark.apache.org/
相关推荐
sxyhetao 2020-06-12
hovermenu 2020-06-10
Johnson0 2020-07-28
rongwenbin 2020-06-15
Johnson0 2020-06-08
Hhanwen 2020-05-29
Hhanwen 2020-05-29
adayan0 2020-05-19
Johnson0 2020-05-17
登峰小蚁 2020-05-11
Hhanwen 2020-05-04
Hhanwen 2020-05-03
Oeljeklaus 2020-04-20
Hhanwen 2020-07-26
zhixingheyitian 2020-07-19
yanqianglifei 2020-07-07
Hhanwen 2020-07-05