1. Spark 概念

Apache Spark是一个大规模数据处理的统一分析引擎。

Apache Spark运行工作载荷在100倍速以上。

Apache Spark的组件包括:Spark SQL、Spark Streaming、MLib、GraphX。

Apache Spark应用模式:standalone、cluster mode, on EC2, on Hadoop YARN, on Mesos, or on Kubernetes

Apache Spark可存取数据: Access data in HDFS, Alluxio, Apache Cassandra, Apache HBase, Apache Hive, and hundreds of other data sources。

Apache Spark主页: http://spark.apache.org/

1. Spark 概念

 1. Spark 概念
