kafka与spark应用
kafka主要是用来做日志收集,可以收集用户的流量,点击行为,kafka目前版本是1.0的,其0.9的版本坑特别多,推荐大家使用0.8.2.1版本,正是spark1.6.2集成的kafka版本,非常稳定。以下是本人录制的spark与kafka做实时流计算的视频课程。
1、spark与kafka的介绍
2、spark的集群安装
3、Spark RDD函数讲解与实战分析
4、Spark 的java操作实现简单程序
5、SparkRDD原理详细剖析播放
6、Spark 机器学习,API阅读
7、Kafka架构介绍以及集群安装
8、Kafka生产者Producer的实战
9、Kafka消费者Consumer剖析与实战
10、Kafka复杂消费者的详细讲解
11、Kafka数据安全,以及Spark Kafka Streaming API
12、Spark+Kafka+Mysql整合
13、Spark 机器学习ALS设计
14、Spark ALS协同过滤java实战
15、Spark ALS给用户推荐产品
16、Spark机器学习后存储到Mysql
17、Spark读取Kafka流构建Als模型
18、Spark处理Kafka流构建Als模型
19、Spark处理Kafka流实现实时推荐算法
20、Spark学习经验总结,spark2与spark1的区别,下期预告
大象在线分享spark+kafka实时流机器学习实战视频,由夜行侠老师精心录制
http://www.itjoin.org/course/detail/57aa8938b52a8f0ddbd81763