Spark是什么
Spark是一个无所不能的分布式计算框架
官网:
http://spark.apache.org/
Spark核心概念
RDD是分布式数据集合的抽象(结构上看是个行结构)
DataFrames and Datasets是对RDD的结构化抽象(结构上看是个二维表)
DStreams是对时间片的RDD集合的抽象(结构上看是个空间上的行结构)
Structured Streaming是对时间片的DataFrames and Datasets的结构化抽象(结构上看是个空间上的二维表)
Spark SQL是对抽象的结构化数据提供一种SQL查询的能力,是对计算的抽象
kafka+spakr+redis案例