频道栏目
首页 > 资讯 > 云计算 > 正文

Spark入门解析

18-10-12        来源:[db:作者]  
收藏   我要投稿

Spark是什么

Spark是一个无所不能的分布式计算框架

官网:

http://spark.apache.org/

Spark核心概念

RDD是分布式数据集合的抽象(结构上看是个行结构)

DataFrames and Datasets是对RDD的结构化抽象(结构上看是个二维表)

DStreams是对时间片的RDD集合的抽象(结构上看是个空间上的行结构)

Structured Streaming是对时间片的DataFrames and Datasets的结构化抽象(结构上看是个空间上的二维表)

Spark SQL是对抽象的结构化数据提供一种SQL查询的能力,是对计算的抽象

kafka+spakr+redis案例

相关TAG标签
上一篇:linux中的grep,sed,awk
下一篇:均值归一化问题
相关文章
图文推荐

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站