资讯安全论坛下载读书程序开发数据库系统网络电子书微信学院站长学院 QQ 考试

频道栏目

云计算| 安全资讯| 安全公告| 病毒预警| 人物| 企业招聘| 其他综合|

首页 > 资讯 > 云计算 > 正文

云计算中RDDs的特性简单分析

17-10-19 来源：[db:作者]

收藏我要投稿

云计算中RDDs的特性简单分析。

血统关系图

Spark维护这RDDs之间的依赖关系和创建关系，叫做血统关系图

spark使用血统关系图计算每个RDD的需求和恢复丢失的数据

代表着RDD是怎么获得的，而且又做了什么操作

作用：丢失时可以找回

延迟计算：

spark对RDDs的计算是他们第一次使用action操作的时候

处理大数据时非常有用，可以减少数据的传输

spark内部记录metadata表明transformation操作已经被响应了

加载数据也是延迟计算，数据只有在必要时，才被加载进去

RDD.persist() 持久化

默认每次在RDDs上进行action操作时，spark都会重新计算RDDs

如果想重复利用一个RDD，可以使用RDD.persist()

unpersist()方法从缓存中移出

RDD.persist()

缓存级别，

memory only，空间占用高，cpu低

disk only,空间低，CPU高

memory-disk，内存放不下时候，往硬盘里放，空间高，CPU中

memory-disk-ser内存中放不下，往硬盘放，内存中数据是序列化的，空间低，CPU高。

点击复制链接与好友分享!回本站首页

相关TAG标签

上一篇：云计算openstack中的neutron分析

下一篇：plSQL连接远程服务器的方法

相关文章

热门专题推荐 vmware win7激活工具 win10激活工具 excel word office激活小马激活工具重装系统数据恢复 u盘启动工具

图文推荐

文章

推荐

· 不掉线的路由器！路由特殊技术分析！

· 如何通过路由器来控制上网

· 宽带路由器故障巧排除

· 关于忘记Cisco交换机路由器口令后如何

· 远程管理路由器注意“安全”

· 路由器端口映射的原理及设置方法介绍

· 教你用路由器日志快速定位及排除故障

· 教你设置无线路由提高无线网BT下载速

· win7激活工具

· win10激活工具

· win7激活工具旗舰版

· office2010激活密钥

· windows7激活密钥

· office2010激活工具

· 小马激活工具

· win10激活工具

热门新闻

· 锤子坚果Pro发布后，罗永浩哭了

· 想实习的大学党看过来!这些科技巨头最

· 罗永浩锤子发布会抢先消息：锤子科技新

· Google新一代系统Fuchsia OS界面曝光

· 中国唯一连续运营20余年的网络游戏，还

· iPhone都便宜了为何国产手机越来越贵

· 丢人！谷歌和Facebook竟被虚假企业电邮

· 中国移动支付震惊日本网友为什么美国

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站