Spark 编程指南简体中文版
白天
夜间
首页
下载
阅读记录
书签管理
我的书签
添加书签
移除书签
RDD 持久化
来源 aiyanbo
浏览
135
扫码
分享
2022-06-25 09:00:43
RDD 持久化
RDD 持久化
Spark 有一个最重要的功能是在内存中
持久化
(或
缓存
)一个数据集。
若有收获,就点个赞吧
0 人点赞
上一篇:
下一篇:
Spark 编程指南简体中文版
Summary
在YARN上运行Spark
Spark独立部署模式
提交应用程序
GraphX编程指南
例子
开始
图算法
图构造者
图操作符
Pregel API
属性图
顶点和边RDDs
Spark配置
概论
从这里开始
初始化 Spark
引入 Spark
弹性分布式数据集 (RDDs)
Actions
外部数据集
并行集合
传递函数到 Spark
RDD 操作
RDD 持久化
RDD 持久化
Transformations
使用键值对
共享变量
快速上手
独立应用程序
使用 Spark Shell
开始翻滚吧!
Spark SQL
与Apache Hive的兼容性
Shark用户迁移指南
数据源
Hive表
JSON数据集
Parquet文件
RDDs
开始
其它SQL接口
性能调优
Spark SQL数据类型
编写语言集成(Language-Integrated)的相关查询
Spark Streaming
一个快速的例子
基本概念
缓存或持久化
Checkpointing
自定义receiver指南
部署应用程序
离散流(DStreams)
flume集成指南
初始化StreamingContext
输入DStreams和receivers
kafka集成指南
Kinesis集成指南
关联
监控应用程序
DStreams上的输出操作
DStream中的转换(transformation)
容错语义
性能调优
内存调优
减少批数据的执行时间
设置正确的批容量
暂无相关搜索结果!
让时间为你证明
分享,让知识传承更久远
×
文章二维码
×
手机扫一扫,轻松掌上读
文档下载
×
请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
PDF
文档
EPUB
文档
MOBI
文档
书签列表
×
阅读记录
×
阅读进度:
0.00%
(
0/0
)
重置阅读进度
×
思维导图备注