相关文章推荐
低调的枇杷  ·  Boost Threadpool has ...·  3 月前    · 
成熟的番茄  ·  杭州市区中考名额分配生录取名单发布!有学校录 ...·  3 月前    · 
高兴的眼镜  ·  索马里语(索马里的官方语言之一,属于亚非语系 ...·  5 月前    · 
爱听歌的松树  ·  Fabric.js の使い方メモ·  5 月前    · 
星星上的苦瓜  ·  软件免杀教程_EXE文件-腾讯云开发者社区-腾讯云·  1 年前    · 
Code  ›  第5天:核心概念之SparkConf开发者社区
https://cloud.tencent.com/developer/article/1802133
逼格高的领结
2 年前
作者头像
会呼吸的Coder
0 篇文章

第5天:核心概念之SparkConf

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP
返回腾讯云官网
社区首页 > 专栏 > 会呼吸的Coder > 第5天:核心概念之SparkConf

第5天:核心概念之SparkConf

作者头像
会呼吸的Coder
发布 于 2021-03-16 10:22:11
621 0
发布 于 2021-03-16 10:22:11
举报

无论是集群还是单机应用,我们往往会需要将一些参数写入配置文件中,在Spark中实现这一功能的是SparkConf。

本文中将针对SparkConf进行讲解。

基本概念

SparkConf对象的基本结构如下:

class pyspark.SparkConf (
   loadDefaults = True, 
   _jvm = None, 
   _jconf = None
)

默认情况下,我们使用SparkConf()创建一个SparkConf对象时,它会加载spark.*名称的java文件中的变量作为配置文件信息。此外,我们可以设置一些参数来修改其行为。

对于一个SparkConf类,其包含一些内置的函数。例如,我们可以使用如下语句:

conf.setAppName(“PySpark App”).setMaster(“local”)

来修改应用名称和集群模式。但是需要注意的是,一旦我们将一个SparkConf对象传递给Spark集群后,此时则不再能够直接修改了。

SparkConf中一些常用的函数如下:

# 设置配置文件中变量
set(key, value)
# 设置spark的主节点url
setMaster(value)
# 设置app名称
setAppName(value)
# 查询配置文件中变量值
get(key, defaultValue=None)
# 设置worker节点中的Spark安装目录
setSparkHome(value)

入门实战

在接下来的实例中,我们将会简单的使用SparkConf对象。

 
推荐文章
低调的枇杷  ·  Boost Threadpool has memory leaks - C++ Forum
3 月前
成熟的番茄  ·  杭州市区中考名额分配生录取名单发布!有学校录取率100% 另有180名考生未被录取-杭州新闻中心-杭州网
3 月前
高兴的眼镜  ·  索马里语(索马里的官方语言之一,属于亚非语系库希特语族)_百度百科
5 月前
爱听歌的松树  ·  Fabric.js の使い方メモ
5 月前
星星上的苦瓜  ·  软件免杀教程_EXE文件-腾讯云开发者社区-腾讯云
1 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号