如何利用HDFS来解决SparkOnYarn模式解决Jar乱飞情况
本篇内容主要讲解“如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况”吧!
创新互联自2013年创立以来,是专业互联网技术服务公司,拥有项目网站建设、成都网站建设网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元罗甸做网站,已为上家服务,为罗甸各地企业和个人服务,联系电话:18980820575
Spark的jar包比较多,如果直接修改spark的jars目录中的jar可能对用户造成jar包冲突,也不利于管理,因为可以利用HDFS存储功能解决jar问题
1、在本地创建zip文件,压缩jar包
# 进入到spark的jars目录,在spark的jars目录下压缩包
zip spark.zip ./*
2、HDFS上创建存放spark jar目录
hdfs dfs -mkdir -p /spark-yarn/jars
3、将$SPARK_HOME/jars下的spark.zip包上传至刚健的HDFS路径
[hadoop@hadoop jars]$ hdfs dfs -put ./spark.zip /spark-yarn/jars/
4、在spark-defaults.conf中添加(也可以在启动时候 -conf 指定)
spark.yarn.archive hdfs://ruozedata001:9000/spark-jars/spark.zip
5、查看Spark log
yarn log -applicationID xxx
https://www.cnblogs.com/chhyan-dream/p/12799856.html
https://blog.csdn.net/naruto00001/article/details/79578520
到此,相信大家对“如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况”有了更深的了解,不妨来实际操作一番吧!这里是创新互联网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
文章标题:如何利用HDFS来解决SparkOnYarn模式解决Jar乱飞情况
文章分享:http://azwzsj.com/article/ijhpde.html