博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark 的四种模式
阅读量:6142 次
发布时间:2019-06-21

本文共 1696 字,大约阅读时间需要 5 分钟。

1.spark主要有四种运行模式:Local、standalone、yarn、mesos。

  1)Local模式:在一台机器上,一般用于开发测试

  2)standalone模式:完全独立的spark集群,不依赖其他集群,分为Master和work。

    客户端向Master注册应用,Master向work发送消息,依次启动Driver,executor,Driver负责向executors发送任务消息。

  3)yarn模式:依赖于hadoop集群,yarn资源调度框架,将应用提交给yarn,在ApplactionMaster(相当于Stand alone模式中的Master)中运行driver,在集群上调度资源,开启excutor执行任务。

  4)Spark on Mesos模式:类似于yarn模式,运行在Mesos集群上(是下的分布式资源管理框架,它被称为是分布式系统的。Mesos最初是由的AMPLab开发的,后在得到广泛使用。)

2、启动方式:sparkShell

spark-shell通过不同的参数控制采用何种模式进行。 涉及两个参数:

--master MASTER_URL         spark://host:port, mesos://host:port, yarn, or local.--deploy-mode DEPLOY_MODE   Whether to launch the driver program locally ("client") or                            on one of the worker machines inside the cluster ("cluster")                            (Default: client).

  1)本地模式

./spark-shell --master local./spark-shell --master local[2]  # 本地运行,两个worker线程,理想状态下为本地CPU core数

  2)standalone模式

./spark-shell --master spark://192.168.1.10:7077

  3)yarn模式

./spark-shell --master yarn./spark-shell --master yarn-client#不支持这种模式#./spark-shell --master yarn-cluster./spark-shell --master yarn --deploy-mode client#不支持这种模式#./spark-shell --master yarn --deploy-mode cluster

spark job部署模式:

通过启动spark-submit 形式提交作业任务时通过自定参数来指定作业部署模式。

eg:

//client模式 spark-submit --master yarn --deploy-mode client --class xxx --executor-memory 1g --executor-cores 2 --num-executors 4 xxx.jar 1000 //cluster模式spark-submit --master yarn --deploy-mode cluster --class xxx --executor-memory 1g --executor-cores 2 --num-executors 4 xxx.jar 1000

------------------------

1.client

driver程序运行在client端。

2.cluster

driver程序运行在某个worker上。

注:spark-shell只能以client方式启动。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

 

转载于:https://www.cnblogs.com/yanxun1/p/9782929.html

你可能感兴趣的文章
RocketMQ服务搭建
查看>>
微信支付 - 可以下单但是无法收到通知消息Log总显示begin notify
查看>>
分享我如何活用notepad++
查看>>
Object-c的基础概念
查看>>
自我关系的建立
查看>>
mysql读取配置文件的顺序
查看>>
《游戏程序设计模式》 2 - 顺序模式
查看>>
数据过滤器注解@Filter 如何在hibernate、spring data jpa中调用
查看>>
Eclipse上GIT插件EGIT使用手册之九_Rebase和Merge的区别
查看>>
关闭进程中打印信息
查看>>
安装memcached软件并用简单脚本做测试
查看>>
MySQL表新增字段默认值处理的一处小细节
查看>>
MEMCACHE TIME_WAIT过多的解决方法
查看>>
linux下安装telnet(centos7)
查看>>
HTML基础标签大全
查看>>
[转] thrift的使用介绍
查看>>
Code里面的对立统一
查看>>
python爬取智联招聘职位信息(多进程)
查看>>
骑士飞行棋 C#代码详解
查看>>
Java核心技术卷1—— 目录
查看>>