YARN的入门介绍

拂晓

2018-07-18

关注关注

1.YARN生产背景

MapReduce1.x存在的问题:

1.单点故障&节点压力大不易扩展&不支持mapreduce以外的计算框架（spark,storm)

在MapReduce1.x下的架构：MapReduce：Master/Slave架构，1个JobTracker带多个 TaskTracker

JobTracker：负责资源管理和作业调度

TaskTracker:定期向JT汇报本节点的健康状况、资源使用情况、作业执行情况

接收来自JT的命令：启动任务/杀死任务

单点故障：整个集群中只有一个JobTracker如果JT挂掉了全部TT都完蛋了

2.资源利用率&运维成本

由于在MapReduce1.x的架构加只能跑MapReduce，所以想要用其他的计算框架就必须在搭建支持其他计算框架的集群，

YARN的入门介绍

所以由上面的图产生了共享集群的意愿，同时催生了YARN：不同的计算框架可以共享同一个HDFS集群上的数据，

YARN的入门介绍

2.YARN概述

3.YARN架构（重点，需复述）

YARN的入门介绍

1.REsourceManager:RM

整个集群同一时间提供服务的RM只有一个，负责集群资源的统一管理和调度

处理客户端的请求：提交一个作业、杀死一个作业

监控我们的NM，一旦某个NM挂了，那么该NM上运行的任务需要告诉我们的AM来如何处理

2.NodeManager:NM

整个集群中有多个，负责自己本身节点资源管理和使用

定时向RM汇报本节点的资源使用情况

接受并处理来自RM的各种命令：启动Container

处理来自AM的命令

单个节点的资源管理是由它自己管理，通过心跳机制告诉RM

3.ApplicationMaster:AM

每个应用程序对应一个：MR、Spark,负责应用程序的管理

为应用程序向RM申请资源（core、memory），分配给内部task

需要与NM进行通信：启动/停止task的运行，task试运行在container里面，AM也是运行在Container里面

4.Container

封装了CPU、Memory等资源的一个容器

是一个任务运行环境的抽象

5.Client

提交作业

查询作业的运行进度

杀死作业

4.YARN执行流程

YARN的入门介绍

5.YARN环境搭建

1.使用版本：hadoop-2.6.0-cdh5.7.0

2.修改配置文件

cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
vim yarn-site.xml

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

修改mapred-site.xml

cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
#如果没有mapred-site.xml需要拷贝一份 mapred-site.xml.template
cp mapred-site.xml.template mapred-site.xml
vim mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

3.启动ResourceManager和NodeManager进程

cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/sbin
./start-yarn.sh

4.验证

jps

应当出现：ResourceManager和NodeManager

浏览器：http://hadoop000:8088

5.停止YARN相关的进程

cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/sbin
./stop-yarn.sh

6.提交作业到YARN上执行

#1 进入到该目录下：
cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce
#2 通过命令提交mapReduce作业到YARN上运行：
hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar pi 2 3

yarn

拂晓

0 关注 0 粉丝 0 动态

关注关注

在Ubuntu和其他Linux发行版上使用Yarn

本速成教程向你展示了在 Ubuntu 和 Debian Linux 上安装 Yarn 包管理器的官方方法。你还将学习到一些基本的 Yarn 命令以及彻底删除 Yarn 的步骤。Facebook 声称 Yarn 比 npm 更快、更可靠、更安全。与 npm

yegen00 2020-10-21

三、大数据组件之Yarn

YARN是Hadoop2.0中的资源管理系统，它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务：一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceMana

Notzuonotdied 2020-09-17

yarn 查看资源 core 内存

这个命令句就可以 , 查看集群的资源情况 , 包括正在使用的情况.

xieting 2020-08-17

第一个Vue页面

安装完后，打开cmd命令行界面。安装yarn(fackbook依赖管理工具与Npm功能一样，推荐使用！！！--- 是否安装vue路由 -->. --- 是否启动ESLint代码检测 -->. --- 是否设置单元测试 -->. --- 是

hline 2020-07-29

hadoop框架三大组件hdfs、mapreduce、yarn 内容

1）分布式的运算程序往往需要分成至少2个阶段。2）第一个阶段的MapTask并发实例，完全并行运行，互不相干。3）第二个阶段的ReduceTask并发实例互不相干，但是他们的数据依赖于上一个阶段的所有MapTask并发实例的输出。4）MapReduce编程

tomli 2020-07-26

Hadoop Yarn工作机制 Job提交流程

MR程序提交到客户端所在的节点。YarnRunner向ResourceManager申请一个Application。RM将该应用程序的资源路径返回给YarnRunner。RM将用户的请求初始化成一个Task。其中一个NodeManager领取到Task任务

xieting 2020-07-04

Hive llap服务安装说明及测试（二）

因为Apache Slider 已经不维护了，下面介绍不使用 Slider 的 LLAP使用方式。

xieting 2020-06-28

Vue开发中cnpm,yarn,npm,nodejs 区别与关系

yarn是Facebook公司出品的用于管理nodejs包的一款软件。yarn是为了弥补 npm 的一些缺陷而出现的，建议使用yarnnpm是随同nodejs一起安装的包管理工具。cnpm是淘宝 npm镜像，更快。

YarnSup 2020-06-28

Yarn架构

资源的分配与调度。管理单个节点上的资源。为应用程序申请资源并分配给内部任务。任务的监控和容错。Container：封装了每个节点的多维度资源

tomli 2020-06-21

Hadoop

8.在2008年，Doug加入了Yahoo，开源了Hadoop，在Yahoo期间设计实现了Pig、HBase等框架

HJWZYY 2020-06-21

使用Taro实现小程序商城的购物车功能模块的实例代码

Taro是一套遵循React语法规范的多端开发解决方案。现如今市面上端的形态多种多样，Web、React-Native、微信小程序等各种端大行其道，当业务要求同时在不同的端都要求有所表现的时候，针对不同的端去编写多套代码的成本显然非常高，这时候只编写一套代

flyingbird 2020-06-14

[email protected]配合antd UI使用，自定义主题

// 使用react-app-rewired customize-cra就不用暴露webpack等配置文件。const { override, fixBabelImports, addLessLoader } = require;// style: tru

Notzuonotdied 2020-06-13

Yarn 和 NPM 国内快速镜像（淘宝镜像）

如果在前端开发使用 NPM 或者 YARN 下载过程中碰到网速非常慢，可以配置国内淘宝镜像来提升下载速度。

HJWZYY 2020-06-07

记学习react-native

　　根据文档中的内容，安装Node,Python2,JDK, Android Studio,npm全局安装Yarn。具体配置和环境变量配置也按文档来的。　　不过在创建新项目的时候使用react-native init项目名时一直报错，有报ETIMEOUT，

xieting 2020-05-29

如何在Ubuntu 20.04上安装Yarn

在Ubuntu上安装Yarn非常简单。我们将启用官方的Yarn存储库，导入存储库GPG密钥，然后安装该软件包。该存储库得到了一致的维护，并提供了最新版本。如果您通过nvm安装了Node槽，请使用以下命令跳过Node.js的安装：。系统上安装的版本可能与上面

tomli 2020-05-27

查看npm和yarn 的镜像源和配置淘宝镜像源

#npm：npm config get registry #yarn：yarn config get registry

xieting 2020-05-26

create-react-app + Typescript脚手架搭建

在react-app-env.d.ts文件中新增（否则将无法正常使用less module！！！

tomli 2020-05-25

设置yarn源修改为淘宝源

和npm修改淘宝源的的步骤差不多

tomli 2020-05-14

npm与yarn常用命令对比

npm init yarn init // 初始化。npm i x --S | --save yarn add x // 安装生产依赖并保存包名。np

tomli 2020-05-11

大数据 Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统，简称HDFS。Hadoop的框架最核心的设计就是：HDFS

strongyoung 2020-05-09

安科网

YARN的入门介绍

拂晓

拂晓

相关推荐

在Ubuntu和其他Linux发行版上使用Yarn

三、大数据组件之Yarn

yarn 查看资源 core 内存

第一个Vue页面

hadoop框架三大组件hdfs、mapreduce、yarn 内容

Hadoop Yarn工作机制 Job提交流程

Hive llap服务安装说明及测试（二）

Vue开发中cnpm,yarn,npm,nodejs 区别与关系

Yarn架构

Hadoop

使用Taro实现小程序商城的购物车功能模块的实例代码

[email protected]配合antd UI使用，自定义主题

Yarn 和 NPM 国内快速镜像（淘宝镜像）

记学习react-native

如何在Ubuntu 20.04上安装Yarn

查看npm和yarn 的镜像源和配置淘宝镜像源

create-react-app + Typescript脚手架搭建

设置yarn源修改为淘宝源

npm与yarn常用命令对比

大数据 Hadoop

拂晓