网站首页 > java教程 正文
导读:当我们搭建好远程Yarn集群环境之后想要对YARN集群进行一些操作时,Yarn官方给出了如:web board界面、YARN Commands、Java API、REST API等多种方式。在实际开发中如果想要在Windows本地idea中写代码后进行调试对远程YARN集群进行操作,则需要进行一些环境的配置。接下来本文将讨论如何在windows本地使用Java API的方式对远程Yarn进行监控。
搭建本地hadoop环境
1、下载所需hadoop版本(本例以hadoop-2.7.7 为例子)
2、需下载winutils.exe 和 hadoop.dll
//注:只适用于 2.7.X版本的Hadoop,其他Hadoop版本需自行下载对应版本
链接:https://pan.baidu.com/s/1MBuiESixe0i6rgoufoC6JA
提取码:m36r
3、把hadoop.dll和winutils.exe复制到解压后的hadoop文件夹的bin目录下
4、配置环境变量
//新增系统变量
HADOOP_HOME=D:\hadoop-2.7.3
//编辑CLASSPATH,主要以追加的形式
CLASSPATH=%HADOOP_HOME%\bin\winutils.exe;
//编辑PATH,主要以追加的形式
Path=%HADOOP_HOME%\bin
在项目的pom文件中引入依赖
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-yarn-client</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-yarn-api</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>${hadoop.version}</version>
</dependency>
将远程yarn集群的yarn-site.xml文件添加到项目resource目录下
编写监控程序
这里举一个简单的例子,实现轮询判断任务名为“Flink per-job cluster”的Job是否在yarn中运行,且状态为RUNNING:
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.yarn.api.records.ApplicationId;
import org.apache.hadoop.yarn.api.records.ApplicationReport;
import org.apache.hadoop.yarn.api.records.YarnApplicationState;
import org.apache.hadoop.yarn.client.api.YarnClient;
import org.apache.hadoop.yarn.conf.YarnConfiguration;
import org.apache.hadoop.yarn.exceptions.YarnException;
import java.io.IOException;
import java.util.ArrayList;
import java.util.EnumSet;
import java.util.List;
import java.util.concurrent.TimeUnit;
public class YarnMonitor {
/**
* 判断任务名为appName的任务,是否在yarn中运行,状态为RUNNING
* @return boolean
* @param appName
* @return
*/
public static boolean yarnIsContains(String appName) {
Configuration conf = new YarnConfiguration();
YarnClient yarnClient = YarnClient.createYarnClient();
yarnClient.init(conf);
yarnClient.start();
boolean isContains = false;
List<ApplicationReport> applications = new ArrayList<ApplicationReport>();
try {
applications = yarnClient.getApplications(EnumSet.of(YarnApplicationState.RUNNING));
for(ApplicationReport application:applications) {
String name = application.getName();
if(name.equals(appName)) {
System.out.println("ApplicationId ============> "+application.getApplicationId());
System.out.println("name ============> "+application.getName());
System.out.println("queue ============> "+application.getQueue());
System.out.println("queue ============> "+application.getUser());
System.out.println(applications);
isContains = true;
}
}
} catch (YarnException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
yarnClient.stop();
}
return isContains;
}
public static void main(String[] args) throws Exception {
while(true) {
TimeUnit.SECONDS.sleep(3);
boolean yarnIsContains = yarnIsContains("Flink per-job cluster");
System.out.println(yarnIsContains);
}
}
}
1、先启动任务后查看yarn的web board,任务名为“Flink per-job cluster”的Job状态为Running,正在运行。
2、执行程序,并查看到控制台输出结果为true
总结
- 搭建本地hadoop环境,包括对应版本的hadoop.dll和winutils.exe
- 项目中引入hadoop-client所需依赖
- 将远程yarn-site.xml文件添加到resource目录下
感谢您的阅读,如果喜欢本文欢迎关注和转发,本头条号将坚持持续分享IT技术知识。对于文章内容有其他想法或意见建议等,欢迎提出共同讨论共同进步
猜你喜欢
- 2024-11-24 如何追踪Java对象的访问?
- 2024-11-24 java项目本地部署JeecgBoot低代码开发平台Vue3版系统源码
- 2024-11-24 Java项目本地部署搭建实战SpringBoot高校宿舍管理系统源码
- 2024-11-24 Java项目本地搭建宝塔部署AI物品分类识别管理系统uniapp源码
- 2024-11-24 java本地线程ThreadLocal
- 2024-11-24 Java类加载过程
- 2024-11-24 Java项目本地部署宝塔搭建实战-医院HIS系统源码
- 2024-11-24 在Java程序中监听mysql的binlog
- 2024-11-24 快来试试这款一行代码实现多平台文件存储的工具!
- 2024-11-24 Java获取/检验IP
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)