栏目分类:
子分类:
返回
终身学习网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
终身学习网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop补充之Azkaban自动化调度实现

大数据系统 更新时间:发布时间: 百科书网 趣学号

目录

一、数据清洗调度

1.上传所需jar包

2.job文件写入

二、数据入库且数据分析调度

1.job文件写入

2.上传sql文件 

3.打包

三、实现自动化

1.开启exec服务

 2.激活exec服务

3.开启web服务 

4.登录Azkaban 

5.新建一个项目上传压缩包

 6.查看项目结构

8.运行出错 

9.重新运行无效

 10.Mr阶段运行成功

 11.Hive阶段检查出代码有误漏写分号

 12.查看结果


一、数据清洗调度

1.上传所需jar包

2.job文件写入

二、数据入库且数据分析调度

1.job文件写入

2.上传sql文件 

3.打包

三、实现自动化

在开启azkaban调度前将hive数据仓库中的weblog数据库删除

1.开启exec服务

 2.激活exec服务

curl -G "localhost: 38978/executor?action=activate" && echo

3.开启web服务 

4.登录Azkaban 

5.新建一个项目上传压缩包

 6.查看项目结构

7.开始运行

8.运行出错 

查阅多个资料,需要指定azkaban.native.lib地址

9.重新运行无效

将azkaban.properties文件中azkaban.jobtype.plugin.dir的路径改为绝对路径

 10.Mr阶段运行成功

 11.Hive阶段检查出代码有误漏写分号

修改重新打包重新运行,运行成功

 12.查看结果

转载请注明:文章转载自 www.051e.com
本文地址:http://www.051e.com/it/746692.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 ©2023-2025 051e.com

ICP备案号:京ICP备12030808号