hue(02)、Hue集成Hadoop集群(HDFS和YARN) 技术指南

在上文 hue(01)、Hue4.1的编译安装启动中,我们完整的进行了Hue的源码下载编译安装,Hue的web控制台与Hdfs、Hive、Hbase等集成才能展现它的魅力。本文我们在Hue中集成hadoop的hdfs和yarn服务，然后使用Hue操作和监控hadoop集群。

一、环境准备

1.hadoop集群（hadoop2.8.2）

2.hue4.1服务

二、集成配置

注意：以下1-4同样需要在其他的hadoop集群的节点上操作

1.修改hadoopde的hdfs-site.xml文件

修改hadoop的/etc/hadoop/目录下的hdfs-site.xml文件，在文件中加入以下配置：

<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>

<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>

2.修改hadoopde的core-site.xml文件

修改hadoop的/etc/hadoop/目录下的core-site.xml文件，在文件中加入以下配置：

<property>
<name>hadoop.proxyuser.hue.hosts</name>
<value>*</value>
</property>

<property>
<name>hadoop.proxyuser.hue.groups</name>
<value>*</value>
</property>

3.修改hadoopde的httpfs-site.xml文件

修改hadoop的/etc/hadoop/目录下的httpfs-site.xml文件，在文件中加入以下配置：

<property>
<name>httpfs.proxyuser.hue.hosts</name>
<value>*</value>
</property>

<property>
<name>httpfs.proxyuser.hue.groups</name>
<value>*</value>
</property>

4.修改hadoopde的yarn-site.xml文件

修改hadoop的/etc/hadoop/目录下的yarn-site.xml文件，在文件中加入以下配置：

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>432000</value>
</property>

5.修改hue的pseudo-distributed.ini文件集成hdfs

修改hue的/desktop/conf/目录下的pseudo-distributed.ini文件，对hadoop集群的hdfs配置如下：

fs_defaultfs=hdfs://hdpc01:9000

webhdfs_url=http://hdpc01:50070/webhdfs/v1

hadoop_conf_dir=/home/hadoop/hadoop-2.8.2/etc/hadoop

6.修改hue的pseudo-distributed.ini文件集成yarn

修改hue的/desktop/conf/目录下的pseudo-distributed.ini文件，对hadoop集群的yarn配置如下：

resourcemanager_host=hdpc01

resourcemanager_port=8032

submit_to=True

resourcemanager_api_url=http://hdpc01:8088

proxy_api_url=http://hdpc01:8088

history_server_api_url=http://hdpc01:19888

三、集成准备

1.启动hadoop集群

在主节点上启动hadoop集群start-all.sh

2.启动Hue服务

在hue的/bulid/env/bin/目录下 ./supervisor 启动hue服务

3.服务启动验证

验证hadoop集群启动

验证hue服务启动

四、集成使用

1.使用hue查看hdfs文件

点击hdfs图标，可以Open in Browser查看详细的文件列表信息，如下图：

2.查看单个文件详细的信息

在文件列表中点击文件可以查看这个文件详细的信息，如下图：

3.使用hue上传文件到hdfs中

我们这里上传bsck.txt文件到hdfs目录下，如下步骤：

首先，切换到hdfs目录下，点击upload上传文件按钮

然后，选择上传的back.txt文件到hdfs中即可看到

4.从hdfs上删除文件

我们删除刚刚上传到hdfs目录下的back.txt文件，先选中文件然后点击Delete forever按钮即可删除

5.hue中对hdfs文件的更多操作

我们选中文件点击Actions，可以看到下拉框中对文件的更多其他操作项，有下载、拷贝、移动、重命

名、修改权限等等

6.hue中查看MapReduce执行的Job

我们点击Jobs打开作业浏览面板，在这里可以看到执行中、执行完成、执行失败的作业信息，如下：

五、问题总结

1.关于hue集成hdfs的问题

在hue集成完成hadoop后，使用hue查看hdfs的时候，hue的控制面板总是提示如下错误：

解决办法：在hue中创建用户hdfs，并且设置未超级用户即可解决

2.关于进入hue提示连接10000端口服务异常

该问题是我们没有连接hive服务提示的异常，解决办法就是集成hive即可，详细见下篇博文

六、最后总结

通过文本在hue中集成hadoop集群（hdfs和yarn），并且在集成完成后进行了简单的使用，我们以后

可以有更好的方式操作hdfs和查看作业执行情况了，后面我们还将继续集成hive和mysql服务，文中有

不对的地方欢迎大家指出来

本文发表于2018年01月25日 16:32
(c)注：本文转载自https://my.oschina.net/zss1993/blog/1612906，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如有侵权行为，请联系我们，我们会及时删除.

阅读 3530 讨论 0 喜欢 0

快捷链接
网站地图
提交友链