hue(02)、Hue集成Hadoop集群(HDFS和YARN)


声明:本文转载自https://my.oschina.net/zss1993/blog/1612906,转载目的在于传递更多信息,仅供学习交流之用。如有侵权行为,请联系我,我会及时删除。

        在上文 hue(01)、Hue4.1的编译安装启动 中,我们完整的进行了Hue的源码下载编译安装,Hue的web控制台与Hdfs、Hive、Hbase等集成才能展现它的魅力。本文我们在Hue中集成hadoop的hdfs和yarn服务,然后使用Hue操作和监控hadoop集群。

一、环境准备

         1.hadoop集群(hadoop2.8.2)

         2.hue4.1服务

二、集成配置

         注意:以下1-4同样需要在其他的hadoop集群的节点上操作

         1.修改hadoopde的hdfs-site.xml文件

             修改hadoop的/etc/hadoop/目录下的hdfs-site.xml文件,在文件中加入以下配置:

             <property>
                      <name>dfs.webhdfs.enabled</name>
                      <value>true</value>
             </property>

             <property>
                       <name>dfs.permissions.enabled</name>
                       <value>false</value>
             </property>

              

         2.修改hadoopde的core-site.xml文件

             修改hadoop的/etc/hadoop/目录下的core-site.xml文件,在文件中加入以下配置 :            

             <property>
                       <name>hadoop.proxyuser.hue.hosts</name>
                       <value>*</value>
             </property>

             <property>
                       <name>hadoop.proxyuser.hue.groups</name>
                       <value>*</value>
             </property>

                       

          3.修改hadoopde的httpfs-site.xml文件

              修改hadoop的/etc/hadoop/目录下的httpfs-site.xml文件,在文件中加入以下配置 : 

              <property>
                        <name>httpfs.proxyuser.hue.hosts</name>
                        <value>*</value>
              </property>

              <property>
                        <name>httpfs.proxyuser.hue.groups</name>
                        <value>*</value>
              </property>

                            

          4.修改hadoopde的yarn-site.xml文件

              修改hadoop的/etc/hadoop/目录下的yarn-site.xml文件,在文件中加入以下配置 :

              <property>
                        <name>yarn.log-aggregation-enable</name>
                        <value>true</value>
              </property>

              <property>
                        <name>yarn.log-aggregation.retain-seconds</name>
                        <value>432000</value>
              </property>

              

          5.修改hue的pseudo-distributed.ini文件集成hdfs

              修改hue的/desktop/conf/目录下的pseudo-distributed.ini文件,对hadoop集群的hdfs配置如下:

              fs_defaultfs=hdfs://hdpc01:9000

              webhdfs_url=http://hdpc01:50070/webhdfs/v1

              hadoop_conf_dir=/home/hadoop/hadoop-2.8.2/etc/hadoop

              

          6.修改hue的pseudo-distributed.ini文件集成yarn

              修改hue的/desktop/conf/目录下的pseudo-distributed.ini文件,对hadoop集群的yarn配置如下:   

              resourcemanager_host=hdpc01

              resourcemanager_port=8032

              submit_to=True

              resourcemanager_api_url=http://hdpc01:8088

              proxy_api_url=http://hdpc01:8088

              history_server_api_url=http://hdpc01:19888   

              

三、集成准备

         1.启动hadoop集群

            在主节点上启动hadoop集群start-all.sh

            

        2.启动Hue服务

            在hue的/bulid/env/bin/目录下 ./supervisor 启动hue服务

            

        3.服务启动验证

            验证hadoop集群启动                 

            

            验证hue服务启动

            

四、集成使用

         1.使用hue查看hdfs文件

             点击hdfs图标,可以Open in Browser查看详细的文件列表信息,如下图:

             

         2.查看单个文件详细的信息

             在文件列表中点击文件可以查看这个文件详细的信息,如下图:

             

         3.使用hue上传文件到hdfs中

             我们这里上传bsck.txt文件到hdfs目录下,如下步骤:

             首先,切换到hdfs目录下,点击upload上传文件按钮

                       

             然后,选择上传的back.txt文件到hdfs中即可看到

                

         4.从hdfs上删除文件

            我们删除刚刚上传到hdfs目录下的back.txt文件,先选中文件然后点击Delete forever按钮即可删除

             

         5.hue中对hdfs文件的更多操作

             我们选中文件点击Actions,可以看到下拉框中对文件的更多其他操作项,有下载、拷贝、移动、重命

             名、修改权限等等

             

         6.hue中查看MapReduce执行的Job

            我们点击Jobs打开作业浏览面板,在这里可以看到执行中、执行完成、执行失败的作业信息,如下:

            

五、问题总结

         1.关于hue集成hdfs的问题

             在hue集成完成hadoop后,使用hue查看hdfs的时候,hue的控制面板总是提示如下错误:

                     

            解决办法:在hue中创建用户hdfs,并且设置未超级用户即可解决

            

         2.关于进入hue提示连接10000端口服务异常

             

             该问题是我们没有连接hive服务提示的异常,解决办法就是集成hive即可,详细见下篇博文

六、最后总结

         通过文本在hue中集成hadoop集群(hdfs和yarn),并且在集成完成后进行了简单的使用,我们以后

         可以有更好的方式操作hdfs和查看作业执行情况了,后面我们还将继续集成hive和mysql服务,文中有

         不对的地方欢迎大家指出来

本文发表于2018年01月25日 16:32
(c)注:本文转载自https://my.oschina.net/zss1993/blog/1612906,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权行为,请联系我们,我们会及时删除.

阅读 2616 讨论 0 喜欢 0

抢先体验

扫码体验
趣味小程序
文字表情生成器

闪念胶囊

你要过得好哇,这样我才能恨你啊,你要是过得不好,我都不知道该恨你还是拥抱你啊。

直抵黄龙府,与诸君痛饮尔。

那时陪伴我的人啊,你们如今在何方。

不出意外的话,我们再也不会见了,祝你前程似锦。

这世界真好,吃野东西也要留出这条命来看看

快捷链接
网站地图
提交友链
Copyright © 2016 - 2021 Cion.
All Rights Reserved.
京ICP备2021004668号-1