hadoop distcp 整个文件夹

关注 mob6454cc68959c

hadoop distcp 整个文件夹

转载

mob6454cc68959c 2024-09-13 14:22:46

文章标签 hadoop distcp 整个文件夹 hadoop 服务器 xml 文章分类 Hadoop 大数据

对解压过后的文件进行从命名

hadoop distcp 整个文件夹_xml

把"/usr/hadoop"读权限分配给hadoop用户（非常重要）

hadoop distcp 整个文件夹_hadoop_02

配置完之后我们要创建一个tmp文件供以后的使用

hadoop distcp 整个文件夹_xml_03

然后对我们的hadoop进行配置文件的配置

vim /etc/profile

hadoop distcp 整个文件夹_hadoop_04

最下边的两行就是我们的hadoop文件的配置内容

hadoop distcp 整个文件夹_hadoop_05

重新启动配置文件。

之后要配置hadoop的hadoop-env.sh文件

hadoop distcp 整个文件夹_服务器_06

添加如下内容、

hadoop distcp 整个文件夹_hadoop distcp 整个文件夹_07

保存退出即可

hadoop distcp 整个文件夹_hadoop_08

我们接下来要配置core-site.xml、hdfs-site.xml、mapred-site.xml三个文件了。

通过命令

hadoop distcp 整个文件夹_服务器_09

对文件进行编辑

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/hadoop/tmp</value>
                <description>A base for other temporary directories.</description>
    </property>
<!-- file system properties -->
    <property>
        <name>fs.default.name</name>
        <value>hdfs://192.168.9.199:9000</value>
    </property>
</configuration>
同样的方法编辑hdfs-site.xml
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
        </property>
<configuration>
注解：因为只有一台Slave1所以配置value为1
编辑mapred-site.xml
<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>http://192.168.9.199:9001</value>
    </property>
</configuration>

在我们的Master和Slave1上都要进行master主服务器ip地址的配置

hadoop distcp 整个文件夹_服务器_10

hadoop distcp 整个文件夹_服务器_11

把我们的master的ip地址写入进去，这里在Master服务器和Slave1上都是要配置的

通过一下方式我们可以查看配置的效果

hadoop distcp 整个文件夹_hadoop distcp 整个文件夹_12

这个时候我们发现配置已经成功了

下面我们还要在我们的主服务器上进行特殊的配置（只有主服务器才进行该配置）

hadoop distcp 整个文件夹_xml_13

hadoop distcp 整个文件夹_hadoop distcp 整个文件夹_14

把我们的Slave1的服务器ip地址写入，有几台从服务器就要写入几次。

可以通过

hadoop distcp 整个文件夹_xml_15

查看我们配置的效果。

同样的道理我们也要在Slave1上进行hadoop的配置，这样才能把环境搭建好，通过以上的四部，进本是所有的需要的配置我们已经搭建完毕了。

（注解中间的配置有些地方是借鉴的博客园里的图片，跟真事的稍微有差别，到时候如果进行hadoop集群的搭建最好是去博客园把他的博客系列简单看看，不然只看我的配置，可能会中间出现不少问题，如果linux基础好的话，上手更快，一般都要花上至少三天的时间来完成两台服务器的搭建的呢）

配置完成之后下面就是要做hadoop的启动了

1）格式化HDFS文件系统

　　在"Master.Hadoop"上使用普通用户hadoop进行操作。（备注：只需一次，下次启动不再需要格式化，只需 start-all.sh）

hadoop distcp 整个文件夹_xml_16

这个时候我们的的格式化已经成功了，但是有一个警告，可以在网上查一下简单的配置就解决了。

2）启动hadoop

在启动前关闭集群中所有机器的防火墙，不然会出现datanode开后又自动关闭。

service iptables stop

关闭防火墙。

使用下面的命令进行启动

start-all.sh

hadoop distcp 整个文件夹_hadoop_17

以上工作做完之后没有问题的话我们的hadoop就算是正式启动成功了。

下面我们可以通过两个命令查看是否成功

第一种方式

hadoop distcp 整个文件夹_服务器_18

第二种方式

hadoop distcp 整个文件夹_服务器_19

这个时候都看一看出来我们的配置已经成功了。

我们还可以通过访问我们的Master的ip地址在浏览器中查看我们的集群的情况

访问"http:192.168.9.199:50030"

访问"http:192.168.9.199:50070"

hadoop distcp 整个文件夹_xml_21

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：mysql是否能将数据库数据分开存储

下一篇：python 界面qt开发

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册