1200字范文 > Hadoop HA集群搭建(3台阿里云)

Hadoop HA集群搭建(3台阿里云)

时间：2019-06-20 22:57:24

文章目录

一阿里云主机（3台）1.1 选择云服务器ECS1.2 创建实例1.3 基本配置1.4 网络和安全组1.5 系统配置1.6 确认实例1.7 实例列表二环境准备2.1 用户和目录准备2.2 软件准备2.3 ip与hostname绑定2.4 设置3台机器ssh免密通信三安装jdk四安装ZooKeeper五安装Hadoop5.1 解压（3台机器）5.2 配置环境变量(3台机器)5.3 配置hadoop-env.sh5.4 配置core-site.xml5.5 配置hdfs-site.xml5.6 配置mapred-site.xml5.7 配置yarn-site.xml5.8 slaves 六启动Hadoop6.1 启动JournalNode (三台机器)6.2 格式化namenode6.3 同步元数据6.4 初始化zkfc6.5 启动hdfs分布式存储系统6.6 启动yarn6.7 启动jobhistory 七关闭集群八再次启动集群

一阿里云主机（3台）

注册和充值这里就不演示了，我们需要购买3台机器，然后选择按量付费，搭建完之后可以摧毁

1.1 选择云服务器ECS

1.2 创建实例

1.3 基本配置

1.4 网络和安全组

1.5 系统配置

1.6 确认实例

1.7 实例列表

二环境准备

主机规划

2.1 用户和目录准备

创建用户

useradd hadoop

切换hadoop用户

su - hadoop

mkdir app data lib maven_repos script software source tmp

2.2 软件准备

百度网盘：链接:/s/1NUghNdmkjiC6sRenfxAKlg 密码:ffj4

然后通过crt或者xshell上传到3台机器的/home/hadoop/software

2.3 ip与hostname绑定

先把3台机器都切换回root用户，然后执行下面的命令，注意：ip地址用内网ip

echo '#ip与hostname绑定' >> /etc/hostsecho '172.19.94.117 hadoop001' >> /etc/hostsecho '172.19.94.119 hadoop002' >> /etc/hostsecho '172.19.94.118 hadoop003' >> /etc/hosts

我们看下有没有添加进去

2.4 设置3台机器ssh免密通信

1.先切换hadoop用户

su - hadoop

2.执行下面命令，出现提示时，连续三次回车

ssh-keygen

然后家目录下会出现.ssh文件夹，.ssh文件夹有下面2个文件，带有.pub的为公钥

3.在.ssh目录下创建authorized_keys文件，并把3台机器的公钥id_rsa.pub都追加进去，如下图

4.三台机器分别执行面命令

ssh hadoop001 datessh hadoop002 datessh hadoop003 date

执行的时候，会让输入yes/no，输入yes即可，因为第一需要验证下

到这里三台机器的ssh免密信任就ok了

三安装jdk

首先三台机器都切换到root用户

1.创建目录

mkdir /usr/java

2.解压jdk

tar -zxvf /home/hadoop/software/jdk-8u45-linux-x64.gz -C /usr/java

3.配置环境变量

echo 'export JAVA_HOME=/usr/java/jdk1.8.0_45' >> /etc/profileecho 'export PATH=$JAVA_HOME/bin:$PATH' >> /etc/profile

4.生效环境

source /etc/profile

5.改变jdk的用户和用户组为root

chown -R root:root /usr/java/*

6.查看是否安装成功

java -version

四安装ZooKeeper

首先三台机器都切换为hadoop用户

su - hadoop

1.解压zookeeper（3台机器同时）

tar -zxvf ~/software/zookeeper-3.4.6.tar.gz -C ~/app/

2.切换到app下（3台机器同时）

cd ~/app

3.创建软连接（3台机器同时）

ln -s zookeeper-3.4.6 zookeeper

4.修改配置文件（hadoop001机器上做）

先进入conf文件家

cd ~/app/zookeeper/conf

拷贝一份zoo_sample.cfg

cp zoo_sample.cfg zoo.cfg

编辑zoo.cfg

vi zoo.cfg

修改dataDir路径

dataDir=/home/hadoop/data/zookeeper

添加server地址

server.1=hadoop001:2888:3888server.2=hadoop002:2888:3888server.3=hadoop003:2888:3888

如下图

5.把zoo.cfg配置文件拷贝到另外两台机器(在hadoop001机器上做)

scp ~/app/zookeeper/conf/zoo.cfg hadoop002:/home/hadoop/app/zookeeper/conf/scp ~/app/zookeeper/conf/zoo.cfg hadoop003:/home/hadoop/app/zookeeper/conf/

6.创建dataDir目录（3台机器一起）

上面配置的dataDir目录还没有创建

mkdir ~/data/zookeeper

7.创建myid（每台机器不一样）

给每台机器一个id，不然每台机器都不知道自己的id是多少

hadoop001机器执行：

echo 1 > ~/data/zookeeper/myid

hadoop002机器执行：

echo 2 > ~/data/zookeeper/myid

hadoop003机器执行：

echo 3 > ~/data/zookeeper/myid

8.配置环境变量(3台机器一起)

echo '#zookeeper 环境变量' >> ~/.bash_profileecho 'export ZOOKEEPER_HOME=/home/hadoop/app/zookeeper' >> ~/.bash_profileecho 'export PATH=$ZOOKEEPER_HOME/bin:$PATH' >> ~/.bash_profile

9.生效环境变量（3台机器一起）

source ~/.bash_profile

10.启动zookeeper(3台机器)

zkServer.sh start

11.查看zookeeper状态

zkServer.sh status

hadoop001状态：

hadoop002状态

hadoop003状态

五安装Hadoop

首先切换回hadoop用户（3台机器）

su - hadoop

5.1 解压（3台机器）

tar -zxvf ~/software/hadoop-2.6.0-cdh5.15.1.tar.gz -C ~/app/

在app目录下创建软连接

cd ~/appln -s hadoop-2.6.0-cdh5.15.1 hadoop

查看目录

5.2 配置环境变量(3台机器)

终端输入下面的配置，追加到.bash_profile文件中

echo '#hadoop 环境变量' >> ~/.bash_profileecho 'export HADOOP_HOME=/home/hadoop/app/hadoop' >> ~/.bash_profileecho 'export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH' >> ~/.bash_profile

查看是否追加成功

然后生效

source ~/.bash_profile

检查是否生效

5.3 配置hadoop-env.sh

在hadoop001机器，进入配置文件所在目录

cd ~/app/hadoop/etc/hadoop

修改hadoop-evn.sh的JAVA_HOME变量

把修改好的文件发送到另外两台机器hadoop002和hadoop003

scp hadoop-env.sh hadoop002:/home/hadoop/app/hadoop/etc/hadoop/scp hadoop-env.sh hadoop003:/home/hadoop/app/hadoop/etc/hadoop/

5.4 配置core-site.xml

core-site.xml文件内容比较多，在win或者mac里修改好之后，再上传到服务器

<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>fs.defaultFS</name><value>hdfs://ruozeclusterg7</value></property><property><name>fs.trash.checkpoint.interval</name><value>0</value></property><property><name>fs.trash.interval</name><value>1440</value></property><property> <name>hadoop.tmp.dir</name><value>/home/hadoop/tmp/hadoop</value></property><property><name>ha.zookeeper.quorum</name><value>hadoop001:2181,hadoop002:2181,hadoop003:2181</value></property><property><name>ha.zookeeper.session-timeout.ms</name><value>2000</value></property><property><name>hadoop.proxyuser.hadoop.hosts</name><value>*</value> </property> <property> <name>hadoop.proxyuser.hadoop.groups</name> <value>*</value> </property> <property><name>pression.codecs</name><value>org.apache.press.GzipCodec,org.apache.press.DefaultCodec,org.apache.press.BZip2Codec,org.apache.press.SnappyCodec</value></property></configuration>

配置文件中tmp目录需要创建，并赋予777权限(三台机器都执行)

mkdir ~/tmp/hadoopchmod -R 777 ~/tmp/hadoop

5.5 配置hdfs-site.xml

hdfs-site.xml文件内容比较多，在win或者mac里修改好之后，再上传到服务器

<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>dfs.permissions.superusergroup</name><value>hadoop</value></property><property><name>dfs.webhdfs.enabled</name><value>true</value></property><property><name>dfs.namenode.name.dir</name><value>/home/hadoop/data/dfs/name</value><description> namenode 存放name table(fsimage)本地目录（需要修改）</description></property><property><name>dfs.namenode.edits.dir</name><value>${dfs.namenode.name.dir}</value><description>namenode粗放 transaction file(edits)本地目录（需要修改）</description></property><property><name>dfs.datanode.data.dir</name><value>/home/hadoop/data/dfs/data</value><description>datanode存放block本地目录（需要修改）</description></property><property><name>dfs.replication</name><value>3</value></property><property><name>dfs.blocksize</name><value>134217728</value></property><property><name>dfs.nameservices</name><value>ruozeclusterg7</value></property><property><name>dfs.ha.namenodes.ruozeclusterg7</name><value>nn1,nn2</value></property><property><name>dfs.namenode.rpc-address.ruozeclusterg7.nn1</name><value>hadoop001:8020</value></property><property><name>dfs.namenode.rpc-address.ruozeclusterg7.nn2</name><value>hadoop002:8020</value></property><property><name>dfs.namenode.http-address.ruozeclusterg7.nn1</name><value>hadoop001:50070</value></property><property><name>dfs.namenode.http-address.ruozeclusterg7.nn2</name><value>hadoop002:50070</value></property><property><name>dfs.journalnode.http-address</name><value>0.0.0.0:8480</value></property><property><name>dfs.journalnode.rpc-address</name><value>0.0.0.0:8485</value></property><property><name>dfs.namenode.shared.edits.dir</name><value>qjournal://hadoop001:8485;hadoop002:8485;hadoop003:8485/ruozeclusterg7</value></property><property><name>dfs.journalnode.edits.dir</name><value>/home/hadoop/data/dfs/jn</value></property><property><name>dfs.client.failover.proxy.provider.ruozeclusterg7</name><value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value></property><property><name>dfs.ha.fencing.methods</name><value>sshfence</value></property><property><name>dfs.ha.fencing.ssh.private-key-files</name><value>/home/hadoop/.ssh/id_rsa</value></property><property><name>dfs.ha.fencing.ssh.connect-timeout</name><value>30000</value></property><property><name>dfs.ha.automatic-failover.enabled</name><value>true</value></property><property><name>dfs.hosts</name><value>/home/hadoop/app/hadoop/etc/hadoop/slaves</value></property></configuration>

5.6 配置mapred-site.xml

mapred-site.xml文件内容比较多，在win或者mac里修改好之后，再上传到服务器

<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapreduce.jobhistory.address</name><value>hadoop001:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>hadoop001:19888</value></property><property><name>mapreduce.press</name> <value>true</value></property><property><name>mapreduce.press.codec</name> <value>org.apache.press.SnappyCodec</value></property></configuration>

5.7 配置yarn-site.xml

yarn-site.xml文件内容比较多，在win或者mac里修改好之后，再上传到服务器

<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.nodemanager.localizer.address</name><value>0.0.0.0:23344</value><description>Address where the localizer IPC is.</description></property><property><name>yarn.nodemanager.webapp.address</name><value>0.0.0.0:23999</value><description>NM Webapp address.</description></property><property><name>yarn.resourcemanager.connect.retry-interval.ms</name><value>2000</value></property><property><name>yarn.resourcemanager.ha.enabled</name><value>true</value></property><property><name>yarn.resourcemanager.ha.automatic-failover.enabled</name><value>true</value></property><property><name>yarn.resourcemanager.ha.automatic-failover.embedded</name><value>true</value></property><property><name>yarn.resourcemanager.cluster-id</name><value>yarn-cluster</value></property><property><name>yarn.resourcemanager.ha.rm-ids</name><value>rm1,rm2</value></property><property><name>yarn.resourcemanager.scheduler.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value></property><property><name>yarn.resourcemanager.recovery.enabled</name><value>true</value></property><property><name>yarn.app.mapreduce.am.scheduler.connection.wait.interval-ms</name><value>5000</value></property><property><name>yarn.resourcemanager.store.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value></property><property><name>yarn.resourcemanager.zk-address</name><value>hadoop001:2181,hadoop002:2181,hadoop003:2181</value></property><property><name>yarn.resourcemanager.zk.state-store.address</name><value>hadoop001:2181,hadoop002:2181,hadoop003:2181</value></property><property><name>yarn.resourcemanager.address.rm1</name><value>hadoop001:23140</value></property><property><name>yarn.resourcemanager.address.rm2</name><value>hadoop002:23140</value></property><property><name>yarn.resourcemanager.scheduler.address.rm1</name><value>hadoop001:23130</value></property><property><name>yarn.resourcemanager.scheduler.address.rm2</name><value>hadoop002:23130</value></property><property><name>yarn.resourcemanager.admin.address.rm1</name><value>hadoop001:23141</value></property><property><name>yarn.resourcemanager.admin.address.rm2</name><value>hadoop002:23141</value></property><property><name>yarn.resourcemanager.resource-tracker.address.rm1</name><value>hadoop001:23125</value></property><property><name>yarn.resourcemanager.resource-tracker.address.rm2</name><value>hadoop002:23125</value></property><property><name>yarn.resourcemanager.webapp.address.rm1</name><value>hadoop001:8088</value></property><property><name>yarn.resourcemanager.webapp.address.rm2</name><value>hadoop002:8088</value></property><property><name>yarn.resourcemanager.webapp.https.address.rm1</name><value>hadoop001:23189</value></property><property><name>yarn.resourcemanager.webapp.https.address.rm2</name><value>hadoop002:23189</value></property><property><name>yarn.log-aggregation-enable</name><value>true</value></property><property><name>yarn.log.server.url</name><value>http://hadoop001:19888/jobhistory/logs</value></property><property><name>yarn.nodemanager.resource.memory-mb</name><value>2048</value></property><property><name>yarn.scheduler.minimum-allocation-mb</name><value>1024</value><discription>单个任务可申请最少内存，默认1024MB</discription></property><property><name>yarn.scheduler.maximum-allocation-mb</name><value>2048</value><discription>单个任务可申请最大内存，默认8192MB</discription></property><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>2</value></property></configuration>

5.8 slaves

内容如下：

hadoop001hadoop002hadoop003

六启动Hadoop

6.1 启动JournalNode (三台机器)

先要在journalNode节点上启动JournalNode进程

hadoop-daemon.sh start journalnode

6.2 格式化namenode

格式化hadoop001的机器

hadoop namenode -format

只有第一次启动需要先格式化

6.3 同步元数据

同步hadoop001元数据到hadoop002

要保证两个namenode的元数据保持一致

scp -r ~/data/dfs/name hadoop002:/home/hadoop/data/dfs

6.4 初始化zkfc

hdfs zkfc -formatZK

6.5 启动hdfs分布式存储系统

在hadoop001执行：

start-dfs.sh

因为datanode是从节点，要去读取slaves文件，我们看看slaves文件信息和类型

有问题，因为我们这个文件是放在win上面写的，所以需要用dos2unix转换下

yum install -y dos2unixdos2unix $HADOOP_HOME/etc/hadoop/slaves

我们再查看文件ok了

把文件拷贝到另外两台机器

scp slaves hadoop002:/home/hadoop/app/hadoop/etc/hadoopscp slaves hadoop003:/home/hadoop/app/hadoop/etc/hadoop

然后我们再启动hdfs

start-dfs.sh

如下图：启动成功

我们看下hadoop001的web端，状态为active

我们再看下hadoop002的web端，状态为standby

6.6 启动yarn

在hadoop001执行：

start-yarn.sh

如下图：hadoop002的rm好像没启动成功

我们看下，hadoop002的rm果然没启动成功

这里是个坑，我们要在hadoop002机器手动启动

yarn-daemon.sh start resourcemanager

我们查看hadoop001的web端：http://47.103.149.67:8088

查看hadoop002的web端：http://47.103.146.169:8088/cluster/cluster

6.7 启动jobhistory

mr-jobhistory-daemon.sh start historyserver

主要用来查看job的历史情况，web如下：http://47.103.149.67:19888/jobhistory

七关闭集群

1.关闭Hadoop (YARN->HDFS)

[hadoop@hadoop001 ~]# mr-jobhistory-daemon.sh stop historyserver[hadoop@hadoop001 sbin]# stop-yarn.sh[hadoop@hadoop002 sbin]# yarn-daemon.sh stop resourcemanager [hadoop@hadoop001 sbin]# stop-dfs.sh

2.关闭Zookeeper

[hadoop@hadoop001 bin]# zkServer.sh stop[hadoop@hadoop002 bin]# zkServer.sh stop[hadoop@hadoop003 bin]# zkServer.sh stop

八再次启动集群

1.启动 Zookeeper

[hadoop@hadoop001 bin]# zkServer.sh start [hadoop@hadoop002 bin]# zkServer.sh start [hadoop@hadoop003 bin]# zkServer.sh start

2.启动Hadoop

[hadoop@hadoop001 sbin]# start-dfs.sh[hadoop@hadoop001 sbin]# start-yarn.sh[hadoop@hadoop002 sbin]# yarn-daemon.sh start resourcemanager[hadoop@hadoop001 ~]# mr-jobhistory-daemon.sh start historyserver

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。