Hadoop安装摘要

junzhenchen

2012-10-22

关注关注

硬件环境:

3台老爷机，P3/1GB/64GB

软件系统：

ubuntu-12.04.1-server-i386安装时，选择安装OpenSSH、smb（文件共享)服务

jdk1.6.0_32

hadoop-1.0.3

hbase-0.94.2

zookeeper-3.4.4

相关配置

主机:－－－NameNode＆JobTracker

名称:hdfsmaster

IP:192.168.61.190

用户名:administrator

从机1－－－DataNode&TaskTracker

名称:hdfs01

IP:192.168.61.191

用户名:administrator

从机2－－－DataNode&TaskTracker

名称:hdfs02

IP:192.168.61.192

用户名:administrator

SSH互信内容，单身即可，不需要密码直接可以访问（第一次输入要Yes）

192.168.61.190-->192.168.61.191,192.168.61.192

1.启动root帐号

$sudopasswdroot

2.配置IP地址

修改文件/etc/network/interfaces添加以下内容：

autoeth0

ifaceeth0inetstatic

address192.168.61.191

netmask255.255.248.0

gateway192.168.60.1

3.应用scp，复制各种安装文件

$scp-rp/usr/local/java/[email protected]:/usr/local/java

4.安装JDK

$tar-xzvfhadoop-1.0.3.tar.gz

$sudochmod777jdk-6u32-linux-i586.bin

$./jdk-6u32-linux-i586.bin

5.配置JDK环境

修改/etc/profile文件，增加以下内容

#SETJAVAenvironment

exportJAVA_HOME=/usr/local/java/jdk1.6.0_32

exportCLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/classes12.jar

exportPATH=$PATH:$JAVA_HOME/bin

exportJRE_HOME=$JAVA_HOME/jre

#SETHADOOP

exportHADOOP_HOME=/usr/local/java/hadoop-1.0.3

exportPATH=$PATH:/usr/local/java/hadoop-1.0.3/bin

exportCLASSPATH=.:$CLASSPATH:$HADOOP_HOME

6.SSH环境互信

参考信息http://blog.csdn.net/laoyi19861011/article/details/6254743

6.1在主机hdfsmaster（192.168.61.190上操作）

$ssh-keygen-trsa##中间提示一直按回车到底

$cat.ssh/id_rsa.pub>>.ssh/authorized_keys

$cd.ssh

$ls-a##将见到以下3个文件或目录authorized_keysid_rsaid_rsa.pub

$sshlocalhost##测试是否不需要密码

6.2在需要互信的主机上操作

[email protected]:/home/administrator##把hdfsmaster中的id_rsa.pub拷贝到hdfs01中，其中administrator为用户名

6.3在从机hdfs01(192.168.61.191上操作)

$catid_rsa.pub>>.ssh/authorized_keys##注意这个要在/administrator目录中，完成这部之后，hdfsmaster访问hdfs01就不需要密码访问了。

7.检验sshd服务（要求服务一直启动）

$psaux

8.配置DNS，使应用机器名可以相互ping通

$sudovi/etc/hosts

增加以下内容：

192.168.61.190hdfsmaster

192.168.61.191hdfs01

192.168.61.192hdfs02

###127.0.1.1hdfsmaster－－－－－－－－－类似这个IP的都要注释掉

这里配置错了，会导致dataNode启动错误，见dataNode中的日志描述，会见到与主机(192.168.61.190)通讯上不。

9.修改hadoop-env.sh指明JDK的路径

$sudovihadoop-env.sh

内容：

exportJAVA_HOME=/usr/local/java/jdk1.6.0_32

10.修改conf/core-site.xml

<name>fs.default.name</name>

<value>hdfs://hdfsmaster:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/administrator/data/hdfs/tmp</value>

</property>

11.修改conf/hdfs-site.xml

<value>/home/administrator/data/hdfs/name</value>

</property>

<value>/home/administrator/data/hdfs/data</value>

</property>

<name>dfs.datanode.max.xcievers</name>

</property>

<name>dfs.replication</name>

</property>

12.修改conf/mapred-site.xml

<name>mapred.job.tracker</name>

<value>hdfsmaster:9001</value>

</property>

13.conf/masters

hdfsmaster

14.修改conf/slaves

hdfs01

hdfs02

15.将配置好的hadoop拷贝到所有的datanode

$scp-rp/usr/local/java/hadoop-1.0.3/[email protected]:/usr/local/java/hadoop-1.0.3

16.调整系统时间

$sudocp/usr/share/zoneinfo/Asia/Shanghai/etc/localtime

#中国国家授时中心服务器IP地址

$sudoapt-getinstallntpdate

$sudontpdate210.72.145.44

＃写入到Bios

$sudohwclock-w

测试

1.格式化一个新的分布式文件系统

$bin/hadoopnamenode-format

2.在分配的NameNode上，运行下面的命令启动HDFS,所有列出（${HADOOP_CONF_DIR}/slaves文件的内容）的slave上都被会启动DataNode守护进程

$bin/start-dfs.sh

3.在分配的JobTracker上，运行下面的命令启动Map/Reduce：,同理，相应的TaskTracker也会被启动

$bin/start-mapred.sh

4.停止HDFS（在DataNode机上操作）

$bin/stop-dfs.sh

5.停止JobTracker(在JobTracker上操作）

$bin/stop-mapred.sh

6.常用的hdfs命令参考http://www.classcloud.org/cloud/wiki/Hadoop_Lab2

查看目录

$hadoopfs-ls

7.运行例子

$hadoopfs-mkdirinput

$hadoopfs-putconf/input

$hadoopjarhadoop-examples-1.0.3.jargrepinput/confoutput'dfs[a-z.]+'

$hadoopjar$HADOOP_HOME/hadoop-examples-1.0.3.jarwordcountinput/confoutput18_04

8.重启或添加节点：在需要重启的客户机操作

$bin/hadoop-daemon.shstartdatanode

$bin/hadoop-daemon.shstarttasktracker

$bin/hadoop-daemon.shstopdatanode

$bin/hadoop-daemon.shstoptasktracker

ssh hadoop

junzhenchen

0 关注 0 粉丝 0 动态

关注关注

hadoop 3.2.x 高可用集群搭建

配置 hadoop 高可用集群的原因：如果集群只有一个 NameNode，若NameNode 节点出现故障，那么整个集群都无法使用，也就是存在单点故障的隐患，hadoop 高可用集群能够实现 standby NameNode 自动切换为 active。HA

飞鸿踏雪0 2020-06-12

hadoop安装教程

sudo vi /etc/hostname #修改主机名。安装openssh-server，所以需要自己安装一下服务端。输入 cd .ssh目录下，如果没有.ssh文件输入 ssh localhost生成。chmod 600 authorized_k

Elmo 2020-06-11

Navicat如何远程连接云服务器数据库

本来没有开启秘钥的远程服务器端数据库连接非常方便，就在新建连接上填入数据就ok了，但是开启SSH秘钥后的服务器连接有一个大坑，下面来详细讲讲。这里的SSH部分就好了，千万别急着测试。对了最后还要说一句，测试成功之后按确定之后，当你双击数据库的时候，有一件很

projava 2020-11-14

用docker运行postgreSQL的方法步骤

drwx------ 19 polkitd ssh_keys 4096 Jan 14 08:40 .drwxr-xr-x 3 root root 4096 Jan 14 08:33 ..drwx------ 5 polkitd ssh_keys 40

WanKaShing 2020-11-12

Linux ssh服务器配置代码实例

使用如下终端命令可以在 Linux 主机中安装 ssh服务器sudo apt-get install openssh-server. 1 upgraded, 5 newly installed, 0 to remove and 438 not upgrad

airfish000 2020-09-11

我用过的几款SSH客户端工具

最开始接触电脑的时候，是因为网络游戏，那时候就是只会用开关机和玩游戏，后来自学转行到IT界之后，就慢慢的接触到了Linux系统了。要远程操作Linux的话还是得靠SSH工具，一般来说，Linux是打开了默认22端口的SSH的服务端，如果我们要远程它的话，就

tryfind 2020-09-14

SSH只能用于远程Linux主机？那说明你见识太小了！

今天为大家分享一篇关于SSH 的介绍和使用方法的文章。本文从SSH是什么出发，讲述了SSH的基本用法，之后在远程登录、端口转发等多种场景下进行独立的讲述，希望能对大家有所帮助。SSH是一种网络协议，用于计算机之间的加密登录。最早的时候，互联网通信都是明文通

yegen00 2020-09-10

SSH只能用于远程Linux主机？那说明你见识太小了！

kkaazz 2020-09-03

学会这5招，让Linux排障更简单

Linux排障技巧在数据中心十分受人重视。数据中心专家对此提供了一些Linux服务器排障相关的性能问题、优化和便利工具参考。这些仅仅是大量Linux性能工具中的其中几个，可以利用这些工具来观察带宽、性能状态并进行动态追踪。这些工具听起来可能不起眼，但实施得

风语者 2020-09-02

win10下用ssh做端口转发时因为localhost解析引起的失败

这个命令在win7下面跑没有问题，但是win10下面跑，就总是不能成功。加上-v -v -v参数查看ssh的输出日志，发现存在read failed, write failed等日志。后面通过网络搜索得到提示，是不是localhost的解析不对。执行 pi

BraveWangDev 2020-08-19

使用VSCode的Remote-SSH连接Linux进行远程开发

首先打开你的VSCode，找到Extensions，搜索Remote，下载Remote-Developoment插件，会自动安装其他的Remote插件，其中会包含Remote-SSH：。进入设置，搜索ssh，找到并选中拓展中的Remote-SSH中的Sho

lichuanlong00 2020-08-15

解决VScode配置远程调试Linux程序的问题

最近在Linux上调程序，但是gdb使用属于入门阶段，主要是没有图形化界面直观。在网上查找了有两个方案可选，一个是通过VisualStudio2019的远程调试功能，因为最近一直在用VScode，所以没有试，之后有时间了可以试一下。本文介绍下这个方案。虽然

gsl 2020-08-15

CodeReview实践-Gerrit自动触发JenkinsCI

当前团队使用Gerrit来做代码管理、CodeReview。计划实现当review提交到了Gerrit并且review通过自动触发Jenkins流水线。以前接触Gitlab比较多，Gerrit还是第一次开始用，踩了点坑记录下来。本文主要讲述Gerrit T

pandaphinex 2020-08-09

Git配置及使用(使用云服务器）

本文主要提供一个完整的流程参考，对于一些细节或者基础的部分需要读者查阅其他文章，以免让阅读者迷惑，本文会做出适当提醒。a.先查看自己是否安装git或者其版本，如果安装了且版本较低则卸载，没安装则继续本节。git init --bare sample.git

yhuihon 2020-08-09

Ubuntu 20.04 Install SSH, Change SSH Port, Enable root

$ sudo apt install openssh-server$ systemctl status sshd$ sudo systemctl restart ssh$ sudo ufw allow ssh$ sudo systemctl enable

CheNorton 2020-08-02

xiangqiao 2020-07-28

ssh无法启动 (code=exited, status=255)

服务器运行了一些脚本后，突然发现无法ssh了。See "systemctl status ssh.service" and "journalctl -xe" for details.Systemd的功能是用于集中管理

hpujsj 2020-07-26

记录：部署Ansible，Ansible ad-hoc应用(1

准备如表-1所示的实验环境，操作系统为RHEL8，配置主机名称、IP地址、YUM源。ansible通过ssh远程被管理主机，将控制端的模块（脚本）或命令传输到被管理主机；最后ansible退出ssh远程。绝大多数模块（脚本）都需要参数才能执行成功！！！类似

hpujsj 2020-07-26

ssh配置、vscode使用及常用扩展

　　1.3 命令行输入cd .ssh进入目录，按下tab切换到id_rsa.pub文件回车即可打开，　　复制内容打开github，Settings > SSH and GPG keys > New SSh keys. 　　打开vscode，左

sshong 2020-07-19

华为华三思科交换机设置SSH登录

华为交换机：1.开启stelnet服务2.生成本地密钥对;3.配置远程登录的认证模式aaa和远程登录的协议ssh3.配置aaa的本地用户用户supadmin;4.配置SSH用户supadmin认证类型为password和服务类型为STelnet;syste

BraveWangDev 2020-07-19

安科网

Hadoop安装摘要

junzhenchen

junzhenchen

相关推荐

hadoop 3.2.x 高可用集群搭建

hadoop安装教程

Navicat如何远程连接云服务器数据库

用docker运行postgreSQL的方法步骤

Linux ssh服务器配置代码实例

我用过的几款SSH客户端工具

SSH只能用于远程Linux主机？那说明你见识太小了！

SSH只能用于远程Linux主机？那说明你见识太小了！

学会这5招，让Linux排障更简单

win10下用ssh做端口转发时因为localhost解析引起的失败

使用VSCode的Remote-SSH连接Linux进行远程开发

解决VScode配置远程调试Linux程序的问题

CodeReview实践-Gerrit自动触发JenkinsCI

Git配置及使用(使用云服务器）

Ubuntu 20.04 Install SSH, Change SSH Port, Enable root

ssh免密登陆相关配置

ssh无法启动 (code=exited, status=255)

记录：部署Ansible，Ansible ad-hoc应用(1

ssh配置、vscode使用及常用扩展

华为华三思科交换机设置SSH登录

junzhenchen