在win7上安装配置Hadoop伪分布式集群

Shibuwodai

2013-10-10

关注关注

1、 安装虚拟机和操作系统

VMware-workstation-full-10.0.0 下载VMware

ubuntu-12.04.3-server-amd64.iso 下载ubuntu

2、 设置root用户密码

sudo passwd root

3、 上传文件

利用WinSCP上传JDK和HADOOP文件，利用putty连接虚拟机中的ubuntu，下载WinSCP，下载putty，下载jdk，下载hadoop

4、 配置JDK和HADOOP

tar -xzvf jdk-7u40-linux-x64.tar.gz

tar -xzvf hadoop-1.2.1.tar.gz

sudo vi /etc/profile

增加：

export JAVA_HOME=/home/ysc/jdk1.7.0_40

export PATH=$PATH:$JAVA_HOME/bin: /home/ysc/hadoop-1.2.1/bin

source /etc/profile

5、配置HADOOP

配置主机名称及网络

vi /etc/hostname

指定名称为host001

vi /etc/hosts

替换内容为：192.168.137.128 host001

同时加入C:\Windows\System32\drivers\etc\hosts文件

查看是否启用IPV6：

cat /proc/sys/net/ipv6/conf/all/disable_ipv6

显示0说明ipv6开启，1说明关闭

关闭ipv6的方法：

sudo vi /etc/sysctl.conf

增加下面几行，并重启

#disable IPv6

net.ipv6.conf.all.disable_ipv6 = 1

net.ipv6.conf.default.disable_ipv6 = 1

net.ipv6.conf.lo.disable_ipv6 = 1

配置SSH

cd /home/ysc

sudo apt-get install openssh-server

ssh-keygen -t rsa（密码为空，路径默认）

cp .ssh/id_rsa.pub .ssh/authorized_keys

ssh host001

yes

cd hadoop-1.2.1

配置HADOOP环境变量

vi conf/hadoop-env.sh

增加：

export JAVA_HOME=/home/ysc/jdk1.7.0_40

配置HADOOP运行参数

vi conf/masters

改localhost为host001

vi conf/slaves

改localhost为host001

vi conf/core-site.xml

<name>fs.default.name</name>

</property>

<name>hadoop.tmp.dir</name>

</property>

vi conf/hdfs-site.xml

<value>/home/ysc/dfs/filesystem/name</value>

</property>

<value>/home/ysc/dfs/filesystem/data</value>

</property>

<name>dfs.replication</name>

</property>

vi conf/mapred-site.xml

<name>mapred.job.tracker</name>

</property>

<name>mapred.tasktracker.map.tasks.maximum</name>

</property>

<name>mapred.tasktracker.reduce.tasks.maximum</name>

</property>

<name>mapred.system.dir</name>

<value>/home/ysc/mapreduce/system</value>

</property>

<name>mapred.local.dir</name>

<value>/home/ysc/mapreduce/local</value>

</property>

格式化名称节点并启动集群

hadoop namenode -format

启动集群并查看WEB管理界面

start-all.sh

访问http://host001:50030可以查看 JobTracker 的运行状态

访问http://host001:50060可以查看 TaskTracker 的运行状态

访问http://host001:50070可以查看 NameNode 以及整个分布式文件系统的状态，浏览分布式文件系统中的文件以及 log 等

hadoop jar hadoop-1.2.1/contrib/streaming/hadoop-streaming-1.2.1.jar -inputinput -output output-streaming -mapper/bin/cat -reducer /usr/bin/wc

hadoop jar hadoop-1.2.1/hadoop-examples-1.2.1.jar wordcount input output

停止集群

stop-all.sh

target hadoop winscp

Shibuwodai

0 关注 0 粉丝 0 动态

关注关注

jQuery UI组件库使用技巧小分享，让移动、Web界面开发更简单！

EdwardSiCong 2020-11-23

一款免费开源的通用数据库工具DBeaver

在制作《SQL 入门教程》时，接触到了这款非常强大易用的数据库管理和开发工具：DBeaver，也就是上面这个可爱的小河狸。DBeaver 是一个基于 Java 开发，免费开源的通用数据库管理和开发工具，使用非常友好的 ASL 协议。可以通过官方网站或者 G

yungpheng 2020-10-19

JavaScript是如何成为一门严肃的编程语言的

从最开始作为一种使网站变得漂亮的方式，JavaScript 已转变为一种严肃的编程语言。JavaScript 的卑微起步始于 1995 年，是由当时在 Netscape 通信公司工作的 Brendan Eich在短短 10 天内创建的。在其早期，JavaS

jipengx 2020-11-12

如何在树莓派上安装Ubuntu服务器？

树莓派是最著名的单板计算机。最初，树莓派项目的范围旨在促进学校和发展中国家的计算机基础科学的教学。它的低成本、便携性和极低的功耗，使得它的受欢迎程度远远超过预期。从气象站到家庭自动化，玩家们用树莓派搭建了许多酷炫的项目。第四代树莓派具备了普通台式电脑的功能

橄榄 2020-11-03

信必优承接全球最大搜索引擎公司多语言本地化测试项目外包

该公司是一家位于美国的跨国科技企业，业务包括互联网搜索、云计算、广告技术等，同时开发并提供大量基于互联网的产品与服务，旗下的软件每一个都是精品。信必优因其丰富的互联网行业的成功实践经验及深厚的全球化、本地化知识的沉淀，有幸成为该客户的全球服务的软件提供商，

lyqdanang 2020-11-02

界面控件开发包DevExpress 2020年重大版本——v20.2震撼发布

DevExpress Universal Subscription拥有.NET开发需要的所有平台控件，包含600多个UI控件、报表平台、DevExpress Dashboard eXpressApp 框架、适用于 Visual Studio的CodeRus

wservices 2020-10-30

使用Ansible的Kubernetes模块实现容器编排自动化

将 Kubernetes 与 Ansible 结合实现云端自动化。此外，还可以参照我们的 Ansible 的 k8s 模块速查表。Ansible是实现自动化工作的优秀工具，而Kubernetes则是容器编排方面的利器，要是把两者结合起来，会有怎样的效果呢？

onepiecedn 2020-10-29

在 Linux 上使用 yum 设置 ZFS

在 Fedora 上使用 yum 仓库来获取最新的 ZFS 特性。我是一名 Fedora Linux 用户，我每天都会运行yum upgrade。虽然这个习惯使我能够运行所有最新的软件，但它也会提醒ZFS存储平台和新内核之间的不兼容性。作为一名开发者，有时

数据人 2020-10-26

DevExpress Winform开发：解决旧UI要求的新方法

DevExpress Winforms Controls内置140多个UI控件和库，完美构建流畅、美观且易于使用的应用程序。在先前的版本中，需要“side navigation” 功能的应用程序经常依赖DevExpressWinForms NavBarCo

dfphoto 2020-10-16

Linux黑话解释：什么是显示服务器，用来做什么？

hackerlpy 2020-09-07

在树莓派3上安装Fedora

在树莓派上运行 Fedora。树莓派基金会这几年来生产了很多型号。本文的安装过程已经在第三代树莓派上进行了测试：3B v1.2和B+。这些是已经发布了几年的信用卡大小的树莓派。你需要一些硬件组件，包括树莓派。8 GB 或更大容量的 micro-SD 卡。在

tianyayi 2020-08-16

mybatis的两种日志

由于太多，我就简单介绍和配置一下我自己使用的日志；JBoss 6 VFS API is not available in this environment.

Dullonjiang 2020-08-15

大数据获取案例：Python网络爬虫实例

网络爬虫，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。用来获取新冠肺炎的实时数据。使用的工具PyCharm新建Python文件，命名为get_data使用爬虫最常用的request模

fengling 2020-08-15

docker服务以及配置文件详解

1、dockerd&起动docker后怎样终止。

pigsmall 2020-08-11

Python下使用Altair数据制图

Altair 作为一个 Python 数据制图库，提供了优雅的接口及自有的绘图语言。Python 中的绘图库提供了呈现数据的多种方式，可以满足你不同的偏好，如灵活性、布局、易用性，或者特殊的风格。和其它方式相比，我发现，Altair 提供的是一种不同的解决

wordmhg 2020-08-06

如何在华为云上部署部署中文聊天机器人

我用华为云上部署了这个程序. 为啥选华为云, 因为华为云是免费使用30天的.关于怎么上华为云, 申请免费的云耀服务器, , 在这里不在赘述.简单说一下步骤, 只说最关键的步骤, 我就不上图了,其中一些技巧, , 也不再这里赘述.7 访问X.X.X.X, 已

guotiaotiao 2020-08-06

Cent os 7之KVM虚拟化基础管理

[ ~]# yum -y groupinstall "GNOME Desktop" #安装GNOME桌面环境。[ ~]# yum -y install qemu-kvm-tools # KVM调试工具，可不安

zhangsyi 2020-07-28

pyjnius：访问java类

Pyjnius是一个用于访问Java类的Python库。注意jnius的版本管理有点混乱，目前看来选择jniusx比较好。如果出现ImportError，一般是java环境变量或者path没有配置好。pip 安装不成功可以尝试　setup.py方式。jni

千锋 2020-07-27

REST是什么？RESTFul又是什么？这二者的关系是怎样的？

是一种针对网络应用的设计和开发方式，可以降低开发的复杂性，提高系统的可伸缩性。客户端和服务器之间的交互在请求之间是无状态的。从客户端到服务器的每个请求都必须包含理解请求所必需的信息。如果服务器在请求之间的任何时间点重启，客户端不会得到通知。无状态请求可以由

ahnjwj 2020-07-28

DevSecOps和敏捷软件开发有什么不同？

你更专注于安全性还是软件交付，还是可以两者兼得？技术社区中存在一种趋势，经常互换地使用 DevSecOps 和敏捷软件开发这两个术语。尽管它们有一些相似性，例如都旨在更早地检测风险，但在改变团队的工作方式层面有很大不同。DevSecOps 建立在敏捷开发建

coolham 2020-07-25

安科网

在win7上安装配置Hadoop伪分布式集群

Shibuwodai

Shibuwodai

相关推荐

jQuery UI组件库使用技巧小分享，让移动、Web界面开发更简单！

一款免费开源的通用数据库工具DBeaver

JavaScript是如何成为一门严肃的编程语言的

如何在树莓派上安装Ubuntu服务器？

信必优承接全球最大搜索引擎公司多语言本地化测试项目外包

界面控件开发包DevExpress 2020年重大版本——v20.2震撼发布

使用Ansible的Kubernetes模块实现容器编排自动化

在 Linux 上使用 yum 设置 ZFS

DevExpress Winform开发：解决旧UI要求的新方法

Linux黑话解释：什么是显示服务器，用来做什么？

在树莓派3上安装Fedora

mybatis的两种日志

大数据获取案例：Python网络爬虫实例

docker服务以及配置文件详解

Python下使用Altair数据制图

如何在华为云上部署部署中文聊天机器人

Cent os 7之KVM虚拟化基础管理

pyjnius：访问java类

REST是什么？RESTFul又是什么？这二者的关系是怎样的？

DevSecOps和敏捷软件开发有什么不同？

Shibuwodai