大数据实践（一）--Hadoop单机搭建（Ubuntu）

strongyoung

2020-05-18

关注关注

大数据实践（一）--Hadoop单机搭建（Ubuntu）

前置环境及工具：

Ubuntu 16
VirtualBox
Hadoop 2.7.3
xftp6
jdk1.8

1、VirtualBox环境准备

001、设置网卡

双网卡：选择桥接模式与仅主机模式。

保证主机与虚拟机之间相互ping通、关闭防火墙。

sudo ufw disable

002、更新apt-get(最好更新)

使用以下命令更新apt-get。

sudo apt-get update

如果速度太慢，可以更换源。

步骤如下：

sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak #备份原源列表文件

将原源文件(/etc/apt/sources.list)中地址替换为以下地址：

deb http://mirrors.aliyun.com/ubuntu/ trusty main restricted universe multiverse

deb http://mirrors.aliyun.com/ubuntu/ trusty-security main restricted universe multiverse

deb http://mirrors.aliyun.com/ubuntu/ trusty-updates main restricted universe multiverse

deb http://mirrors.aliyun.com/ubuntu/ trusty-proposed main restricted universe multiverse

deb http://mirrors.aliyun.com/ubuntu/ trusty-backports main restricted universe multiverse

deb-src http://mirrors.aliyun.com/ubuntu/ trusty main restricted universe multiverse

deb-src http://mirrors.aliyun.com/ubuntu/ trusty-security main restricted universe multiverse

deb-src http://mirrors.aliyun.com/ubuntu/ trusty-updates main restricted universe multiverse

deb-src http://mirrors.aliyun.com/ubuntu/ trusty-proposed main restricted universe multiverse

deb-src http://mirrors.aliyun.com/ubuntu/ trusty-backports main restricted universe multiverse

003、下载vim（可略去）

使用gedit也是可以的。

sudo apt-get install vim

004、下载ssh

通过以下命令查看是否存在ssh服务,不存在需要安装：

ps -e|grep ssh

5310 ?        00:00:00 sshd # 存在ssh

安装openssh相关组件：

sudo apt-get install openssh-server

此时如果报错openssh-client的话，是Ubuntu自带的client版本不适配server，安装一个适配的版本：

启动ssh服务。

service sshd restart

005、配置本地ssh登录服务

cd ~/.ssh/ # 若没有该目录，请先执行一次 ssh localhost 

ssh-keygen -t rsa # 会有提示，都按回车就可以 

cat ./id_rsa.pub >> ./authorized_keys # 加入授权

2、Hadoop环境准备

001、上传jdk以及hadoop

使用xftp等工具都可以。

注意Ubuntu下需要给与文件夹上传的权限。

sudo chmod 777 xxx

002、解压并配置环境变量（略去）

配置jdk、hadoop的环境变量。

# java_home
export JAVA_HOME=/usr/local/jdk/jdk1.8.0_191
export CLASSPATH=.:${JAVA_HOME}/jre/lib/rt.jar:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar
export PATH=$PATH:${JAVA_HOME}/bin

#hadoop home
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin

003、修改读写权限（可略去）

使用以下命令可以使当前用户具有对文件的读写修改权限。

sudo chmod -R xxx(用户)
/..    #R代表队当前目录及其子目录拥有权限

004、修改Hadoop配置文件

hadoop-env.sh 记录脚本要用的环境变量，以运行hadoop

core-site.xml hadoop core的配置项，例如hdfs和mapreduce常用的i/o设置等

hdfs-site.xml hadoop守护进程的配置项，包括namenode、辅助namenode和datanode等

mapred-site.xml mapreduce守护进程的配置项，包括jobtracker和tasktracker

.....

单机只设置前面三个就可以。

1、修改hadoop-env.sh文件

建议修改并配置jdk环境。

# The java implementation to use.
export JAVA_HOME=/usr/local/jdk/jdk1.8.0_191

2、修改core-site.xml文件

<property>
        <name>hadoop.tmp.dir</name>
        <value>file:///usr/local/hadoop/hadoopTmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.168.56.102:9000</value>
    </property>

3、修改hdfs-site.xml 文件

<property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:///usr/local/hadoop/hadoopTmp/dfs/name</value>
    </property>
<property>
        <name>dfs.namenode.data.dir</name>
        <value>file:///usr/local/hadoop/hadoopTmp/dfs/data</value>
    </property>

3、测试

001、格式化NameNode

hdfs namenode -format

002、启动hdfs守护进程

start-dfs.sh

# 使用jps出现以下进程
7952 DataNode
8246 Jps
8135 SecondaryNameNode
7804 NameNode

003、在Web端查看相关信息

打开浏览器，输入local host:50070,出现相关页面。

004、停止守护进程

stop-dfs.sh

此时进程停止。

apt-get hadoop

strongyoung

0 关注 0 粉丝 0 动态

关注关注

Docker手册

sudo apt-get remove docker docker-engine docker-ce docker-ce-cli docker.io. docker rm $ # remove删除所有容器。docker run -itd --name

liyansring 2020-08-15

ubuntu下快速安装rabbitmq

安装rabbitmqsudo apt-get updatesudo apt-get upgradesudo apt-get install rabbitmq-server. 当我们在创建用户时，会指定用户能访问一个虚拟机，并且该用户只能访问该虚拟机下的队列

liym 2020-07-20

ubuntu中执行可执行文件时报错“没有那个文件或目录”的解决办法（非权限问题）

原因：这个程序的是32位的程序，而系统是64位的，运行时需要安装一些环境。

dongfangxiaozi 2020-07-19

Asp.Net Core Blazor之容器部署

　　Docker作为开源的应用容器引擎，可以让我们很轻松的构建一个轻量级、易移植的容器，通过Docker方式进行持续交付、测试和部署，都是极为方便的，并且对于我们开发来说，最直观的优点还是解决了日常开发中的环境配置与部署环境配置上的差异所带来的种种疑难杂症

katanaFlower 2020-07-05

ubuntu 18.04 安装tensorflow 2 cuda10 CUDNN Anaconda3

1.nvidia 驱动a.卸载系统里低版本的英伟达驱动sudo apt-get purge nvidia*b.把显卡驱动加入PPAsudo add-apt-repository ppa:graphics-driverssudo apt-get update

JM 2020-06-21

ubuntu 16.04快速搭建nginx + php7.1 + mysql 环境

安装Nginx使用 apt-get install nginx 就能自动安装 Nginx。为了确保获得最新的Nginx，可以先使用 apt-get update 命令更新源列表。安装好之后，使用 dpkg -S nginx 命令来搜索 nginx相关文件。

咻咻ing 2020-06-16

ubuntu 16.04 python3环境下安装仅cpu版本的caffe

以下两行带有hdf5的为新增加的内容，解决无法找到HD5的错误。#python2 #PYTHON_INCLUDE := /usr/include/python2.7 \ /usr/lib/python2.7/dist-pac

zhangpan 2020-06-11

第7次系统综合实践 20组

# 更新软件源和软件。sudo apt-get install libavcodec-dev libavformat-dev libswscale-dev libv4l-dev$ sudo apt-get install libxvidcore-dev l

greent00 2020-06-10

第7次系统综合实践 26组

在开始编译过程之前，应增加交换空间的大小。这使OpenCV可以使用 Raspberry PI的所有四个内核进行编译，而不会由于内存问题而挂起编译。# initialize the camera and grab a reference to the ra

csdmeb 2020-06-08

django-xadmin docker镜像

Django==2.2.2PyMySQL==0.9.3xlrd==1.2.0XlsxWriter==1.1.8xlwt==1.3.0uWSGI==2.0.18uwsgitop==0.1. docker build -t django_xadmin .

VFCSDN 2020-06-07

linux下构建active-cpp客户端

首先v20系统是使用虚拟机安装的，安装使用都挺简单，桌面也够丰富，但是流畅度不太好，尤其是应用商店，经常出现打不开的情况。但是自带的软件源，一些常用的开发工具都可以直接通过apt-get完成安装，之前在windows下弄了很久，apr-util的时候始终提

IsanaYashiro 2020-06-06

Docker镜像与制作的三种方式

RUN apt-get update && apt-get install -y wget libpcre3 libpcre3-dev openssl libssl-dev zlib1g-dev iproute2 net-tools iot

GluttonousZX 2020-06-06

配置阿里云的docker源安装

Docker CE 是免费的 Docker 产品的新名称，Docker CE 包含了完整的 Docker 平台，非常适合开发人员和运维团队构建容器 APP。```sudo apt-get -y install apt-transport-https ca-

yss0 2020-06-02

ubuntu安装ipython

2.sudo apt-get install ipython3它所相对应的python版本为python3，是下面这个样子的

zhiliang 2020-06-01

容器安装vim

安装VIMapt-get install vim如果提示：Reading package lists…

圆圆的世界CSDN 2020-06-01

创建好docker后不能apt-get update解决方法

首先使用命令查找宿主机的DNS server，命令：nmcli dev show | grep ‘IP4.DNS‘或者nmcli dev show | grep DNS

lilygg 2020-05-29

Docker: GUI 应用，Ubuntu 上如何运行呢？

# install packages to allow apt to use a repository over HTTPS. sudo apt-get install apt-transport-https ca-certificates curl gn

zwt00 2020-05-29

ubuntu18.04-docker

sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common

flyDeDog 2020-05-28

避坑！！！docker安装mongodb及配置

sudo apt-get install -y apt-transport-https ca-certificates curl software-properties-common. 创建网络格式为：docker network create 网络名称。

kuzilala 2020-05-28

linux中常用的shell命令(2)—ubuntu

然后在software update中点击是否立即安装。ubuntu 14.04 x64、ubuntu 12.04 x64、ubuntu 16.04 x64、ubuntu 18.04 x64：。执行32位程序是出现报错：提示：ash: ./tshd: No

iamplane 2020-05-26

大数据实践（一）--Hadoop单机搭建（Ubuntu）

大数据实践（一）--Hadoop单机搭建（Ubuntu）

1、VirtualBox环境准备

001、设置网卡

002、更新apt-get(最好更新)

003、下载vim（可略去）

004、下载ssh

005、配置本地ssh登录服务

2、Hadoop环境准备

001、上传jdk以及hadoop

002、解压并配置环境变量（略去）

003、修改读写权限（可略去）

004、修改Hadoop配置文件

1、修改hadoop-env.sh文件

2、修改core-site.xml文件

3、修改hdfs-site.xml 文件

3、测试

001、格式化NameNode

002、启动hdfs守护进程

003、在Web端查看相关信息

004、停止守护进程

相关推荐