ubuntu docker搭建Hadoop集群环境的方法

jjjjjzzzzzaaaa

2018-06-04

关注关注

spark要配合Hadoop的hdfs使用，然而Hadoop的特点就是分布式，在一台主机上搭建集群有点困难，百度后发现可以使用docker构建搭建，于是开搞：

github项目：https://github.com/kiwenlau/hadoop-cluster-docker

参考文章：//www.jb51.net/article/109698.htm

docker安装

文章中安装的是docker.io

但是我推荐安装docker-ce，docker.io版本太老了,步骤如下：

1、国际惯例更新下APT软件包的源

sudo apt-get update

2、安装软件包以允许apt通过HTTPS使用存储库

sudo apt-get install \
apt-transport-https \
ca-certificates \
curl \
software-properties-common

3、因为被墙使用教育网镜像：

代码如下：

curl -fsSL https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/gpg | sudo apt-key add

4、同样

sudo add-apt-repository \
"deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu \
$(lsb_release -cs) \
stable"

5、更新下我们的软件源

sudo apt-get update

6、安装docker

sudo apt-get install docker-ce

7、启动docker服务

sudo service docker start

sudo systemctl start docker

8、觉得有必要可以设置开机自带启动

sudo systemctl enable docker

9、关闭自启动

sudo systemctl disable docker

10、国内访问docker会受限制，可以使用加速服务，阿里云、网易云、DaoCloud

11、运行 docker run hello-world 测试是否安装成功

12、想要安装其他image 可以到docker hub上找

https://hub.docker.com/

或是直接在github上搜索相应docker

搭建Hadoop集群

搭建过程很简单
https://github.com/kiwenlau/hadoop-cluster-docker

上步骤说明很详细：

1、pull镜像，速度慢的换国内镜像源

sudo docker pull kiwenlau/hadoop:1.0

200多m不算大，我下过jupyter官方pyspark的docker 5g…

2、克隆项目到本地

git clone https://github.com/kiwenlau/hadoop-cluster-docker

其实只用到里面的 start-container.sh 文件也可以单独下，复制粘贴啥的

3、start-container.sh 需要修改一下 cd 到文件目录

sudo gedit start-container.sh 修改如下

ubuntu docker搭建Hadoop集群环境的方法

开放9000端口还有创建共享文件夹方便以后使用

4、保存之后，创建docker-Hadoop网络

sudo docker network create --driver=bridge hadoop

5、开启容器

sudo ./start-container.sh

ubuntu docker搭建Hadoop集群环境的方法

6、开启Hadoop集群

./start-hadoop.sh

ubuntu docker搭建Hadoop集群环境的方法

7、测试一下Hadoop，在hdfs上创建 test/input 目录

hadoop fs -mkdir -p /test/input
hadoop fs -ls /test

ubuntu docker搭建Hadoop集群环境的方法

8、运行word-count程序

./run-wordcount.sh

结果如下

ubuntu docker搭建Hadoop集群环境的方法

docker hadoop sudo hadoop集群搭建

jjjjjzzzzzaaaa

0 关注 0 粉丝 0 动态

关注关注

Docker CentOS 安装方法

绝大部分用户使用设置 Docker 的仓库，然后从设置成功后的仓库进行安装。为了更加容易进行安装和升级任务，Docker 的官方推荐使用这种安装方式来进行安装。这种方法主要针对一些系统不具有联网环境，你需要下载后进行安装。在一些测试和部署环境中，一些用

changecan 2020-11-19

docker镜像制作

和自动化发布平台集成的时候启动shell价值就出来了。另外此处自定了dockerfile的路径和名称，稍微。做了通用化的考虑。稍微需要注意的是 -f最好是全路径。

changecan 2020-09-22

快速制作Redis Docker镜像

现在容器化已经是趋势，制作镜像也是我们的基础工作。镜像越小，部署起来越方便。在这个方面，轻巧的Linux发行版本就是一个很好的选择，这里我们选择alpine linux 。目前最新版本是3.12.1。官方很友好的提供了minirootfs的包，这个包就是为

王道革 2020-11-25

Docker 文档编译 - 创建标签（Tab）页

标签页使用的是 Bootstrap CSS/JS，因此请参考相关的文档来获得有关标签页使用的更多有关内容和信息。针对标准的水平标签页，你可以拷贝和粘贴下面的表单内容，在上面的表单内容中关键的地方在href="#id"和id="

bwyyziq 2020-11-22

Ubuntu 安装Docker

Unbutu系统上安装Docker服务，为保证docker服务的运行未定，需要使用与之相匹配的docker版本，使用命令。若看到上述信息，表明docker安装成功！默认情况下，docker从hub上下载需要安装的进行，囿于这些hub位于国外，下载速度缓慢，

pigsmall 2020-11-19

docker CPU限制的实现

2）例如：如果主机有2个CPU，设置--cpus="1.5"，则可以报称容器醉倒容纳一半的CPU，相当于设置--cpu-period="100000"和--cpu-quota="150000".

helloWorldAndYou 2020-11-16

Docker部署nginx实现过程图文详解

docker.io/redis latest 1e70071f4af4 6 weeks ago 106.7 MB. [root@localhost my.Shells]# docker pull nginx //下载nginx

nginxs 2020-11-14

Docker服务器存储资源池不足的问题解决

最近在执行 Docker 运行命令启动镜像时候，无法正常执行 Docker 启动镜像命令，提示了如下错误信息：。Error: Error response from daemon: devmapper: Thin Pool has 163051 free

红石丶 2020-11-13

用docker运行postgreSQL的方法步骤

drwx------ 19 polkitd ssh_keys 4096 Jan 14 08:40 .drwxr-xr-x 3 root root 4096 Jan 14 08:33 ..drwx------ 5 polkitd ssh_keys 40

WanKaShing 2020-11-12

docker之docker-machine用法详解

docker-machine 是docker官方提供的docker管理工具。环境win下面安装的virtualbox，virtualbox安装的centos7，网络模式NAT+hostonly. Error with pre-create check: &

yangkang 2020-11-12

利用 Docker 构建简单的 java 开发编译环境的方法详解

目前 Java 语言的版本很多，除了常用的 Java 8，有一些遗留项目可能使用了 Java 7，也可能有一些比较新的的项目使用了 Java 10 以上的版本。如果想切换自己本地的 Java 开发环境，折腾起来还是需要花费一些时间的，并且日后在不同版本间切

滴水穿石点石成金 2020-11-12

Docker如何给Springboot项目动态传参的实现方法

最近有些初学Docker的朋友问到，想通过docker-compose.yml来动态给微服务传参，而不是每次都要在项目配置文件硬编码，然后构建服务镜像，最后打包发布经过一些列流程才能更新配置，那能不能直接通过docker-compose.yml里把一些配置

张荣珍 2020-11-12

详解SpringBoot项目docker环境运行时无限重启问题

可能是我开始处理问题的思路不对，现在描述问题可能也有点乱，但是里面可能的处理方式希望能帮到遇到我这个坑的人。描述：springboot项目，docker镜像里面运行，看docker的日志，项目启动成功后，隔了一分钟左右他就自动重新启动，然后造成网站接口访问

wuxunanjing 2020-11-11

关于docker部署的jenkins跑git上的程序的问题

具体可参考这篇文章。解决就是把指定分支按照下图的设置，就是代表any分支的意思。

MartellJenkins 2020-11-23

Docker使用Portainer搭建可视化界面的方法

Portainer是Docker的图形化管理工具，提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作、事件日志显示、容器控制台操作、Swarm集群和服务等集中管理和操作、登录用户管理和控制等功能。功能十分全面，基本能满足中小型单位对容器管理的

魅惑青花瓷 2020-11-11

详解使用阿里云镜像仓库构建国外Docker镜像

在日常使用 Docker 或 K8S 的过程中，经常会需要到国外的网站中下载镜像，但是有些网站在国内是无法访问的。对于这个问题可以使用阿里云提供的镜像仓库进行下载，然后 pull 到本地并修改 tag 来实现。例如在使用 K8S 部署 Istio 时，需要

lihongtai 2020-11-09

docker容器与宿主机的数据交互方式总结

在生产环境中使用 Docker ，往往需要对数据进行持久化，或者需要在多个容器之间进行数据共享，这必然涉及容器的数据管理操作。docker cp :用于容器与主机之间的数据拷贝。当删除Docker容器，并通过该镜像重新启动时，之前的更改将会丢失。在Dock

yangkang 2020-11-09

三分钟完成 ubuntu16.04初始化,Java,maven,docker环境的部署问题

Linux初始化和一些常用环境的搭建是一个虽简单但费时的工作，尤其是你的Linux由于某种不可控的因素宕机了，这意味着你又要从头开始部署一遍环境，有些令人抓狂，因此我有了搭建这个Linux初始化脚本库的想法，不管小白还是大佬，只需一键运行，然后喝杯咖啡，环

worldsnow 2020-11-06

如何进入、退出docker的container实现

Docker的镜像称为image，容器称为container。对于Docker来说，image是静态的，类似于操作系统快照，而container则是动态的，是image的运行实例。比如，有一个image名称为ubuntu，那么比如现在我们启动这个image

MichaelJScofield 2020-11-06

详解docker pull 下来的镜像都存到了哪里

docker pull 下来的命令都默认存在/var/lib/docker/文件夹下。正好和docker images的内容一致。可以看到上面 repositories.json 文件中记录的就是已拉取的镜像信息。

TaoTaoFu 2020-11-06

安科网

ubuntu docker搭建Hadoop集群环境的方法

jjjjjzzzzzaaaa

jjjjjzzzzzaaaa

相关推荐

Docker CentOS 安装方法

docker镜像制作

快速制作Redis Docker镜像

Docker 文档编译 - 创建标签（Tab）页

Ubuntu 安装Docker

docker CPU限制的实现

Docker部署nginx实现过程图文详解

Docker服务器存储资源池不足的问题解决

用docker运行postgreSQL的方法步骤

docker之docker-machine用法详解

利用 Docker 构建简单的 java 开发编译环境的方法详解

Docker如何给Springboot项目动态传参的实现方法

详解SpringBoot项目docker环境运行时无限重启问题

关于docker部署的jenkins跑git上的程序的问题

Docker使用Portainer搭建可视化界面的方法

详解使用阿里云镜像仓库构建国外Docker镜像

docker容器与宿主机的数据交互方式总结

三分钟完成 ubuntu16.04初始化,Java,maven,docker环境的部署问题

如何进入、退出docker的container实现

详解docker pull 下来的镜像都存到了哪里

jjjjjzzzzzaaaa