hadoop笔记1

一个人的世界

2013-11-17

关注关注

hdfs mapreduce简介

Hadoop组件

结构组成

Hadoop由2个主要的主件组成：hdfs,mapreduce

1) Hdfs

分布式文件系统，按照组成分为

masterNode: nameNode,JobTracker,SecondaryNameNode

slaveNode: DataNode,TaskTracker

nameNode:文件在各节点分块对应表。

SecondaryNameNode:文件分布快照，是NameNode的补充节点。

DataNode:数据的io操作。

taskTracker:各节点的操作监视节点

2) Mapreduce

设计为hdfs文件的计算组件。

分为：mapper

reducer

Mapreduce执行步骤

Mapper负责从hdfs文件系统读取信息，然后输出给reducer,reducer在输出到hdfs文件系统。

输入输出格式：

Map(k1,v1)àlist(k2,v2)

Reduce(k2,list(v2))-àlist(k3,v3)

Hdfs--àInput split--àmap--àcombiner--àshuffling---àreduce--àhdfs

其中shuffling中有分区的动作(partitioner)

Input split中包含了

文件分块：一个文件分割在一个机器节点上的多个块，或者不同机器节点上。

inputFormat: 文件分割到读取文件以什么格式给mapper.

TextInputFormat

KeyValueTextInputFormat

默认实现为FileInputFormat的子类，其中有2个方法

getSplits

getRecordReader此方法就是决定传什么样的值（RecordReader）给map方法。

Reduc后调用outputformat来写入文件

默认是textoutputformat

都是FileoutputFormat子类。

margin hadoop hdfs text-indent

一个人的世界

0 关注 0 粉丝 0 动态

关注关注

8种ETL调度算法归纳总结，看完这些你就全明白了

目的是将企业中的分散、零乱、标准不统一的数据整合到一起，为企业的决策提供分析依据。

沐诩 2020-09-25

vmware扩展跟分区

进行的操作：在 windows 下运行 CMD , 转到 vmware 的安装目录,可执行vmware-vdiskmanager.exe；在Linux下，直接敲入vmware-vdiskmanager ,可执行该指令扩充使用的指令: vmware-vdis

周公周金桥 2020-09-06

几种分布式事务技术的比较

对业务侵入很强。已经提交的事务，不保证隔离性。不会脏读，性能介于seata和2阶段之间。seata和lcn大致的实现思路是一致的，但是回滚的机制不一样。

zjuwangleicn 2020-09-04

CSS知识点（三）

text-align:center:内容水平居中，可以让行内元素和行内块元素水平居中，不可以让块状元素居中。则他们之间的垂直间距不是margin-bottom与margin-top之和，而是两者中的较大者?,这种现象被称为相邻块元素垂直外边距的合并。确定页

hellowzm 2020-08-18

Wyn Enterprise中如何转换数据类型？

在设计报表或者仪表板时，有时候从数据集获取到的数据类型和我们分析所需的类型并不匹配，不是同一种数据类型，可能会造成无法将数据正确分类或者过滤等情况。此处主要是仪表板数据集的数据类型转换。此处要注意，直接通过下拉选择调整类型可能部分情况不会生效。此时，需要使

大象从不倒下 2020-07-31

css基础--盒子模型

1 绝大多数标签都可以看作盒子，可以设置宽高或设置内容；在CSS中，"box model"这一术语是用来设计和布局时使用。　　CSS盒模型本质上是一个盒子，封装周围的HTML元素，它包括：边距，边框，填充，和实际内容。　　盒模型允许我们

AlisaClass 2020-07-19

一个简单的CSS登录页

<!DOCTYPE html>. <meta name="viewport" content="width=device-width,initial-scale=1.0">. height:

尚衍亮 2020-06-12

css常用的简写技巧_css background简写、css border 简写、css font属性简写等

css样式中有很多简写方式，比如：设置背景，字体，边框，盒子等。我们都可以把css代码合并为一行，这篇文章将总结有哪些属性支持css简写。font:normal small-caps bold 14px/1.5em ‘宋体‘,arial,verdana;d

淡风wisdon大大 2020-06-06

Blogs顶部添加欢迎信息

<div style="text-align: center; font-size:20px; margin-bottom:0px; margin-top:0px; opacity:0.5; ">欢迎来到Panda.Li个

黎豆子 2020-05-07

《肖申克的救赎》百度百科网络爬虫

<!doctype html>. margin: 0;width: 780px;height: 50px;margin: 150px auto 75px;text-indent: -9999em;width: 780px;margin: 0 a

hilary0 2020-05-04

09、移动性能优化

（工程化手段可以解决。源码到可以上线的代码）。首屏代码用内联，其他可以用外联。js文件，没有dom操作的，如屏幕适配，可放head里面。js文件，有dom操作的，放在body结束前。用css画图或者用图标字体代替图片。//这样就执行了30次dom操作了

zhanghao 2020-04-21

多张图片懒加载

ul li { height: 900px; margin: 100px auto; text-align: center; }. oDiv.style.display = ‘block‘ : oDiv.style.display = ‘none‘

MaureenChen 2020-04-21

知识图谱如何改变银行业务模式？

知识图谱被构造为附加的虚拟数据层，位于现有数据库之上，并将数据大规模链接在一起。由于知识图谱基于知识和概念，因此要想创建良好的知识图谱，必须让整个组织内不同领域的主题专家都参与进来。试图建立自己的知识图谱的金融机构不必从头开始。由于知识图谱能够以智能的方式

xingguanghai 2020-03-13

absoulue与relative配合定位盒子居中问题

如何通过absoulue与relative配合把一个盒子或者是把2个div块同时放到页面中央部分？定位完成后为什么又需要margin-left与margin-top各往回走50%的长度，别忘记用z-index定位高度，请看下面代码展示:

nercon 2020-02-22

CSS----属性

颜色属性被用来设置文字的颜色。text-align 属性规定元素中的文本的水平对齐方式。center 把文本排列到中间。justify 实现两端对齐文本效果。line-height: 200px; 文本行高通俗的讲，文字高度加上文字上下的空白区域的高

impress 2020-02-20

jSon和Ajax登录功能，ajax数据交互案例

<input type="text" name="user" id="user" placeholder="请输入注册手机号" autocomplete="of

ajaxtony 2020-02-18

web第六天，CSS优先级与盒子模型

　　　　通过设置inherit值，可以改变默认的继承方式。　　　　当设置相同样式时，后写的优先级较高，但不建议出现重复设置样式的情况。　　　　场景：紧急情况下使用。　　　　群组选择器与单一选择器的权重相同，靠后写的优先级高。　　　　3，padding属

teresalxm 2020-02-18

css面试题

定位位置为 left: 50%; 然后 margin-left: -50px; 向左偏移元素宽度的一半。跟上面方法差不多，用 transform: translateX; 代替 margin-left，这样就不需要知道元素的宽度了。弹性布局什么的最喜欢了。

福叔 2020-02-16

Spring Cloud Spring Boot mybatis分布式微服务：Spring Security

首先，构建一个简单的Web工程，以用于后续添加安全控制，也可以用之前Chapter3-1-2做为基础工程。若对如何使用Spring Boot构建Web应用，可以先阅读《Spring Boot开发Web应用》一文。可以看到在index.html中提供到/he

mituan 2020-01-17

宜信微服务架构落地及其演进

应用服务架构一直处于不断演进的过程中，上图通过对比 5 种比较主流的架构模式，展示应用架构的演进历程和变化。在业务发展初期，为了快速落地应用，满足客户需求，一般会使用 All in One 的单体架构。主流的面向服务的架构模式有：RPC 架构、ESB 中心

NET追求者BLOG 2020-01-06

安科网

hadoop笔记1

一个人的世界

Hadoop组件

结构组成

Mapreduce执行步骤

一个人的世界

相关推荐

8种ETL调度算法归纳总结，看完这些你就全明白了

vmware扩展跟分区

几种分布式事务技术的比较

CSS知识点（三）

Wyn Enterprise中如何转换数据类型？

css基础--盒子模型

一个简单的CSS登录页

css常用的简写技巧_css background简写、css border 简写、css font属性简写等

Blogs顶部添加欢迎信息

《肖申克的救赎》百度百科网络爬虫

09、移动性能优化

多张图片懒加载

知识图谱如何改变银行业务模式？

absoulue与relative配合定位盒子居中问题

CSS----属性

jSon和Ajax登录功能，ajax数据交互案例

web第六天，CSS优先级与盒子模型

css面试题

Spring Cloud Spring Boot mybatis分布式微服务：Spring Security

宜信微服务架构落地及其演进

一个人的世界