聊聊大数据Lambda架构

cococai的

2019-06-11

Lambda Architecture 概念

Mathan Marz的大作Big Data: Principles and best practices of scalable real-time data systems介绍了Lambda Architecture的概念，用于在大数据架构中，如何让real-time与batch job更好地结合起来，以达成对大数据的实时处理。

聊聊大数据Lambda架构

大数据平台中包括批量计算的Batch Layer和实时计算的Speed Layer，通过在一套平台中将批计算和流计算整合在一起。

例如使用Hadoop MapReduce、Spark进行批量数据的处理，使用Apache Storm、Spark Streaming 进行实时数据的处理。

这种架构在一定程度上解决了不同计算类型的问题，但是带来的问题是框架太多，会导致平台复杂度过高、运维成功高等。

Lambda架构的主要思想就是将大数据系统构建为多个层次，如下图所示：

聊聊大数据Lambda架构

我们来梳理一下他们是如何分工协助的：

首先new data作为整个数据系统的数据源头，Batch Layer作为数据的批处理层次对原始数据进行加工与处理，并且将处理的数据结果的Batch View输入到Serving Layer。(这里对应的是全量数据)

Speed Layer对于实时增加的数据进行处理，生成对增量数据计算结果的Real-time View。（这里对应的是增量数据）

最终用户查询是通过Batch View与Real-time View相结合的形式将最终结果呈现出来。

基于Lambda架构，一旦数据通过Batch layer进入到Serving layer，在Real-time view中的相应结果就不再需要了。

小结

Lambda架构结合了实时处理与批处理的结果，很好的反馈了查询需求，并且在速度和可靠性之间求取了平衡，具有足够的扩展性。理想状态下，所有的查询都可以定位成一个函数：

Query = Function（Data）

但是，若数据达到相当大的一个级别（例如PB），且还需要支持实时查询时，就需要耗费非常庞大的资源。

而Lambda架构将数据和计算系统进行细分：

Query = Batch（Old_Data） + RealTime（New_Data）

但是这种架构同样存在一些问题：需要运维两套不同的计算系统，并且合并查询结果，这一定程序上带来了复杂性的增加。

lambda 大数据架构

cococai的

0 关注 0 粉丝 0 动态

相关推荐

Python 之父为什么嫌弃 lambda 匿名函数？

Python 支持 lambda 匿名函数，其扩展的 BNF 表示法是lambda_expr ::= "lambda" [parameter_list] ":" expression，也就是lambda 参数序列:

meylovezn 2020-09-21

pandas 的DataFrame.apply()

pandas的apply函数是自动根据function遍历每一个数据，然后返回一个数据结构为Series的结果

mmmjyjy 2020-07-16

【python】进阶-lambda和列表生成器

统计列表a中所有大于5的元素。filter()是python的内置方法，对序列中的元素进行筛选，最终获取符合条件的序列

typhoonpython 2020-06-11

[Python]reduce function & lambda function & factorial

result = reduce(lambda a, b: a*b, [item for item in range(1,i+1)])

x青年欢乐多 2020-06-06

Kotlin Lambda的返回

先看下面这个代码，有问题不？答案是编译通不过地。看样子return@repeat起到了类似continue的作用，把3的打印跳过了。所以，如果只用return的话，会直接导致调用repeat的函数直接return了。思考......如果我就想像loop的b

Stranger 2020-05-16

python dic字典排序

使用lambda匿名函数来实现。这个用的比较多，先记录一下。

zhuxianfeng 2020-04-27

python中property(lambda self: object())简单解释

它们的含义和结果是什么？您能否以简单的方式显示该声明的示例？def __new__: # real signature unknown; restored from __doc__. 通常用作装饰器。该代码与此等效，可能看起来更加熟悉：

PythonMaker 2020-04-22

pandas中groupby,apply,lambda函数使用

df = pd.DataFrame({‘name‘:[‘Jack‘,‘Alex‘,‘Bob‘,‘Nancy‘,‘Mary‘,‘Alice‘,‘Jerry‘,‘Wolf‘],‘course‘:[‘Chinese‘,‘Math‘,‘Math‘,‘Chinese

QianYanDai 2020-04-18

Python几个高阶函数

匿名函数是指一类无需定义标识符（函数名）的函数。正常情况下，我们定义一个函数，使用的是def关键字，而当你学会使用匿名函数后，替代def的是lambda。这边使用def和lambda分别举个例子，你很快就能理解。从上面的示例，我们可以看到匿名函数直接运行，

千锋 2020-04-11

python进阶日记（lambda函数）

list1 = [{‘a‘:1,‘b‘:2},{‘a‘:2,‘b‘:4},{‘a‘:3,‘b‘:5}]. #lambda 参数1，参数2 ：返回值表达式。#max 中key 就相当于sort中的cmp，传入一个参数设置了排序方法。map操作，对函数进行遍历

SDUTACM 2020-03-05

Python中max()内置函数使用(list)

求出列表中频次出现最多的元素。max()方法返回给定参数的最大值，参数值可为序列。简而言之，就是key中传递的是一个参数，此时max会根据每个传入参数后的返回值进行比较。执行之后,我们还需要返回结果的函数并使用使用return关键字。使用lambda:la

fly00love 2020-03-05

Python Lambda

f = lambda x, y, z: x + y + z # returns a function that can optionally be assigned a name. def func:

sschencn 2020-02-21

python之匿名函数

print //输出结果为12. print //输出结果为True. print //输出结果为(2,3)

paopao00 2020-02-03

Python函数-2 匿名函数

当我们在创建函数时，有些时候，不需要显式地定义函数，直接传入匿名函数更方便。这省去了我们挖空心思为函数命名的麻烦，也能少写不少代码，很多编程语言都提供这一特性。Python语言使用lambda关键字来创建匿名函数。所谓匿名，即不再使用def语句这样标准的形

wklken的笔记 2020-01-30

python 慕名函数

‘‘‘概念：不使用def这样的语句定义函数，使用lambda来创建匿名函数特点：1、lambda只是一个表达式，函数体比def简单2、lambda的主体是一个表达式，而不是代码块，仅仅只能在lambda表达式中封装简单的逻辑3、lambda函数有自己的命名

GhostLWB 2020-01-30

python学习：函数---匿名函数 lambda

lambda 只是一个表达式，函数体比 def 简单很多。仅仅能在lambda表达式中封装有限的逻辑进去。lambda 函数拥有自己的命名空间，且不能访问自己参数列表之外或全局命名空间里的参数。lambda 可以有多个参数，参数之间用逗号隔开。lambda

sulindong0 2020-01-19

python的lambda函数

要点：1.lambda 函数不能包含命令，其实lambda返回值是一个函数的地址，也就是函数对象。

taiyangshenniao 2020-01-12

Python匿名函数

用lambda关键词能创建小型匿名函数。这种函数得名于省略了用def声明函数的标准步骤。想一想，下面的数据如何指定按age或name排序？[{‘age‘: 19, ‘name‘: ‘lisi‘}, {‘age‘: 17, ‘name‘: ‘wangwu‘}

chinademon 2020-01-12

python中filter、map、reduce的区别

python中有一些非常有趣的函数，面试的时候可能会遇到。今天也来总结一下，不过该类的网上资料也相当多，也没多少干货，只是习惯性将一些容易遗忘的功能进行整理。filter，map，reduce为内置函数。#4.reduce用法：先把sequence中第一个

mieleizhi0 2020-01-11

λ演算 (Lambda Calculus) 一：定义与函数式编程

最近在学习计算理论方面的内容，这一系列文章主要介绍λ演算，这需要一些基本的离散数学如集合的知识，写的过程难免有错误欢迎大家指出。函数式编程是实现λ演算的一次实践，比如： Lisp, Scheme, Haskell...

samsai00 2020-01-06

cococai的

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号