Hadoop

Hadoop:
大数据集群,只能运行在Linux平台
RDBMS:表
字段、数据类型、约束
结构化数据
关系数据库在数据中占据重要的地位
但不是所有的数据都可以结构化
结构化数据:structured data
非结构化数据:unstructured data
半结构化数据:semi-structured data
通常保存为xml , json
Google:pagerank 页面算法
化整为零,并行处理
将一个大问题切割成多个小问题
OLAP:数据挖掘
机器学习:deep learning
多节点并行处理

Map reduce:
函数式编程API
运行框架

相关推荐