Hive编程(影印版)
《Hive编程(影印版)》
基本信息
原书名:Programming Hive
作者: Edward Capriolo Dean Wampler Jason Rutherglen
出版社:东南大学出版社
ISBN:9787564141974
上架时间:2013-6-20
出版日期:2013 年5月
开本:16开
页码:352
版次:1-1
所属分类:计算机 > 数据库 > 数据库存储与管理
更多关于 》》》《Hive编程(影印版) 》
内容简介
计算机书籍
你是否需要把一个关系型数据库应用迁移到hadoop上?《hive编程(影印版)》全面的指南将为你介绍apache hive,它是hadoop的数据仓库平台。你将快速了解如何使用hive的sql方言——hiveql——来汇总、查询和分析存储在hadoop分布式文件系统中的大数据集。
这本由实例驱动的指南为你展示了如何在你的环境中搭建和配置hive,它也提供了对hadoop和mapreduce的概括介绍,并且演示了hive是如何在hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用hive的公司是如何解决pb容量数据层面上的独特问题。
使用hive来创建、改变和删除数据库、表、试图、函数和索引
定制文件和外部数据库中的数据格式和存储选项
从表中加载和提取数据——以及使用查询、分组、过滤、连接和其他常用查询方法
获取创建用户自定义函数的最佳实践
了解你应该使用的hive模式和你应该避免的错误模式
把hive集成到其他数据处理程序中
在nosql数据库和其他数据存储中使用存储处理器
了解在amazon公司的elastic mapreduce上运行hive的优点和缺点
edward capriolo是media6degrees的系统管理员,也是apache软件基金会的成员和hadoop-hive项目的委员之一。
dean wampler是think big analytics公司的资深咨询顾问,他专长于大数据问题,诸如hadoop这样的工具和machine learning(机器学习)。
相关推荐
eternityzzy 2020-07-19
genshengxiao 2020-06-26
victorzhzh 2020-06-16
archive 2020-05-28
taisenki 2020-05-27
archive 2020-07-30
成长之路 2020-07-28
taisenki 2020-07-05
tugangkai 2020-07-05
SignalDu 2020-07-05
zlsdmx 2020-07-05
tomson 2020-07-05
tugangkai 2020-07-04
tomson 2020-07-05
Zhangdragonfly 2020-06-28
成长之路 2020-06-26