Hive编程(影印版)

《Hive编程(影印版)》
基本信息
原书名:Programming Hive
作者: Edward Capriolo Dean Wampler Jason Rutherglen
出版社:东南大学出版社
ISBN:9787564141974
上架时间:2013-6-20
出版日期:2013 年5月
开本:16开
页码:352
版次:1-1
所属分类:计算机 > 数据库 > 数据库存储与管理
Hive编程(影印版)
更多关于 》》》《Hive编程(影印版)
内容简介
计算机书籍
  你是否需要把一个关系型数据库应用迁移到hadoop上?《hive编程(影印版)》全面的指南将为你介绍apache hive,它是hadoop的数据仓库平台。你将快速了解如何使用hive的sql方言——hiveql——来汇总、查询和分析存储在hadoop分布式文件系统中的大数据集。
   这本由实例驱动的指南为你展示了如何在你的环境中搭建和配置hive,它也提供了对hadoop和mapreduce的概括介绍,并且演示了hive是如何在hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用hive的公司是如何解决pb容量数据层面上的独特问题。
   使用hive来创建、改变和删除数据库、表、试图、函数和索引
   定制文件和外部数据库中的数据格式和存储选项
   从表中加载和提取数据——以及使用查询、分组、过滤、连接和其他常用查询方法
   获取创建用户自定义函数的最佳实践
   了解你应该使用的hive模式和你应该避免的错误模式
   把hive集成到其他数据处理程序中
   在nosql数据库和其他数据存储中使用存储处理器
   了解在amazon公司的elastic mapreduce上运行hive的优点和缺点
   edward capriolo是media6degrees的系统管理员,也是apache软件基金会的成员和hadoop-hive项目的委员之一。
   dean wampler是think big analytics公司的资深咨询顾问,他专长于大数据问题,诸如hadoop这样的工具和machine learning(机器学习)。
图书信息来源:互动出版网

相关推荐