基于Hadoop集群的Hive安装

ynkgyangxw

2013-07-26

关注关注

安装环境Hadoop已经安装结束，mysql已经安装结束。hive是安装在集群中的主节点上（hostname：node0）

相关阅读：

hadoop 版本号：hadoop-0.23.5

hive版本号：hive-0.8.1

derby版本号：db-derby-10.9.1.0

mysql版本号：mysql-5.1.47（linux redhat 安装时已经安装）

首先是hive的嵌入式模式的安装，

在hive嵌入式安装时默认的数据库是derby，

嵌入式模式的安装无法用于实际的工作，

即这种模式的运行环境无法支持双向同步或是集群工作。

但是可以用来对hive安装是否正确起到测试和调配作用，

待到嵌入模式下hive正确运行后，

可以在此基础上对配置文件做简单的调配就可以进行mysql安装配置了。

可以先创建好目录：

mkdir -p /usr/hive 用来存放hive压缩包解压后的相应文件

mkdir -p /usr/derby 用来存放derby解压后的相应文件

--------------------------------------------------------

将hive的压缩包从主机copy到虚拟机上的

/usr 目录下，

然后对压缩包进行解压，命令是：

tar -xzf hive-0.8.1-bin.tar

解压后会在/usr目录下生成一个

hive-0.8.1-bin的文件夹，

切换到该文件夹下

cd /usr/hive-0.8.1-bin

会看到conf lib bin 等相应的文件夹，

cp * -r /usr/hive 将所有的文件都拷贝到/usr/hive下

cd /usr 切换目录到/usr路径下

rm -r -f hive-0.8.1-bin 这步可选，将原先的解压后的文件删除

-------------------------------------------------------------------

将derby的压缩包从主机copy到虚拟机上的/usr 目录下，

解压该压缩文件：

tar -xzf db-derby-10.9.1.0-bin.tar

解压后生成文件夹： db-derby-10.9.1.0-bin

将该文件夹下的所有内容转入到/usr/derby 文件夹下

cd /db-derby-10.9.1.0-bin

ls 执行这个命令之后会看见 bin lib test 等一些文件夹

cp * -r /usr/derby

cd /usr

rm -f -r db-derby-10.9.1.0 将文件夹递归强制删除。

------------------------------------------------------------

这样derby被安装在/usr/derby 下

而hive则被安装在/usr/hive下，

安装路径的设置很重要，因为这关系到配置文件的改写。

-------------------------------------------------------------

vi /etc/profile

在末尾加上：

#set for hive

export HIVE_HOME=/usr/hive

export HIVE_CONF_DIR=/usr/hive/conf

//在系统中指出hive的配置文件所在

export PATH＝＄ＰＡＴＨ：＄ＨＩＶＥ＿ＨＯＭＥ／ｂｉｎ

//这个可以实现，只要输入hive，hive service就会自动响应，而不用必须输入hive所在的绝对路径。

export HIVE_LIB=$HIVE_HOME/lib

由于hadoop已经安装上了，所以关于hadoop路径的export不再说明。

当然为了让profile文件立即生效：

source /etc/profile

这样既可生效。

-------------------------------------

接下来是对hive配置文件的调配

首先应该切换到目录：

cd /usr/hive/conf/

会看见有：hive-env.sh.template这个文件，

(.template文件是模板文件，让用户参照其中的格式进行自定义的修改和优化)

将其cp并命名为：hive-env.sh 命令如下：

cp hive-env.sh.template hive-env.sh

vi hive-env.sh

将export HADOOP_HEAPSIZE=1024前面的‘#’去掉

当然可以根据自己的环境对这个默认的1024进行优化

将export HADOOP_HOME前面的‘#’号去掉，

并让它指向您所安装hadoop的目录（就是切换到这个目录下有hadoop的conf,lib,bin 等文件夹的目录），

（mine：HADOOP_HOME=/home/hadoop/hadoop）

其实在安装hive时需要指定HADOOP_HOME的原理基本上与

在安装Hadoop时需要指定JAVA_HOME的原理是相类似的。

Hadoop需要java作支撑，而hive需要hadoop作为支撑。

将export HIVE_CONF_DIR=/usr/hive/conf,并且把‘#’号去掉

将export HIVE_AUX_JARS_PATH=/usr/hive/lib

esc(键)

:wq

source /hive-env.sh(生效文件)

----------------------------------------------------------finish hive-env.sh

在修改之前，要相应的创建目录，以便与配置文件中的

路径相对应，否则在运行hive时会报错的。

mkdir -p /usr/hive/warehouse

mkdir -p /usr/hive/tmp

mkdir -p /usr/hive/log

cp hive-default.xml.template hive-site.xml

vi hive-site.xml

这个文件中的配置项很多，篇幅也很长，所以要有耐心看。

当然也可以使用搜索匹配字符串的方式进行查找：

键入‘/hive.metastore.warehouse.dir’(回车)

就会锁定到所需要的字符串上。

其中有三处需要修改：

<name>hive.metastore.warehouse.dir</name>

<value>/usr/hive/warehouse</value>

</property>

这个是设定数据目录

------------------------------------------------------------------------

<name>hive.exec.scratdir</name>

</property>

这个是设定临时文件目录

------------------------------------------------------------

//这个在笔者的文件中没有可以自己添加

<name>hive.querylog.location</name>

</property>

这个是用于存放hive相关日志的目录

其余的不用修改。

-------------------------------------------finish hive-site.xml

cp hive-log4j.properties.template hive-log4j.proprties

vi hive-log4j.properties

hive.log.dir=

这个是当hive运行时，相应的日志文档存储到什么地方

（mine：hive.log.dir=/usr/hive/log/${user.name}）

hive.log.file=hive.log

这个是hive日志文件的名字是什么

默认的就可以，只要您能认出是日志就好，

只有一个比较重要的需要修改一下，否则会报错。

log4j.appender.EventCounter=org.apache.hadoop.log.metrics.EventCounter

如果没有修改的话会出现：

WARNING: org.apache.hadoop.metrics.EventCounter is deprecated.

please use org.apache.hadoop.log.metrics.EventCounter in all the log4j.properties files.

（只要按照警告提示修改即可）。

-------------------------------------------------------finish all

接着只要输入命令：hive

就可以显示出：

hive>

输入命令show tables；（不要忘记加上分号，否则不会执行）

输入命令exit；（不要忘记加上分号）

退出hive

hive hadoop derby

ynkgyangxw

0 关注 0 粉丝 0 动态

关注关注

hdfs、hive、hbase的搭建总结

-- 完全分布式文件系统的名称：schema ip port -->. -- 分布式文件系统的其他路径的所依赖的一个基础路径，完全分布式不能使用默认值，因为临路径不安全，linux系统在重启时，可能会删除此目录下的内容-->. --

eternityzzy 2020-07-19

Hadoop

Zookeeper：用于 Hadoop 的分布式协调服务。Hadoop 的许多组件依赖于 Zookeeper，它运行在计算机集群中，用于管理 Hadoop 集群。像 Pig 一样，Hive 作为一个抽象层工具，吸引了很多熟悉 SQL 而不是 Java 编程

genshengxiao 2020-06-26

Hive安装，以及一些问题处理

把apache-hive-1.2.1-bin.tar.gz上传到linux的/opt/software目录下。注意以tab键间隔。hive> create table student ROW FORMAT DELIMITED FIELDS TERMI

victorzhzh 2020-06-16

hadoop hdfs csv导入hive表

row format delimited fields terminated by ‘,‘ stored as textfile;

archive 2020-05-28

hadoop 伪分布式单机部署练习hive

usermod -a -G hadoop haddop 第一个hadoop是组名，-a 防止其他用户组的hadoop离开，保持旧的用户组拥有hadoop用户状态。但事实上在生产系统里，NameNode、DataNode等进程都应单独配置目录，而且配置的应该

taisenki 2020-05-27

3（Hive）

Hive 运行时，元数据存储在关系型数据库里面。用户接口主要有三个：CLI，Client 和 WUI。其中最常用的是CLI，Cli启动的时候，会同时启动一个Hive副本。Client是Hive的客户端，用户连接至Hive Server。Hive中的元数据包

archive 2020-07-30

Hive函数大全-完整版

现在虽然有很多SQL ON Hadoop的解决方案，像Spark SQL、Impala、Presto等等，但就目前来看，在基于Hadoop的大数据分析平台、数据仓库中，Hive仍然是不可替代的角色。尽管它的相应延迟大，尽管它启动MapReduce的时间相当

成长之路 2020-07-28

hive函数之~hive当中的lateral view 与 explode

lateral view用于和split、explode等UDTF一起使用的，能将一行数据拆分成多行数据，在此基础上可以对拆分的数据进行聚合，lateral view首先为原始表的每行调用UDTF，UDTF会把一行拆分成一行或者多行，lateral vie

taisenki 2020-07-05

hive函数之~窗口函数与分析函数

)row format delimited fields terminated by ‘,‘;第一个参数为列名，第二个参数为往上第n行，第三个参数为默认值。当ORDER BY和窗口从句都缺失, 窗口规范默认是 ROW BETWEEN UNBOUNDED P

tugangkai 2020-07-05

hive函数之~reflect函数

reflect函数可以支持在sql中调用java中的自带函数，秒杀一切udf函数。create table test_udf row format delimited fields terminated by ‘,‘;hive > create ta

SignalDu 2020-07-05

hive函数之~条件函数

‘tom‘ when 2=2 then ‘mary‘ else ‘tim‘ end from tableName;

genshengxiao 2020-07-05

hive函数之~日期函数

语法: datediff返回值: int说明: 返回结束日期减去开始日期的天数。

tomson 2020-07-05

hive函数之~字符串函数

int start, int len)返回值: string说明：返回字符串A从start位置开始，长度为len的字符串。注意，在有些情况下要使用转义字符,类似oracle中的regexp_replace函数。index)返回值: string说明：将字符

zlsdmx 2020-07-05

hive函数之~关系运算

select 1 from tableName where 1 <> 2;hive> select 1 from tableName where 1 < = 1;select 1 from tableName where 2 >

tomson 2020-07-05

Hive使用

大量的hive查询任务，如果用交互式shell来进行输入的话，显然效率及其低下，因此，生产中更多的是使用脚本化运行机制：。hive -e "insert into table t_dest select * from t_src;".

tugangkai 2020-07-04

Hive的安装与启动

<description>JDBC connect string for a JDBC metastore</description>. <description>Driver class name for a JDBC

tomson 2020-07-05

Hive llap服务安装说明及测试（二）

因为Apache Slider 已经不维护了，下面介绍不使用 Slider 的 LLAP使用方式。

xieting 2020-06-28

Hive学习之路（二）Hive安装

bin binary-package-licenses conf examples hcatalog jdbc lib LICENSE NOTICE RELEASE_NOTES.txt scripts. -- 如果 mysql 和 hi

Zhangdragonfly 2020-06-28

（一）hive远程模式搭建

# scp -r /opt/soft/mysql-5.7.18-1.el7.x86_64.rpm-bundle.tar :/usr/ 发安装包。# rpm -qa|grep mariadb 检查：这是离线包安装方式所以要检查并且卸载mariadb. #

成长之路 2020-06-26

Hive学习(二)【数据类型、类型转换】

可以指定字符集。可以使用单引号或者双引号。和c语言中的struct类似，都可以通过“点”符号访问元素内容。MAP是一组键-值对元组集合，使用数组表示法可以访问数据。数组是一组具有相同类型和名称的变量的集合。例如CAST将把字符串‘1‘ 转换成整数1；如果强

tomson 2020-06-26

安科网

基于Hadoop集群的Hive安装

ynkgyangxw

ynkgyangxw

相关推荐

hdfs、hive、hbase的搭建总结

Hadoop

Hive安装，以及一些问题处理

hadoop hdfs csv导入hive表

hadoop 伪分布式单机部署练习hive

3（Hive）

Hive函数大全-完整版

hive函数之~hive当中的lateral view 与 explode

hive函数之~窗口函数与分析函数

hive函数之~reflect函数

hive函数之~条件函数

hive函数之~日期函数

hive函数之~字符串函数

hive函数之~关系运算

Hive使用

Hive的安装与启动

Hive llap服务安装说明及测试（二）

Hive学习之路（二）Hive安装

（一）hive远程模式搭建

Hive学习(二)【数据类型、类型转换】

ynkgyangxw