[Hive]编写non-deterministic的UDF时遇到的谓词下推（Predicate

longshenlmj

2013-11-10

关注关注

遇到这样一个问题：

hive> desc ljn001;

name string

value int

hive> select * from ljn001;

wang5 92

zhang3 87

li4 73

查询SQL如下：

select name

from

(select name,row_number(1) as rn

from

(select *

from ljn001 order by value

) a

where rn = 1;

但是结果却意想不到：

wang5

竟然把value最大的给取出来了！不筛选rn再看一下：

select name,rn

from

(select name,row_number(1) as rn

from

(select *

from ljn001 order by value

) a

) a;

li4 1

zhang3 2

wang5 3

明明是li4对应的1，为什么筛选rn = 1却得到的是wang5 ？

看一下执行计划，豁然开朗了：

explain select name

from

(select name,row_number(1) as rn

from

(select *

from ljn001 order by value

) a

where rn = 1;

STAGE DEPENDENCIES:

Stage-1 is a root stage

Stage-0 is a root stage

STAGE PLANS:

Stage: Stage-1

Map Reduce

Alias -> Map Operator Tree:

a:a:ljn001

TableScan

alias: ljn001

Filter Operator

predicate:

expr: (row_number(1) = 1)

type: boolean

Select Operator

expressions:

expr: name

type: string

expr: value

type: int

outputColumnNames: _col0, _col1

Reduce Output Operator

key expressions:

expr: _col1

type: int

sort order: +

tag: -1

value expressions:

expr: _col0

type: string

expr: _col1

type: int

Reduce Operator Tree:

Extract

Select Operator

expressions:

expr: _col0

type: string

expr: row_number(1)

type: bigint

outputColumnNames: _col0, _col1

Filter Operator

predicate:

expr: (_col1 = 1)

type: boolean

Select Operator

expressions:

expr: _col0

type: string

outputColumnNames: _col0

File Output Operator

compressed: true

GlobalTableId: 0

table:

input format: org.apache.Hadoop.mapred.TextInputFormat

output format: org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat

Stage: Stage-0

Fetch Operator

limit: -1

Hive 的详细介绍：请点这里
Hive 的下载地址：请点这里

相关阅读：

select hive

longshenlmj

0 关注 0 粉丝 0 动态

关注关注

Golang 定时器(Timer 和 Ticker),这篇文章就够了

Golang 原生 time 包下可以用来执行一些定时任务或者是周期性的任务的一个工具。本文基于 Go 1.14，如果以下文章有哪里不对或者问题的地方，欢迎讨论学习。定时器的日常使用。timer.Stop() // 这里来提高 timer 的回收。tCha

专注前端开发 2020-10-21

Mysql 实现字段拼接的三个函数

给运营导出数据时，难免需要对字段进行拼接，如果 Mysql 可以完成的话，就可以少些很多代码。不过如果有字段值为 NULL，则结果为 NULL。上面这种方式如果想要使用分隔符分割，就需要每个字段中间插一个字符串，非常麻烦。concat_ws() 可以一次性

苏康申 2020-11-13

详解 MySQL中count函数的正确使用方法

当搞清楚count函数的运行原理后，相信上面几个问题的答案就会了然于胸。为了解决上述的问题，我创建了一张 user 表，它有两个字段：主键id和name，后者可以为null，建表语句如下。`id` int NOT NULL AUTO_INCREMENT C

vitasfly 2020-11-12

oracle锁表该如何解决

where l.object_id　=　o.object_id and l.session_id=s.sid;如果杀不掉可以加个 immediate 立即杀掉试试；如果利用上面的命令杀死一个进程后，进程状态被置为"killed"，但是

oraclemch 2020-11-06

SQL Server如何通过创建临时表遍历更新数据详解

前段时间新项目上线为了赶进度很多模块的功能都没有经过详细的测试导致了生成环境中的数据和实际数据对不上，因此需要自己手写一个数据库脚本来更新下之前的数据。关于数据统计汇总的问题肯定会用到遍历统计汇总，那么问题来了数据库中如何遍历呢？好像并没有for和fore

liuyang000 2020-09-25

ThinkPHP5 链式操作table用法

table方法主要用于指定操作的数据表。用法一般情况下，操作模型的时候系统能够自动识别当前对应的数据表，所以，使用table方法的情况通常是为了：。需要注意的是table方法不会改变数据库的连接，所以你要确保当前连接的用户有权限操作相应的数据库和数据表。切

FellowYourHeart 2020-10-05

sql注入 --显错注入

jiong 2020-09-17

Orcle11G创建表空间，创建用户，授权等操作

CREATE USER caiyl IDENTIFIED BY 123456 DEFAULT TABLESPACE caiyl_space;GRANT CREATE USER,DROP USER,ALTER USER ,CREATE ANY VIEW ,A

赵继业 2020-08-17

SQL 创建、更新和删除视图的方法

视图是可视化的表。本章讲解如何创建、更新和删除视图。视图包含行和列，就像一个真实的表。您可以向视图添加 SQL 函数、WHERE 以及 JOIN 语句，也可以呈现数据，就像这些数据来自于某个单一的表一样。视图 "Current Product L

whyname 2020-08-16

oracle 日期操作语句总结

SELECT TO_CHAR AS YEAR FROM DUAL--查询当前年份。SELECT TO_CHAR AS MONTH FROM DUAL--获取当前日期的'YYYY/MM/DD'格式：2020/01/02. SELECT TO_CHAR AS

Seandba 2020-08-16

ORACLE数据库中Rownum用法详解

ORACLE 中ROWNUM用法总结!对于 Oracle 的 rownum 问题，很多资料都说不支持>,>=,=,between...and，只能用以上符号(<、<=、!=)，并非说用>,& gt;=,=,betwee

dbasunny 2020-08-16

MySQL如何创建视图

可以使用 CREATE VIEW 语句来创建视图。该名称在数据库中必须是唯一的，不能与其他表或视图同名。用户除了拥有 CREATE VIEW 权限外，还具有操作中涉及的基础表和其他视图的相关权限。SELECT 语句不能包含 FROM 子句中的子查询。可使用

拼命工作好好玩 2020-08-15

详细分析mysql视图的原理及使用方法

在MySQL中，视图可能是我们最常用的数据库对象之一了。那么你知道视图和表的区别吗？可能很多人对视图只是一知半解，想详细了解视图的同学看过来哟，本篇文章会详细介绍视图的概念、创建及使用方法。当我们创建一个视图的时候，实际上是在数据库里执行了SELECT语句

langyue 2020-08-15

MySQL约束

分别查询男、女同学的平均分,人数要求：分数低于70分的人，不参与分组,分组之后。

好记忆也需烂 2020-08-15

MySQL实现根据当前ID读取上一条和下一条记录

SELECT * FROM A WHERE ID < 5 ORDER BY ID DESC LIMIT 0,1; ps: select * from table1 where id<$id order by iddesc limit

写程序的赵童鞋 2020-08-03

mysql 14 覆盖索引+回表

MySQL可以利用索引返回select列表中的字段值。而不必根据主键再次读取聚簇索引数据文件查到数据，也就是平时所说的不需要回表操作。覆盖索引其实是索引覆盖的意思，索引字段就已经囊括select查询的字段，即索引字段覆盖了需查询的字段。t; 即id是聚集索

Accpcjg 2020-08-02

go语言中——select的使用方法

早期的select函数是用来监控一系列的文件句柄，一旦其中一个文件句柄发生IO操作，该select调用就会被返回。golang在语言级别直接支持select，用于处理异步IO问题。可以看出，ch初始化后，case1读取失败，timeout同样失败，因为ch

tydldd 2020-07-30

Mysql入门 DML语句大全DML、DDL、DCL

Mysql 数据库语句 1、说明：创建数据库CREATE DATABASE database-name2、说明：删除数据库drop database dbname3、说明：备份sql server--- 创建备份数据的 deviceUSE masterE

好记忆也需烂 2020-07-28

jianghero 2020-07-28

Selenium 获取Select元素的选中值

obj_select = Select #强制类型转换为Select类型

Reiki 2020-07-28

安科网

[Hive]编写non-deterministic的UDF时遇到的谓词下推（Predicate

longshenlmj

longshenlmj

相关推荐

Golang 定时器(Timer 和 Ticker),这篇文章就够了

Mysql 实现字段拼接的三个函数

详解 MySQL中count函数的正确使用方法

oracle锁表该如何解决

SQL Server如何通过创建临时表遍历更新数据详解

ThinkPHP5 链式操作table用法

sql注入 --显错注入

Orcle11G创建表空间，创建用户，授权等操作

SQL 创建、更新和删除视图的方法

oracle 日期操作语句总结

ORACLE数据库中Rownum用法详解

MySQL如何创建视图

详细分析mysql视图的原理及使用方法

MySQL约束

MySQL实现根据当前ID读取上一条和下一条记录

mysql 14 覆盖索引+回表

go语言中——select的使用方法

Mysql入门 DML语句大全DML、DDL、DCL

fiddler相关命令的使用

Selenium 获取Select元素的选中值

longshenlmj