hive数据库如何去重,去除相同的一模一样的数据
问题:发现存在一张表中存在相同的两行数据
得到:仅仅保留一行数据
方法:
原理-我们通过
select count (字段1,字段2) from 表1; 结果 200条数据 select count (distinct 字段1,字段2) from 表1; 结果 100条数据 相当于后者可以实现查出来去重后的数据 create table 表1_bak as select distinct 字段1,字段2 from 表1; --备份表数据 delete from 表1; insert into 表1 select * from 表1_bak;
相关推荐
专注前端开发 2020-10-21
苏康申 2020-11-13
vitasfly 2020-11-12
oraclemch 2020-11-06
liuyang000 2020-09-25
FellowYourHeart 2020-10-05
赵继业 2020-08-17
whyname 2020-08-16
Seandba 2020-08-16
dbasunny 2020-08-16
拼命工作好好玩 2020-08-15
langyue 2020-08-15
写程序的赵童鞋 2020-08-03
Accpcjg 2020-08-02
tydldd 2020-07-30
好记忆也需烂 2020-07-28
jianghero 2020-07-28