Deepgreen与Greenplum TPC-H性能测试对比(使用VitesseData脚本)
前两天发了一篇基于[德哥测试脚本]的测试对比文章《Deepgreen与Greenplum TPC-H性能测试对比(使用德哥脚本)》,由于测试数据量少,两个数据库有几轮测试都是1秒持平,但是大多数测试Deepgreen均优于Greenplum,有的甚至快至百倍,感兴趣的朋友可以再回头看看。
今天分享一下Deepgreen提供的TPC-H测试脚本,这个脚本分为浮点类型、数值类型两类进行22轮测试,更加细化,并且结果值更加中肯。
一、测试环境
服务器 IP 节点
二、TPC-H脚本安装
脚本放在github上,有3种方式可以下载,为方便大家,分别介绍一下:
1. 如果已经与github主机建立ssh互信(点此访问建立方法):
# 使用语句克隆repo:
2.如果懒得建立ssh互信,但是本机装有git工具:
# 克隆bench:
3. 如果你机器上什么都没有,或者不能直接访问外网:
访问 - https://github.com/vitessedata/bench,点击右侧clone or download按钮
三、执行测试
1. 登录服务器重新编译:
cd bench/tpch-dbgen
2. 生成测试文件、初始化数据库、加载数据:
[dgadmin@linux1 bench]$ python create.py 10f
备注:create.py脚本解读:
该脚本用于创建测试数据文件、创建数据库、初始化表、初始化试图、加载数据文件到数据库表、Analyze数据库。
它接受一个参数,用于指定测试的数据类型及数据量,具体如下:
1f: scale 1 with float8 type
1n: scale 1 with numeric type
10f: scale 10 with float8 type
10n: scale 10 with numeric type
3. 执行测试:
[dgadmin@linux1 bench]$ python run.py 10f
备注:run.py脚本解读:该脚本用于执行测试,脚本接受一个参数,指定测试类型及数据量,与create.py脚本参数一致。
四、对比结果
最终结果分四列展示,分别为:查询编号、Greenplum查询耗时、Deepgreen查询耗时、加速倍数。下面为10G数据量解释结论:
1. float8:
1 13514 2399 5.63
2. numeric:
[dgadmin@linux1 bench]$ python run.py 10n
End~