性能优化技巧 - 多层排号键

ssddgkke

2019-07-01

排号键是SPL独特的数据类型，适合替代多层次、各层不连续的键值，比如身份证号、合同编号、产品编号、组织机构代码等。排号键定位速度快，常用于优化内存索引查询和外键关联计算。

内存索引查询

cardNormal.btx是集文件格式的身份证信息表，数据量一百万条，字段为：cardNo（身份证，主键）,name（姓名）,gender（性别）,province（省份）,email（电子邮件）,mobile（移动电话）,address（住址）。cardK.btx与cardNormal.btx在结构和数据上完全相同，唯一的区别在于cardNo字段是排号键。

本案例对cardNormal.btx和cardK.btx分别执行百万次索引查询，并比较两者性能。

其中cardNo是简化后的身份证，格式如下：

性能优化技巧 - 多层排号键

省、地区：各自取值范围为1-10。

生日：取值为"1980-06-01"至"1981-01-01"。

流水：取值为1-100。

校验：根据前15位计算出的冗余校验位，取值为0至10，其中10用x来表示。

将上述身份证转为排号键，可采取如下思路：

1. 省、地区：排号键的每一层只支持1-255的整数，因此将省和地区分别转为整数，作为第1、2层排号键。

2. 生日：排号键以1为起始，可以取得更好的性能，因此算出原生日和1980-06-01的间隔天数，作为第3层排号键。

3. 流水：转为整数，作为第4层的排号键。

4. 校验位：冗余数据，可删除。

具体转换脚本如下：

性能优化技巧 - 多层排号键

下面对cardNormal.btx和cardK.btx分别执行百万次索引查询。

性能优化技巧 - 多层排号键

A8：对排号键建立内存哈希索引，需使用函数选项@s。

可以看到，对字符串键建立索引，查询需耗费5547毫秒，而排号键只需1977毫秒，后者明显快。

外键关联查询

taxNormal.btx是集文件格式的报税信息表，数据量一千万条，字段为：serial（主键，流水号）,cardNo（外键，身份证）,tax（报税额）,area（所属地区）,declaretype（申报类型）,unit（申报单位）,declareTime（申报时间）,network（办理网点）。taxK.btx 与taxNormal.btx在结构和数据上完全相同，唯一的区别在于cardNo字段是排号键。

本案例算法：

1. 对taxNormal.btx和cardNormal.btx进行外键关联计算，排除操作系统缓存和硬盘IO的影响，只取关联动作消耗的时间。

2. 对taxK.btx和cardK.btx进行外键关联计算，排除操作系统缓存和硬盘IO的影响，只取关联动作消耗的时间。

3. 比较1和2的差异。

具体算法如下：

性能优化技巧 - 多层排号键

B2、B7、B13、B19：预遍历游标，避免操作系统缓存的影响。遍历之后需用reset函数重置游标，以便后续再次遍历。

B11、B23：用总时间减去遍历时间，获得关联动作消耗的时间。

可以看到，用普通键做外键关联计算，其关联动作耗时7553ms；排号键做外键关联计算时，只需耗时966ms，后者明显快。而且可以看出，使用排号键读出记录（fetch）的时间也少于使用字符串（其它字段和记录行数都相同），说明排号键对象的生成性能更好。

性能优化外键 segmentfault 身份证

安科网

性能优化技巧 - 多层排号键

ssddgkke

内存索引查询

外键关联查询

ssddgkke

相关推荐

我在大厂写React学到了什么？性能优化篇

前端一面基础知识 ⑥——性能优化、Web安全、Linux常用命令

性能优化-一个命令发现性能问题

MySQL数据库查询性能优化策略

Linux 性能优化 - 01、开山初始篇

前端性能优化之重排和重绘

Vue项目性能优化实践

react组件通信，引出性能优化问题

SQL 性能优化技巧 part1

怎么实现前端性能优化和图片懒加载

MySQL 性能优化细节

Vue之性能优化篇

linux 性能优化之CPU性能(2)

webpack性能优化

webpack性能优化2

性能优化-记录工作中遇到的点滴

Oracle性能优化

年薪80W的架构师总结：性能优化其实不难，记住这十条策略就够了

前端性能优化：当页面渲染遇上边缘计算

杂谈WebApiClient的性能优化

ssddgkke