hbase0.9x开发笔记(包括hbase的bug,coprocessor,分布式计算,scan)

1.前言。

如题。

2.问题描述。(不断更新中)

(1)hbase表在加入了coprocessor后,无法进行scan了,这应该是个bug.

(2)hbase的split,Compaction,balance都是hbase的bug,这三个东西本身就不该存在。在不需要分布式计算的时候,这三个粗粒度的功能还凑合着可以在map-reduce这种低效率任务中用用。但发展到分布式计算的今天,这三个功能必须去掉,或者完全由用户来决定,否则将对分布式运算起着致命性打击。顺便说一下,固定region分布对于分布式运算非常重要,由固定region引发的问题,应该由用户自身承担和解决。

(3)hbase0.92以上版本的coprocessor的内部scan不支持setStartRow,setStopRow,不支持filter,请问,这个东西还有什么用?希望官方能修复一下,这应该是功能缺失。

(4)固定regionserver数,每个regionserver固定region现在还是不能严格保证,希望能保证一下,如果不能严格执行分布式运算,hbase的路就已经到头了。

(5)由log引发的split应该算作hbase的一个bug,日志不应该split,统一放到master就好,如果需要备份,额外进行处理就好。

(6)任何打断集群插入和查询,打断表的regions分配,打断集群工作的hbase自发操作都是bug,记住,开发者最需要的是,regions的数据是开发者自己通过设计可控制的,hbase不要随意去动。

相关推荐