关于Infobright 的几种数据格式
如果大家用到INFOBRIGHT,对这个字眼就不陌生了。
目前有4种格式。
1. binary.
2. txt_variable
3. mysql
4. infobright
代表什么意思呢,我来详细解释下。
BINARY 代表二进制数据。 也就是说,原始数据是以特定格式的二进制来保存。 具体格式,可以参见官方的白皮书,很容易下载到。
TXT_VARIABLE 代表 CSV格式文本。默认的列分隔符为“;”。
MYSQL 代表和MYSQL兼容的CSV格式文本。默认分隔符为“水平制表符“。
INFOBRIGHT 呢,代表分布式导入工具(DLP)生成的中间结果集, 只能用来导入DLP的中间数据。
这几种格式的载入速度按照以下顺序,由高到低排列:
INFOBRIGHT ---> BINARY ---> TXT_VARIABLE ---> MYSQL。
可以看到MYSQL载入最慢。 但是MYSQL能打印出来更多的错误信息以供调试。
设置方法:
set @bh_dataformat = '随便一种';
即可。
相关推荐
CoderToy 2020-11-16
emmm00 2020-11-17
王艺强 2020-11-17
ribavnu 2020-11-16
bianruifeng 2020-11-16
wangshuangbao 2020-11-13
苏康申 2020-11-13
vivenwan 2020-11-13
moyekongling 2020-11-13
云中舞步 2020-11-12
要啥自行车一把梭 2020-11-12
aydh 2020-11-12
kuwoyinlehe 2020-11-12
minerk 2020-11-12
vitasfly 2020-11-12
jazywoo在路上 2020-11-11
敏敏张 2020-11-11
世樹 2020-11-11