数据库和BI工程师面试题
一.数据库
1.Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用?
2.Oracle数据库,有哪几类索引,分别有什么特点?
3.Union与Union All的区别?
4.对游标的理解?游标的分类?使用方法?
5.如何查找和删除表中的重复数据?给出方法或SQL。
6.不借助第三方工具,怎么查看SQL的执行计划?
7.创建索引有哪些需要注意的要点?
8.Oracle数据库中,有哪几种分区?各自特点是什么?作用是什么?分区索引的分类和作用?
9.表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。
10.备份如何分类?归档是什么含义?
11.如果系统现在需要在一个很大的表上创建一个索引,需要考虑那些因素,如何做到尽量减小对应用的影响?
12.是否有海量数据处理经验?有何方法?
二.ETL工具
1.Informatica中,Update组件叫什么?更新机制?
2.Informatica中,LookUp组件有哪几类?区别是什么?
3.Informatica中,如何调用存储过程?
4.Informatica中,工作流控制有哪些组件?
5.Informatica优化方案?
6.DataStage的JOB有哪些类型?特点分别是什么?
7.DataStage中,如何设置parallel job并行运行?
8.DataStage中,Join Stage 与 Lookup Stage组件在使用上有何区别?
9.DataStage的优化方案?
三.模型设计
1.有哪几种模型设计方法?特点分别是什么?
2.模型设计的步骤?
3.维度模型的设计方法?
4.模型设计的思路?业务需求驱动?数据驱动?
5.模型设计经验说明。在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主要的工作是什么?
四.Cognos开发
1.Cube刷新方案?
2.报表数据权限控制方案?
3.Cube增量刷新方案?
五.Shell开发
1.在Unix/Linux中,查看磁盘空间可以用哪些命令?
2.在Unix/Linux中,压缩和解压缩文件可以用哪些命令?
3.sed命令的作用?
4.在Unix/Linux中,添加用户用什么命令?
5.在Unix/Linux中,查看文件行数什么命令?
六.数据仓库设计
1.增量数据获取方案?
2.请解释以下概念:数据集市、事实表、维度表、OLAP
3.元数据管理在数据仓库中的运用有何心得?
4.数据仓库系统的数据质量如何保证?方案?
5.数据仓库系统组件接口设计方案?