C++实现的GFS--分布式文件系统KosmosFS的编译和简单部署

KosmosFS像Hadoop HDFS一样,是google GFS的开源实现,不过KFS是C++语言写成,目前只支持linux和solaris系统。由于使用了C++开发,所以必然比HDFS在性能和稳定性上有先天优势,在研究其源码之前,先看看如何编译部署它吧。很繁琐,因为KFS依赖了大量的第三方软件,而C++既依赖于操作系统又在软件工程上比java差,所以编译安装它要做大量准备工作。今天抽空装了个KFS,写下过程。

首先可以到http://code.google.com/p/kosmosfs/downloads/list上下载0.5版本的源码。我的Linux版本是CentOS 5.3 Final,linux kernel版本是2.6.18,大家可以参考。

这个项目依赖的东东非常多,强烈建议一定要装yum工具,减少我们的工作量。必须预先安装哪些包呢?列一下:
openssl
openssl-devel
xfsprogs
xfsprogs-devel
e2fsprogs
e2fsprogs-devel
log4cpp
boost
boost-devel
大家执行下yum install -y [上面的包名],把以上必须装的包先装好。然后我们开始编译kosmosFS。假定我们把源码放在~/code/kfs目录下。

  1. cd ~/code/kfs  
  2. mkdir build  
  3. cd build  
  4. cmake -D CMAKE_BUILD_TYPE=RelWithDebInfo ~/code/kfs/  
  5. make  
  6. make install  

如果以上步骤都没有错误,将会在build目录下生成bin和lib目录。

如果需要编译支持java的client包,还需要安装ant工具,有了yum就简单了,在build的上一层目录执行:

  1. yum install -y ant  
  2. ant jar      

检查是否生成了build/kfs-0.5.jar 和build/class目录,确认是否成功。

下面我们可以部署KFS了,这点KFS做得很好,上面它依赖了xfs就是为了支持自动部署的。但是,这个自动部署(它也只支持自动部署)需要从安装机器能够无密码的ssh登录到目标机器。所以,我们也要安装个openssh:

yum install -y openssh*  

当A机器需要无密码的访问B机器时,我们需要先在B机器上用ssh-keygen -t rsa命令生成公匙id_rsa.pub,然后拷贝到A机器相应用户的.ssh目录下,覆盖authorized_keys文件。之后就不用再输入ssh密码了,这样我们的安装程序可以往下走了。

安装kfs一般只需要准备好一个文件即可,我们进入kfs/scripts目录,建立machines.cfg文件,文件内容可以如下:

  1. [metaserver]  
  2. node: localhost  
  3. rundir: /home/leon/kfsRun/meta  
  4. baseport: 20000  
  5. clusterkey: test-cluster  
  6. [chunkserver1]  
  7. node: localhost  
  8. rundir: /home/leon/kfsRun/chunk1  
  9. baseport: 30000  
  10. space: 10 G  
  11. [chunkserver2]  
  12. node: localhost  
  13. rundir: /home/leon/kfsRun/chunk2  
  14. baseport: 40000  
  15. space: 10000 M  

相关推荐