Apache Mesos底层基础库

1. Protocol buffer

Protocal Buffer是google开源的用于数据交换的库,常用于跨语言的数据访问,担任的角色一般为对象的序列化/反序列化。 另一个与之类似的开源软件是facebook开源的thrift,它们两个最大区别是thrift提供了自动生成RPC的功能而Protocal Buffer需要自己实现,但Protocal Buffer的一个优势是其序列化/反序列化非常高效。

2. Libprocess

libprocess是采用C/C++编写的高效消息传递编程模型(基于消息传递的网络通信模型,而不是RPC),由伯克利开源。 其整个实现非常简单,包括最基本的消息发送和接收等。

2.1 Libprocess模型

在mesos中,主要有四个角色,分别是:mesos-master,mesos-slave,framework(Hadoop/Spark /MPI等) scheduler,executor(在mesos-slave上执行framework task的组件),每种角色均是一个Process,在实现时会继承libprocess中的ProtobufProcess类(它又继承了 Process类),这样,它们均会编成一个后台运行且不断监听protocal buffer消息的socket server,如下图所示:

Apache Mesos底层基础库

2.2 各种常用函数

Libprocess+protocol buffer组合是mesos最底层最重要的消息传递基础库(没有采用RPC机制),由于该库采用了基于Protocal Buffer消息传递的通信机制),因而非常高效。Mesos常用的两个头文件是libprocess\include\process下的 process.hpp和protobuf.hpp,这两个提供了用于消息传递的API,其中process.hpp是最核心的文件,提供了原始的接口, 而protobuf.hpp是在process.hpp基础上,加入了ProtocalBuffer对象参数,使ProtocalBuffer使用起来更 加容易。

(1) install

void install(void (T::*method)(P1C),P1 (M::*param1)() const);

安装一个处理ProtocalBuffer消息的handler,其中,消息类型是M,该消息对应的处理函数是method,函数参数为M::*param1。举例:mesos中slave/slave.cpp:

install( 


      &Slave::newMasterDetected, 


      &NewMasterDetectedMessage::pid); 

安装一个处理NewMasterDetectedMessage(ProtocalBuffer对象)的handler,mesos slave一旦接收到该消息,便会调用newMasterDetected函数处理, 且该函数的输入参数是NewMasterDetectedMessage消息中的pid属性。

void install(const std::string& name,void (T::*method)(const UPID&, const std::string&)) 

安装一个处理字符串的handler,也就是说,当收到字符串name后,调用函数method进行处理。这个API在mesos中的典型应用时维持master与slave之间的心跳,以确定彼此活着:

在slave/slave.cpp中:

install("PING", &Slave::ping); 


  


void Slave::ping(const UPID& from, const string& body) 


{ 


  send(from, "PONG"); 


} 

在master/master.cpp中:

install("PONG", &SlaveObserver::pong); 


  void pong(const UPID& from, const string& body) 


  { 


    timeouts = 0; 


    pinged = false; 


  } 


  void timeout() 


  { 


    if (pinged) { // So we haven't got back a pong yet ... 


      if (++timeouts >= MAX_SLAVE_TIMEOUTS) { 


        deactivate(); 


        return; 


      } 


    } 


    send(slave, "PING"); 


    pinged = true; 


    delay(SLAVE_PONG_TIMEOUT, self(), &SlaveObserver::timeout); 


  } 

(2) send

void send(const process::UPID& to, const google::protobuf::Message& message) 

向某个UPID上发送消息,其中UPID代表一个socket,里面含有ip和port信息,而消息message是ProtocalBuffer定义的对象。

(3) dispatch

void dispatch(const UPID& pid, 


  const std::tr1::shared_ptr >& f) 

执行进程pid中的函数f,为了提高效率,该函数并不会等到函数f执行完成,而是采用了异步的方法:将函数f放入一个函数队列,由另外一个进程(或者多个)不断从队列中获取函数,依次执行。

(4) delay

Timer delay(double secs,const PID& pid,void (T::*method)()) 

延迟secs秒调度进程pid中的方法method,并返回一个计数器,通过这个计时器,可取消该调度。

在mesos中,巧妙地通过该函数构造了一个无限循环以不断检测空闲资源,并将之分配给各个框架,代码如下:

void Master::initialize() { 


…… 


  timerTickTimer = delay(1.0, self(), &Master::timerTick); 


} 


void Master::timerTick() { 


  …… 


  timerTickTimer = delay(1.0, self(), &Master::timerTick); 


} 

上面函数代码段可完成每1s调用一次timerTick函数的功能。

3. Boost

非常有名的开源C++基础库,里面的STL非常高效方便,已被很多著名软件采用。

4. Zookeeper

是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。 Mesos采用zookeeper解决master单点故障问题,使用zookeeper搭建一个master集群,当master出现故障时,选择一个 standby master 变为master。

5. glog

Google开源的C++日志库,主用于C++程序中打印日志,打印格式如下:

I0411 17:26:54.150193 20653 main.cpp:111] Creating “process” isolation module

I0411 17:26:54.150400 20653 main.cpp:119] Build: 2012-04-11 16:50:21 by root

I0411 17:26:54.150658 20653 main.cpp:120] Starting Mesos slave

I0411 17:26:54.152981 20669 slave.cpp:191] Slave started on 123.145.2.2:34694

I0411 17:26:54.153024 20669 slave.cpp:192] Slave resources: cpus=2; mem=490

6. gmock

开源 C++ 单元测试框架

7. 参考资料

(1)Mesos主页:http://www.mesosproject.org/index.html

相关推荐