分布式系统 读书笔记(一)基础了解
1.网络通信
1.1 OSI
application,presentaion,session,
transport,
network,
data Link,physical
1.2 TCP/IP
application
transport
internetwork
network interface
2.网络IO实现方式
BIO,NIO,AIO
BIO即Block IO,采用阻塞的方式实现。
NIO即Nonblocking IO 基于事件驱动思想,采用的是reactor模式
AIO 即 AsynchronousIO 就是异步IO。采用的是Proactor模式
如果同时连接数不多,采用BIO也是一个很好的选择
3.控制器发生的变化
控制器主要作用就是协调或控制节点之间的动作和行为。
3.1通过硬件负载均衡请求
3.2通过LVS软件负载均衡系统 特点是代价低,可控性强,即你可以相对自由地按照自己需求去增加负载均衡策略。一般称为透明代理
3.3通过名称服务 , 没有代理服务器设备的存在,而是请求发起方和请求处理方的直接连接。作用主要是两个,一个是收集提供请求处理的服务器的地址信息,另外一个是提供这些地址信息给请求发起方。说白了就是起到了一个地址交换的作用。
3.4规则服务器 也是发起方和处理方直接连接不同的是 请求时 会获取服务器给的规则 ,在请求发起的机器上会对规则进行代码逻辑处理。
3.5 master+Worker方式 直接由master节点去管理 任务并且去分配给worker。
4运算器的变化
有单机到多机
本来是一个用户访问单台网站服务器
当网站服务器多了就需要解决办法
4.1采用DNS 进行调度和控制
4.2 采用DNS+负载均衡 硬软都可以。 DNS返回的永远是负载均衡地址,用户访问的是负载均衡到达后面的网站服务器
5.存储器的变化
由单台存储服务器扩展到多台怎么处理呢?
5.1使用代理服务器 对应用服务器和KV存储服务器进行控制转发
5.2 名称服务
5.3 规则服务器
5.4 master控制
要搞分布式 首先我们要考虑的是有哪些难点,并且怎么处理这些难点
1.缺乏全局时钟
怎么说呢 以前都在一个服务器上运行,单机时间都一致,现在是多个服务器,每个服务器独有自己的时钟,在通过相互发送消息进行协调时,如果仍然依赖时序,就会相对难处理。
可以考虑通过一个单独的集群去区分多个动作的顺序。 (还没搞明白到底怎么处理)
2.面对故障独立性
3.处理单点故障
给这个单点做好备份,能够在出现问题时进行恢复,并且尽量做到自动恢复,降低恢复需要用的时间
降低单点故障的影响范围。
列如 交易网站部分,交易数据都放在一个数据库,就形成了单点。虽然数据库出现问题概率不高,一旦出现就非常严重。
因此我们可以考虑拆分数据。
把一个交易数据库拆分为两个,根据一定的规则做Sharding。这样风险降低了一半,如果拆分为更多单位那么风险降低更多。
4. 事务的挑战