Python操作 Memcached

Memcached

Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据 库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。

在使用Memchched前,先来安装一下,安装环境是Linux服务器:

1
2
3
4
5
6
7
wget http://memcached.org/downloads/memcached-1.4.29.tar.gz下载最新源码
tar -zxvf memcached-x.x.x.tar.gz
cd memcached-x.x.x
./configure && make && make test && sudo make install
PS:依赖libevent,需要提前安装
yum install libevent-devel
apt-get install libevent-dev

 启动Memcached

1
2
3
4
5
6
7
memcached -d -m 10 -u root -l 0.0.0.0 -p 12000 -c 256 -p /tmp/memcached.pid<br>-d:启动一个守护进程<br>
-m:分配给Memcache使用的内存数量,单位是MB<br>
-u :运行Memcache的用户<br>
-l :监听的服务器IP地址<br>
-p:设置Memcache监听的端口,最好是1024以上的端口<br>
-c :最大运行的并发连接数,默认是1024,按照服务器的负载量来设定<br>
-P:设置保存Memcache的pid文件

1.2 Python操作Memcached

安装API

  • python操作Memcached使用Python-memcached模块
  • 下载安装:https://pypi.python.org/pypi/python-memcached

操作方法:

set:传入两个参数name和value

 add:添加一条键值对。如果已经存在该 key,则弹出异常。

1
2
m.add('k1', 'v1')
m.add('k1', 'v2') # 已存在的key重复添加,会报错

replace:修改某个key的值,如果key不存在,则异常.

1
m.replace('kkkk','999')

 set 和 set_multi
set: 设置一个键值对,如果key不存在,则创建,如果key存在,则修改
set_multi: 设置多个键值对,如果key不存在,则创建,如果key存在,则修改

1
2
m.set('key0', 'jack')
m.set_multi({'key1': 'val1', 'key2': 'val2'})

 delete 和 delete_multi
delete: 删除��定的一个键值对
delete_multi: 删除指定的多个键值对

1
2
m.delete('key0')
m.delete_multi(['key1', 'key2'])

 get 和 get_multi
get: 获取一个键值对
get_multi : 获取多一个键值对

1
2
val = m.get('key0')
item_dict = m.get_multi(["key1", "key2", "key3"])

append 和 prepend
append : 修改指定key的值,在原来的值后面追加内容
prepend 修改指定key的值,在原来的值前面插入内容

1
2
3
4
5
# k1 = "v1"
m.append('k1', 'after')
# k1 = "v1after"
m.prepend('k1', 'before')
# k1 = "beforev1after"

decr 和 incr  
incr : 自增,将值增加 N ( N默认为1 )
decr :自减,将值减少 N ( N默认为1 )

1
2
3
4
5
6
7
8
9
m.set('k1', '777')
m.incr('k1')
# k1 = 778
m.incr('k1', 10)
# k1 = 788
m.decr('k1')
# k1 = 787
m.decr('k1', 10)
# k1 = 777

 gets 和 cas

使用缓存系统共享数据资源就必然绕不开数据争夺和脏数据的问题。举个例子:
假设商城某件商品的剩余个数保存在memcache中,product_count = 900
A用户刷新页面从memcache中读取到product_count = 900
B用户刷新页面从memcache中读取到product_count = 900

A、B用户均购买商品,并修改product_count的值:

A用户修改后 product_count=899
B用户修改后 product_count=899
如此一来缓存内的数据便不再正确,实际此时product_count应该等于898.
如果使用python的set和get来操作以上过程,那么程序就会如上述所示情况!

如果想要避免此情况的发生,需要使用 gets 和 cas ,如:

1
2
3
4
5
6
7
8
9
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import memcache
mc = memcache.Client(['10.211.55.4:12000'], debug=True, cache_cas=True)
  
v = mc.gets('product_count')
# ...
# 如果有人在gets之后和cas之前修改了product_count,那么,下面的设置将会执行失败,剖出异常,从而避免非正常数据的产生
mc.cas('product_count', "899")

本质上每次执行gets时,会从memcache中获取一个自增的数字,通过cas去修改gets的值时,会携带之前获取的自增值和memcache中的自增值进行比较,如果相等,则可以提交;如果不相等,那表示在gets和cas执行之间,又有其他人执行了gets,则不允许修改。 

集群操作

python-memcached模块原生支持集群操作,其原理是在内存维护一个主机列表,且集群中主机的权重值和主机在列表中重复出现的次数成正比。

主机 权重
1.1.1.1 1
1.1.1.2 2
1.1.1.3 1

那么在内存中主机列表为:host_list = ["1.1.1.1", "1.1.1.2", "1.1.1.2", "1.1.1.3", ]
用户如果要在内存中创建一个键值对(如:k1 = "v1"),那么要执行以下步骤:

  1. 根据算法将 k1 转换成一个数字
  2. 将数字和主机列表长度求余数,得到一个值 N( 0 <= N < 列表长度 )
  3. 在主机列表中根据 第2步得到的值为索引获取主机,例如:host_list[N]
  4. 连接 将第3步中获取的主机,将 k1 = "v1" 放置在该服务器的内存中

代码如下:

1
2
m = memcache.Client([('1.1.1.1:12000', 1), ('1.1.1.2:12000', 2), ('1.1.1.3:12000', 1)], debug=True)
m.set('k1', 'v1')

Memcached 的详细介绍:请点这里
Memcached 的下载地址:请点这里

相关推荐