Python运维项目中用到的redis经验及数据类型

zhangaik

2014-07-09

先感叹下，学东西一定要活学活用！我用redis也有几年的历史了，今个才想到把集合可以当python list用。最近做了几个项目都掺杂了redis，遇到了一些个问题和开发中提高性能的方法，这都分享出来，共同学习。

下面先简单讲讲Redis集合的数据类型。

Sets 就是一个集合，集合的概念就是一堆不重复值的组合。利用Redis提供的Sets数据结构，可以存储一些集合性的数据，比如在微博应用中，可以将一个用户所有的关注人存在一个集合中，将其所有粉丝存在一个集合。Redis还为集合提供了求交集、并集、差集等操作，可以非常方便的实现如共同关注、共同喜好、二度好友等功能，对上面的所有集合操作，你还可以使用不同的命令选择将结果返回给客户端还是存集到一个新的集合中。上面说的是新浪微博的应用。

sadd，创建一个集合，并添加数据。

[root@66 ~]# redis-cli   



redis 127.0.0.1:6379>    




redis 127.0.0.1:6379>    




redis 127.0.0.1:6379> sadd xiaorui aaa   




(integer) 1   




redis 127.0.0.1:6379> sadd xiaorui bbb   




(integer) 1   




redis 127.0.0.1:6379> sadd xiaorui ccc   




(integer) 1   




redis 127.0.0.1:6379>    




redis 127.0.0.1:6379> SMEMBERS xiaorui   




1) "aaa" 




2) "ccc" 




3) "bbb" 




redis 127.0.0.1:6379>    




redis 127.0.0.1:6379>

set集合是不能写重复的内容的

redis 127.0.0.1:6379> sadd xiaorui fuck_shencan   



(integer) 1   




redis 127.0.0.1:6379> sadd xiaorui fuck_shencan   




(integer) 0   




redis 127.0.0.1:6379>

查看集合的大小

redis 127.0.0.1:6379> SCARD xiaorui   



(integer) 3   




redis 127.0.0.1:6379>

删除

redis 127.0.0.1:6379> SREM xiaorui aaa   



(integer) 1   




redis 127.0.0.1:6379> SMEMBERS xiaorui   




1) "ccc" 




2) "bbb" 




redis 127.0.0.1:6379>

两个集合的交集之处

redis 127.0.0.1:6379> SADD key1 a   



(integer) 1   




redis 127.0.0.1:6379> SADD key1 b   




(integer) 1   




redis 127.0.0.1:6379> SADD key1 c   




(integer) 1   




redis 127.0.0.1:6379> SADD key2 c   




(integer) 1   




redis 127.0.0.1:6379> SADD key2 d   




(integer) 1   




redis 127.0.0.1:6379> SADD key2 e   




(integer) 1   




redis 127.0.0.1:6379> SINTER key1 key2   




1) "c" 




redis 127.0.0.1:6379>

可以把集合当成redis list队列用，需要注意的是set集合的成员模式是不能有重复的值的。如果你的值不重复，你又蛋疼，还真的可以把set集合当成队列使用。

redis 127.0.0.1:6379> sadd myset one   



(integer) 1   




redis 127.0.0.1:6379> sadd myset two   




(integer) 1   




redis 127.0.0.1:6379> sadd myset three   




(integer) 1   




redis 127.0.0.1:6379> SPOP myset   




"one" 




redis 127.0.0.1:6379> SMEMBERS myset   




1) "three" 




2) "two" 




redis 127.0.0.1:6379>

前两天和朋友说，我那监控平台的内存吃的厉害，他一下子蹦出一句，redis吃内存肯定很大了。。。 nima，哥只是用他的大队列。这里说下，redis做队列的强度。一把来说100w条的队列数据，占用73M 内存左右。200w条数据内存在154M内存左右。

redis的堵塞取任务，最好少用，超过5个线程去brpop的话，会把redis的cpu使用率顶到80%左右，而且严重会影响别的进程的访问，如果确定任务不是每时每刻都有的情况下，最好在你的程序控制下他的访问频次和时间的间隔。

python处理redis的时候，最好要用pool，速度和资源明显的节省。

>>> pool = redis.ConnectionPool(host='localhost', port=6379, db=0)  


>>> r = redis.Redis(connection_pool=pool)

新版的redis是支持管道的，pipline ！有朋友不太理解，这里的管道有什么好处。 pyhton 虽然连接redis的时候用了连接池，但是这也只是连接方面做了keepalive而已，但是每次的命令推送，他还是一次命令一个交互的。用了pipline管道堵塞后，他会把所有的命令合成一个管道符推送到redis服务端。这样的话就省事了很多。这个特别适用于并发大的时候。

对于redis的pub sub通信性能的问题，可以用gevent来搞定。直接导入gevent猴子就可以了。

import gevent.monkey   


gevent.monkey.patch_all()   



#http://rfyiamcool.blog.51cto.com/1030776/1435539    




import os   




import sys   




import fcntl   




import gevent   




from gevent.socket import wait_read   



     



from redis import Redis   



     


PID = os.getpid()   


     



red = Redis('localhost')   



     



def echo_stdin():   




    # make stdin non-blocking   



    fcntl.fcntl(sys.stdin, fcntl.F_SETFL, os.O_NONBLOCK)   



    red.publish('echo', "[%i] joined" % (PID,))   




    while True:   



        wait_read(sys.stdin.fileno())   


        l = sys.stdin.readline().strip()   



        s = "[%i] %s" % (PID, l)   




        # save to log   




        red.rpush('echo_log', s)   




        # publish message   




        red.publish('echo', s)   




        if l == 'quit':   




            break 



     



def handler():   



    pubsub = red.pubsub()   



    # first subscribe, then print log (no race condition this way)   




    pubsub.subscribe('echo')   




    # print log   




    for line in red.lrange('echo_log', 0, -1):   




        print '.', line   




    # print channel   




    for msg in pubsub.listen():   




        print '>', msg['data']   



     


gevent.spawn(handler)   


gevent.spawn(echo_stdin).join()

当然对于普通的set get sadd hset 也是可以配合redis来使用的。但是，没啥优势，因为redis只启用了一个进程针对数据的读写，咱们从程序中复用的那几个连接，最后取数据，还是需要调用那进程，你还不如让他老老实实的干活，别搞个多线程，让他白白折腾。我这边做了压力测试，python2.7用个gevent后，批量的读写没什么突出的增长。

redis python

安科网

Python运维项目中用到的redis经验及数据类型

zhangaik

zhangaik

相关推荐

快速制作Redis Docker镜像

Go+Vue开发一个线上外卖应用的流程(用户名密码和图形验证码)

Windows安装Redis并添加本地自启动服务的实例详解

Redis客户端及服务端的安装教程详解

Redis中的String类型及使用Redis解决订单秒杀超卖问题

详解Redis数据结构之跳跃表

Linux下redis5.0.5的安装过程与配置方法

Redis 的 GeoHash详解

通过kubesphere部署redis的方法

为啥Redis使用pipelining会更快

基于Redis+Lua脚本实现分布式限流组件封装的方法

Redis概述及linux安装redis的详细教程

Redis常用数据类型命令实例汇总

解密Redis助力双11背后电商秒杀系统(推荐)

硬核！15张图解Redis为什么这么快(推荐)

Redis持久化RDB和AOF区别详解

关于使用IDEA的springboot框架往Redis里写入数据乱码问题

Redis 对过期数据的处理方法

redis中scan命令的基本实现方法

详解centos7 yum安装redis及常用命令

zhangaik