安装和使用memcached
如何将memcached融入到您的环境中?
在开始安装和使用usingmemcached之前,我们需要了解如何将memcached融入到您的环境中。虽然在任何地方都可以使用memcached,但我发现需要在数据库层中执行几个经常性查询时,memcached往往能发挥最大的效用。我经常会在数据库和应用服务器之间设置一系列memcached实例,并采用一种简单的模式来读取和写入这些服务器。图1可以帮助您了解如何设置应用程序体系结构:
图1.使用memcached的示例应用程序体系结构
体系结构相当容易理解。我建立了一个Web层,其中包括一些Apache实例。下一层是应用程序本身。这一层通常运行于ApacheTomcat或其他开源应用服务器之上。再下面一层是配置memcached实例的地方—即应用服务器与数据库服务器之间。在使用这种配置时,需要采用稍微不同的方式来执行数据库的读取和写入操作。
读取
我执行读取操作的顺序是从Web层获取请求(需要执行一次数据库查询)并检查之前在缓存中存储的查询结果。如果我找到所需的值,则返回它。如果未找到,则执行查询并将结果存储在缓存中,然后再将结果返回给Web层。
写入
将数据写入到数据库中时,首先需要执行数据库写入操作,然后将之前缓存的任何受此写入操作影响的结果设定为无效。此过程有助于防止缓存和数据库之间出现数据不一致性。
安装memcached
memcached支持一些操作系统,包括Linux®、Windows®、MacOS和Solaris。在本文中,我将详细介绍如何通过源文件构建和安装memcached。采用这种方式的主要原因是我在遇到问题时可以查看源代码。
libevent
libevent是安装memcached的唯一前提条件。它是memcached所依赖的异步事件通知库。您可以在monkey.org上找到关于libevent的源文件。接下来,找到其最新版本的源文件。对于本文,我们使用稳定的1.4.11版本。获取了归档文件之后,将它解压到一个方便的位置,然后执行清单1中的命令:
清单1.生成和安装libevent
cdlibevent-1.4.11-stable/
./configure
make
makeinstall
memcached
从DangaInteractive获取memcached源文件,仍然选择最新的分发版。在撰写本文时,其最新版本是1.4.0。将tar.gz解压到方便的位置,并执行清单2中的命令:
清单2.生成和安装memcached
cdmemcached-1.4.0/
./configure
make
makeinstall
完成这些步骤之后,您应该安装了一个memcached工作副本,并且可以使用它了。让我们进行简单介绍,然后使用它。
使用memcached
要开始使用memcached,您首先需要启动memcached服务器,然后使用telnet客户机连接到它。
要启动memcached,执行清单3中的命令:
清单3.启动memcached
./memcached-d-m2048-l10.0.0.40-p11211
这会以守护程序的形式启动memcached(-d),为其分配2GB内存(-m2048),并指定监听localhost,即端口11211。您可以根据需要修改这些值,但以上设置足以完成本文中的练习。接下来,您需要连接到memcached。您将使用一个简单的telnet客户机连接到memcached服务器。
大多数操作系统都提供了内置的telnet客户机,但如果您使用的是基于Windows的操作系统,则需要下载第三方客户机。我推荐使用PuTTy。
安装了telnet客户机之后,执行清单4中的命令:
清单4.连接到memcached
telnetlocalhost11211
如果一切正常,则应该得到一个telnet响应,它会指示Connectedtolocalhost(已经连接到localhost)。如果未获得此响应,则应该返回之前的步骤并确保libevent和memcached的源文件都已成功生成。
您现现已经登录到memcached服务器。此后,您将能够通过一系列简单的命令来与memcached通信。9个memcached客户端命令可以分为三类:
•基本
•高级
•管理
基本memcached客户机命令
您将使用五种基本memcached命令执行最简单的操作。这些命令和操作包括:
•set
•add
•replace
•get
•delete
前三个命令是用于操作存储在memcached中的键值对的标准修改命令。它们都非常简单易用,且都使用清单5所示的语法:
清单5.修改命令语法
command<key><flags><expirationtime><bytes>
<value>
表1定义了memcached修改命令的参数和用法。
表1.memcached修改命令参数
参数用法
keykey用于查找缓存值
flags可以包括键值对的整型参数,客户机使用它存储关于键值对的额外信息
expirationtime在缓存中保存键值对的时间长度(以秒为单位,0表示永远)
bytes在缓存中存储的字节点
value存储的值(始终位于第二行)
现在,我们来看看这些命令的实际使用。
set
set命令用于向缓存添加新的键值对。如果键已经存在,则之前的值将被替换。
注意以下交互,它使用了set命令:
setuserId005
12345
STORED
如果使用set命令正确设定了键值对,服务器将使用单词STORED进行响应。本示例向缓存中添加了一个键值对,其键为userId,其值为12345。并将过期时间设置为0,这将向memcached通知您希望将此值存储在缓存中直到删除它为止。
add
仅当缓存中不存在键时,add命令才会向缓存中添加一个键值对。如果缓存中已经存在键,则之前的值将仍然保持相同,并且您将获得响应NOT_STORED。
下面是使用add命令的标准交互:
setuserId005
12345
STORED
adduserId005
55555
NOT_STORED
addcompanyId003
564
STORED
replace
仅当键已经存在时,replace命令才会替换缓存中的键。如果缓存中不存在键,那么您将从memcached服务器接受到一条NOT_STORED响应。
下面是使用replace命令的标准交互:
replaceaccountId005
67890
NOT_STORED
setaccountId005
67890
STORED
replaceaccountId005
55555
STORED
最后两个基本命令是get和delete。这些命令相当容易理解,并且使用了类似的语法,如下所示:
command<key>
接下来看这些命令的应用。
get
get命令用于检索与之前添加的键值对相关的值。您将使用get执行大多数检索操作。
下面是使用get命令的典型交互:
setuserId005
12345
STORED
getuserId
VALUEuserId05
12345
END
getbob
END
如您所见,get命令相当简单。您使用一个键来调用get,如果这个键存在于缓存中,则返回相应的值。如果不存在,则不返回任何内容。
delete
最后一个基本命令是delete。delete命令用于删除memcached中的任何现有值。您将使用一个键调用delete,如果该键存在于缓存中,则删除该值。如果不存在,则返回一条NOT_FOUND消息。
下面是使用delete命令的客户机服务器交互:
setuserId005
98765
STORED
deletebob
NOT_FOUND
deleteuserId
DELETED
getuserId
END
高级memcached客户机命令
可以在memcached中使用的两个高级命令是gets和cas。gets和cas命令需要结合使用。您将使用这两个命令来确保不会将现有的名称/值对设置为新值(如果该值已经更新过)。我们来分别看看这些命令。
gets
gets命令的功能类似于基本的get命令。两个命令之间的差异在于,gets返回的信息稍微多一些:64位的整型值非常像名称/值对的“版本”标识符。
下面是使用gets命令的客户机服务器交互:
setuserId005
12345
STORED
getuserId
VALUEuserId05
12345
END
getsuserId
VALUEuserId054
12345
END
考虑get和gets命令之间的差异。gets命令将返回一个额外的值—在本例中是整型值4,用于标识名称/值对。如果对此名称/值对执行另一个set命令,则gets返回的额外值将会发生更改,以表明名称/值对已经被更新。清单6显示了一个例子:
清单6.set更新版本指示符
setuserId005
33333
STORED
getsuserId
VALUEuserId055
33333
END
您看到gets返回的值了吗?它已经更新为5。您每次修改名称/值对时,该值都会发生更改。
cas
cas(check和set)是一个非常便捷的memcached命令,用于设置名称/值对的值(如果该名称/值对在您上次执行gets后没有更新过)。它使用与set命令相类似的语法,但包括一个额外的值:gets返回的额外值。
注意以下使用cas命令的交互:
setuserId005
55555
STORED
getsuserId
VALUEuserId056
55555
END
casuserId0056
33333
STORED
如您所见,我使用额外的整型值6来调用gets命令,并且操作运行非常顺序。现在,我们来看看清单7中的一系列命令:
清单7.使用旧版本指示符的cas命令
setuserId005
55555
STORED
getsuserId
VALUEuserId058
55555
END
casuserId0056
33333
EXISTS
注意,我并未使用gets最近返回的整型值,并且cas命令返回EXISTS值以示失败。从本质上说,同时使用gets和cas命令可以防止您使用自上次读取后经过更新的名称/值对。
缓存管理命令
最后两个memcached命令用于监控和清理memcached实例。它们是stats和flush_all命令。
stats
stats命令的功能正如其名:转储所连接的memcached实例的当前统计数据。在下例中,执行stats命令显示了关于当前memcached实例的信息:
stats
STATpid63
STATuptime101758
STATtime1248643186
STATversion1.4.11
STATpointer_size32
STATrusage_user1.177192
STATrusage_system2.365370
STATcurr_items2
STATtotal_items8
STATbytes119
STATcurr_connections6
STATtotal_connections7
STATconnection_structures7
STATcmd_get12
STATcmd_set12
STATget_hits12
STATget_misses0
STATevictions0
STATbytes_read471
STATbytes_written535
STATlimit_maxbytes67108864
STATthreads4
END
此处的大多数输出都非常容易理解。稍后在讨论缓存性能时,我还将详细解释这些值的含义。至于目前,我们先来看看输出,然后再使用新的键来运行一些set命令,并再次运行stats命令,注意发生了哪些变化。
flush_all
flush_all是最后一个要介绍的命令。这个最简单的命令仅用于清理缓存中的所有名称/值对。如果您需要将缓存重置到干净的状态,则flush_all能提供很大的用处。下面是一个使用flush_all的例子:
setuserId005
55555
STORED
getuserId
VALUEuserId05
55555
END
flush_all
OK
getuserId
END
缓存性能
在本文的最后,我将讨论如何使用高级memcached命令来确定缓存的性能。stats命令用于调优缓存的使用。需要注意的两个最重要的统计数据是et_hits和get_misses。这两个值分别指示找到名称/值对的次数(get_hits)和未找到名称/值对的次数(get_misses)。
结合这些值,我们可以确定缓存的利用率如何。初次启动缓存时,可以看到get_misses会自然地增加,但在经过一定的使用量之后,这些get_misses值应该会逐渐趋于平稳—这表示缓存主要用于常见的读取操作。如果您看到get_misses继续快速增加,而get_hits逐渐趋于平稳,则需要确定一下所缓存的内容是什么。您可能缓存了错误的内容。
确定缓存效率的另一种方法是查看缓存的命中率(hitratio)。缓存命中率表示执行get的次数与错过get的次数的百分比。要确定这个百分比,需要再次运行stats命令,如清单8所示:
清单8.计算缓存命中率
stats
STATpid6825
STATuptime540692
STATtime1249252262
STATversion1.2.6
STATpointer_size32
STATrusage_user0.056003
STATrusage_system0.180011
STATcurr_items595
STATtotal_items961
STATbytes4587415
STATcurr_connections3
STATtotal_connections22
STATconnection_structures4
STATcmd_get2688
STATcmd_set961
STATget_hits1908
STATget_misses780
STATevictions0
STATbytes_read5770762
STATbytes_written7421373
STATlimit_maxbytes536870912
STATthreads1
END
现在,用get_hits的数值除以cmd_gets。在本例中,您的命中率大约是71%。在理想情况下,您可能希望得到更高的百分比—比率越高越好。查看统计数据并不时测量它们可以很好地判定缓存策略的效率。
常有命令如下:
启动/结束
memcached-d-m10-uroot-l192.168.0.122-p11200-c256-P/tmp/memcached.pid
-d选项是启动一个守护进程,
-m是分配给Memcache使用的内存数量,单位是MB,这里是10MB
-u是运行Memcache的用户,这里是root
-l是监听的服务器IP地址,如果有多个地址的话,这里指定了服务器的IP地址192.168.0.122
-p是设置Memcache监听的端口,这里设置了12000,最好是1024以上的端口
-c选项是最大运行的并发连接数,默认是1024,这里设置了256,按照你服务器的负载量来设定
-P是设置保存Memcache的pid文件
kill`cat/tmp/memcached.pid`
获取运行状态
echostats|nc192.168.1.12311200
watch"echostats|nc192.168.1.12311200"(实时状态)