linux Page cache和buffer cache 正解
Pagecache和buffercache一直以来是两个比较容易混淆的概念,在网上也有很多人在争辩和猜想这两个cache到底有什么区别,讨论到最后也一直没有一个统一和正确的结论,在我工作的这一段时间,pagecache和buffercache的概念曾经困扰过我,但是仔细分析一下,这两个概念实际上非常的清晰。如果能够了解到这两个cache的本质,那么我们在分析io问题的时候可能会更加得心应手。
Pagecache实际上是针对文件系统的,是文件的缓存,在文件层面上的数据会缓存到pagecache。文件的逻辑层需要映射到实际的物理磁盘,这种映射关系由文件系统来完成。当pagecache的数据需要刷新时,pagecache中的数据交给buffercache,但是这种处理在2.6版本的内核之后就变的很简单了,没有真正意义上的cache操作。
Buffercache是针对磁盘块的缓存,也就是在没有文件系统的情况下,直接对磁盘进行操作的数据会缓存到buffercache中,例如,文件系统的元数据都会缓存到buffercache中。
简单说来,pagecache用来缓存文件数据,buffercache用来缓存磁盘数据。在有文件系统的情况下,对文件操作,那么数据会缓存到pagecache,如果直接采用dd等工具对磁盘进行读写,那么数据会缓存到buffercache。
补充一点,在文件系统层每个设备都会分配一个def_blk_ops的文件操作方法,这是设备的操作方法,在每个设备的inode下面会存在一个radixtree,这个radixtree下面将会放置缓存数据的page页。这个page的数量将会在top程序的buffer一栏中显示。如果设备做了文件系统,那么会生成一个inode,这个inode会分配ext3_ops之类的操作方法,这些方法是文件系统的方法,在这个inode下面同样存在一个radixtree,这里会缓存文件的page页,缓存页的数量在top程序的cache一栏进行统计。从上面的分析可以看出,2.6内核中的buffercache和pagecache在处理上是保持一致的,但是存在概念上的差别,pagecache针对文件的cache,buffer是针对磁盘块数据的cache,仅此而已。