Linux的内存寻址方式
本文转载自微信公众号「Linux澡堂子」,作者冷面不冷。转载本文请联系Linux澡堂子众号。
为什么要内存管理:
早期的程序都是直接运行在物理地址上,也就是说这个程序所需要的空间不超过该机器的物理内存就不会有问题,但实际场景中都是多任务,多进程的,这种物理地址reserved给各个进程是不靠谱的。举个栗子:假如有3个程序a,b,c,a需要10M,b需要100M,c需要20M,总内存就120M,按照之前的分配方式,前10M给a,10M-110M给b,系统还剩10M,但是c需要20M,显然剩下的内存是不够c用的。怎么办?
1.效率问题
可能你会想到当c程序跑的时候把b程序数据写到磁盘上,等运行b的时候再数据从磁盘写回来,先不说无法满足b,c程序并行跑的需求,就连频繁的io操作带来的耗时问题也是无法接收的。
2.进程地址隔离问题
除了效率问题,reserved给进程的空间如果需要被别的进程访问会出现崩溃。比如a进程访问的空间是前10M,但是a程序中有一段代码访问10-110M的话就有可能导致b程序的崩溃,所以进程的地址空间需要彼此隔离。
3.重定位问题
现实场景中不可能是单任务在分好的内存中运行,当多任务并行跑的情况下在动态申请释放内存的时候有可能申请到其它进程里的地址,这时候需要重定位到新的地址。
内存管理无非就是想办法解决上面三个问题,如何提高内存的使用效率?如何使进程的地址空间隔离?如何解决程序运行时的重定位问题?
内存管理如何从虚拟地址映射到物理地址:
内存管理从虚拟地址映射到物理地址的过程也就是解决上面3个问题的过程。内存管理用分段机制和分页机制分别解决了上面的3个问题,大概过程如下图:
分段机制:
只要程序分了段,把整个段平移到任何位置后,段内的地址相对段基址是不变的,无论段基址是多少,只要给出段内偏移地址,cpu就能访问到正确的指令。于是加载用户程序时,只要将整个段的内容复制到新的位置,再将段基址寄存器中的地址改成该地址,程序便可准确地运行,因为程序中用的是段内偏移地址,相对新的段基址,该偏移地址处的内容内容还是一样的。
可以看出分段机制解决了进程间隔离和重定位的问题。这个动作是在硬件里做的,但是有的硬件是没有分段机制的,作为跨平台的linux就用了具有更通用性的分页机制来解决线性地址到虚拟地址到物理地址的转换。
分页机制:
可以参考《CPU是如何访问内存的?》了解一级页表的概念,linux为了兼容32位和64位,通常采用四级页表,页全局目录,页上级目录,页中间目录,页表:
这里不详细解释linux是如何通过四级页表来做线性地址(虚拟地址)到物理地址的转化。网上有很多,推荐https://www.cnblogs.com/linhaostudy/p/10038100.html#autoid-2-2-0。
进程在切换的时候就是根据task_struct找到mm_struct里的pgd字段,取得新进程的页全局目录,然后填充到CR3寄存器,就完成了页的切换。
动手看下mmu分页寻址的过程:
上代码:
#include <linux/module.h> #include <linux/kernel.h> #include <linux/init.h> #include <linux/sched.h> #include <linux/pid.h> #include <linux/mm.h> #include <asm/pgtable.h> #include <asm/page.h> MODULE_DESCRIPTION("vitual address to physics address"); static int pid; static unsigned long va; module_param(pid,int,0644); //从命令行传递参数(变量,类型,权限) module_param(va,ulong,0644); //va表示的是虚拟地址 static int find_pgd_init(void) { unsigned long pa = 0; //pa表示的物理地址 struct task_struct *pcb_tmp = NULL; pgd_t *pgd_tmp = NULL; pud_t *pud_tmp = NULL; pmd_t *pmd_tmp = NULL; pte_t *pte_tmp = NULL; printk(KERN_INFO"PAGE_OFFSET = 0x%lx\n",PAGE_OFFSET); //页表中有多少个项 /*pud和pmd等等 在线性地址中占据多少位*/ printk(KERN_INFO"PGDIR_SHIFT = %d\n",PGDIR_SHIFT); //注意:在32位系统中 PGD和PUD是相同的 printk(KERN_INFO"PUD_SHIFT = %d\n",PUD_SHIFT); printk(KERN_INFO"PMD_SHIFT = %d\n",PMD_SHIFT); printk(KERN_INFO"PAGE_SHIFT = %d\n",PAGE_SHIFT); printk(KERN_INFO"PTRS_PER_PGD = %d\n",PTRS_PER_PGD); //每个PGD里面有多少个ptrs printk(KERN_INFO"PTRS_PER_PUD = %d\n",PTRS_PER_PUD); printk(KERN_INFO"PTRS_PER_PMD = %d\n",PTRS_PER_PMD); //PMD中有多少个项 printk(KERN_INFO"PTRS_PER_PTE = %d\n",PTRS_PER_PTE); printk(KERN_INFO"PAGE_MASK = 0x%lx\n",PAGE_MASK); //页的掩码 struct pid *p = NULL; p = find_vpid(pid); //通过进程的pid号数字找到struct pid的结构体 pcb_tmp = pid_task(p,PIDTYPE_PID); //通过pid的结构体找到进程的task struct printk(KERN_INFO"pgd = 0x%p\n",pcb_tmp->mm->pgd); // 判断给出的地址va是否合法(va<vm_end) if(!find_vma(pcb_tmp->mm,va)){ printk(KERN_INFO"virt_addr 0x%lx not available.\n",va); return 0; } pgd_tmp = pgd_offset(pcb_tmp->mm,va); //返回线性地址va,在页全局目录中对应表项的线性地址 printk(KERN_INFO"pgd_tmp = 0x%p\n",pgd_tmp); //pgd_val获得pgd_tmp所指的页全局目录项 //pgd_val是将pgd_tmp中的值打印出来 printk(KERN_INFO"pgd_val(*pgd_tmp) = 0x%lx\n",pgd_val(*pgd_tmp)); if(pgd_none(*pgd_tmp)){ //判断pgd有没有映射 printk(KERN_INFO"Not mapped in pgd.\n"); return 0; } pud_tmp = pud_offset(pgd_tmp,va); //返回va对应的页上级目录项的线性地址 printk(KERN_INFO"pud_tmp = 0x%p\n",pud_tmp); printk(KERN_INFO"pud_val(*pud_tmp) = 0x%lx\n",pud_val(*pud_tmp)); if(pud_none(*pud_tmp)){ printk(KERN_INFO"Not mapped in pud.\n"); return 0; } pmd_tmp = pmd_offset(pud_tmp,va); //返回va在页中间目录中对应表项的线性地址 printk(KERN_INFO"pmd_tmp = 0x%p\n",pmd_tmp); printk(KERN_INFO"pmd_val(*pmd_tmp) = 0x%lx\n",pmd_val(*pmd_tmp)); if(pmd_none(*pmd_tmp)){ printk(KERN_INFO"Not mapped in pmd.\n"); return 0; } //在这里,把原来的pte_offset_map()改成了pte_offset_kernel pte_tmp = pte_offset_kernel(pmd_tmp,va); //pte指的是 找到表 printk(KERN_INFO"pte_tmp = 0x%p\n",pte_tmp); printk(KERN_INFO"pte_val(*pte_tmp) = 0x%lx\n",pte_val(*pte_tmp)); if(pte_none(*pte_tmp)){ //判断有没有映射 printk(KERN_INFO"Not mapped in pte.\n"); return 0; } if(!pte_present(*pte_tmp)){ printk(KERN_INFO"pte not in RAM.\n"); return 0; } pa = (pte_val(*pte_tmp) & PAGE_MASK) ;//物理地址的计算方法 printk(KERN_INFO"virt_addr 0x%lx in RAM Page is 0x%lx .\n",va,pa); //printk(KERN_INFO"contect in 0x%lx is 0x%lx\n",pa,*(unsigned long *)((char *)pa + PAGE_OFFSET)); return 0; } static void __exit find_pgd_exit(void) { printk(KERN_INFO"Goodbye!\n"); } module_init(find_pgd_init); module_exit(find_pgd_exit); MODULE_LICENSE("GPL");