linux kernel 内存管理-页表、TLB

linux kernel 内存管理-页表、TLB,第1张

页表用来把虚拟页映射到物理页,并且存放页的保护位(即访问权限)。

在Linux4.11版本以前,Linux内核把页表分为4级:

页全局目录表(PGD)、页上层目录(PUD)、页中间目录(PMD)、直接页表(PT)

4.11版本把页表扩展到5级,在页全局目录和页上层目录之间增加了 页四级目录(P4D)

各处处理器架构可以选择使用5级,4级,3级或者2级页表,同一种处理器在页长度不同的情况可能选择不同的页表级数。可以使用配置宏CONFIG_PGTABLE_LEVELS配置页表的级数,一般使用默认值。

如果选择4级页表,那么使用PGD,PUD,PMD,PT;如果使用3级页表,那么使用PGD,PMD,PT;如果选择2级页表,那么使用PGD和PT。 如果不使用页中间目录 ,那么内核模拟页中间目录,调用函数pmd_offset 根据页上层目录表项和虚拟地址获取页中间目录表项时 直接把页上层目录表项指针强制转换成页中间目录表项

每个进程有独立的页表,进程的mm_struct实例的成员pgd指向页全局目录,前面四级页表的表项存放下一级页表的起始地址,直接页表的页表项存放页帧号(PFN)

内核也有一个页表, 0号内核线程的进程描述符init_task的成员active_mm指向内存描述符init_mm,内存描述符init_mm的成员pgd指向内核的页全局目录swapper_pg_dir

ARM64处理器把页表称为转换表,最多4级。ARM64处理器支持三种页长度:4KB,16KB,64KB。页长度和虚拟地址的宽度决定了转换表的级数,在虚拟地址的宽度为48位的条件下,页长度和转换表级数的关系如下所示:

ARM64处理器把表项称为描述符,使用64位的长描述符格式。描述符的0bit指示描述符是不是有效的:0表示无效,1表示有效。第1位指定描述符类型。

在块描述符和页描述符中,内存属性被拆分为一个高属性和一个低属性块。

处理器的MMU负责把虚拟地址转换成物理地址,为了改进虚拟地址到物理地址的转换速度,避免每次转换都需要查询内存中的页表,处理器厂商在管理单元里加了称为TLB的高速缓存,TLB直译为转换后备缓冲区,意译为页表缓存。

页表缓存用来缓存最近使用过的页表项, 有些处理器使用两级页表缓存 第一级TLB分为指令TLB和数据TLB,好处是取指令和取数据可以并行;第二级TLB是统一TLB,即指令和数据共用的TLB

不同处理器架构的TLB表项的格式不同。ARM64处理器的每条TLB表项不仅包含虚拟地址和物理地址,也包含属性:内存类型、缓存策略、访问权限、地址空间标识符(ASID)和虚拟机标识符(VMID)。 地址空间标识符区分不同进程的页表项 虚拟机标识符区分不同虚拟机的页表项

如果内核修改了可能缓存在TLB里面的页表项,那么内核必须负责使旧的TLB表项失效,内核定义了每种处理器架构必须实现的函数。

当TLB没有命中的时候,ARM64处理器的MMU自动遍历内存中的页表,把页表项复制到TLB,不需要软件把页表项写到TLB,所以ARM64架构没有提供写TLB的指令。

为了减少在进程切换时清空页表缓存的需要,ARM64处理器的页表缓存使用非全局位区分内核和进程的页表项(nG位为0表示内核的页表项), 使用地址空间标识符(ASID)区分不同进程的页表项

ARM64处理器的ASID长度是由具体实现定义的,可以选择8位或者16位。寄存器TTBR0_EL1或者TTBR1_EL1都可以用来存放当前进程的ASID,通常使用寄存器TCR_EL1的A1位决定使用哪个寄存器存放当前进程的ASID,通常使用寄存器 TTBR0_EL1 。寄存器TTBR0_EL1的位[63:48]或者[63:56]存放当前进程的ASID,位[47:1]存放当前进程的页全局目录的物理地址。

在SMP系统中,ARM64架构要求ASID在处理器的所有核是唯一的。假设ASID为8位,ASID只有256个值,其中0是保留值,可分配的ASID范围1~255,进程的数量可能超过255,两个进程的ASID可能相同,内核引入ASID版本号解决这个问题。

(1)每个进程有一个64位的软件ASID, 低8位存放硬件ASID,高56位存放ASID版本号

(2) 64位全局变量asid_generation的高56位保存全局ASID版本号

(3) 当进程被调度时,比较进程的ASID版本号和全局版本号 。如果版本号相同,那么直接使用上次分配的ASID,否则需要给进程重新分配硬件ASID。

存在空闲ASID,那么选择一个分配给进程。不存在空闲ASID时,把全局ASID版本号加1,重新从1开始分配硬件ASID,即硬件ASID从255回绕到1。因为刚分配的硬件ASID可能和某个进程的ASID相同,只是ASID版本号不同,页表缓存可能包含了这个进程的页表项,所以必须把所有处理器的页表缓存清空。

引入ASID版本号的好处是:避免每次进程切换都需要清空页表缓存,只需要在硬件ASID回环时把处理器的页表缓存清空

虚拟机里面运行的客户 *** 作系统的虚拟地址转物理地址分两个阶段:

(1) 把虚拟地址转换成中间物理地址,由客户 *** 作系统的内核控制 ,和非虚拟化的转换过程相同。

(2) 把中间物理地址转换成物理地址,由虚拟机监控器控制 ,虚拟机监控器为每个虚拟机维护一个转换表,分配一个虚拟机标识符,寄存器 VTTBR_EL2 存放当前虚拟机的阶段2转换表的物理地址。

每个虚拟机有独立的ASID空间 ,页表缓存使用 虚拟机标识符 区分不同虚拟机的转换表项,避免每次虚拟机切换都要清空页表缓存,在虚拟机标识符回绕时把处理器的页表缓存清空。

linux下的分段分页机制将一个逻辑地址转换到物理地址的问题?????

一个逻辑地址经过分段后得到的是线性地址,我挺郁闷的这个线性地址到底如何得到的???应为linux的线性地址是个32位的地址,高10为保存目录项,中间10位保存页表项,然后低12为对应物理页偏移地址。。。。然而这个逻辑地址是经过选择子选出来的段基址,加上段内偏移,出来确实是个32位地址。。。似乎这个中间的步骤被屏蔽了是吧???我想知道这里面是如果把逻辑地址转换成这个分成三个部分索引的线性地址!前面是段基址然后段偏移就出来个线性地址这叫我无法接受,刨根究底!求助。。。。求助!

【分页机制对应用程序, *** 作系统本身的程序都是有作用的。】

这是问题问的比较深入了,弄明白这个问题就要研究 *** 作系统究竟怎么分配和使用内存。

一般,不管是 *** 作系统还是应用程序都要先分配内存然后才是内存寻址和使用,而如何分配不同的系统肯定不同。 *** 作系统种类很多,xp,2000,linux,unix。。。但一般原理还是差不多的。

以linux *** 作系统为例,

应用程序的内存肯定是由 *** 作系统管的,os按分页策略给应用程序分配内存。

那么 *** 作系统呢,这就是你关心的点了?

开机加电的时候linux *** 作系统内核代码进入内存,一般这些内存是连续的,但这些内存在后面使用时仍能适用分页机制去寻址,不过是页面正好是连续的罢了。

而随着 *** 作系统运行,内核程序也会继续要求内存,这时候内存管理程序负责分配内存空间,这里面有不少细节了,暂时就不啰嗦了,但无论怎么分的,分配后使用这些内存的时候,指令地址都会以分页机制进行寻址找到分配的内存。

所以,分页机制是整个系统的内存寻址机制,对应用程序和 *** 作系统本身都启作用。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8385481.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-15
下一篇 2023-04-15

发表评论

登录后才能评论

评论列表(0条)

保存