程序员接触的内存空间和系统接触的物理内存空间是有所区别的。对于一般进程来讲,他面对的是一个线性虚拟内存空间:地址从0到最大值。每一个进程面对的虚拟内存空间都是一样的,都享有全部的内存地址。虚拟内存空间是线性的,但并不意味着是连续的。部分地址段的虚拟空间可以是缺失的(不是所有地址都可以用来存储数据)。
虚拟内存可以按页管理,每一页大小一般为4kb。每一页背后都有一个实际物理内存(可以是主存也可以是辅存)与之对应。在物理内存中我们不叫页,而称之为帧。分页的好处就是可以在主存不够的情况下把辅存给利用上。我们可以将暂时不用的主存页保存到辅存中,这样时候这块主存页便可以被我们覆写,需要的时候还可以从辅存中恢复。在安装linux系统的时候,如果内存偏小我们时常通过激活swap分区,增加虚拟内存空间。由局部性原理,速度上并不会差别太大。
并不是每一个虚拟内存页都有实际内存帧作为其后盾。如果没有对应的实际内存,便是缺页的情况。有个列外:虚拟页的数据全为0时,并不需要内存帧。只要有一个标记就可以了。
内存页和内存帧不一定是一对一关系,刚才说了有些内存页可能没有内存帧,有些内存帧可能会被多个内存页使用(多个内存页一般分属于多个进程,上面提到了一般进程面对的空间都是一样的)。换句话将,一个内存帧可以被多个内存页共享,再进一步可以被多个进程共享。典型的例子是库函数printf函数。每一个进程都会共享库函数printf(动态链接库),所以printf实际只有一个实例,每个进程的printf函数都在相同的内存帧中。
虽说内存页可以有内存帧作为其后盾也可以没有,但进程要想有效的访问内存页,该内存页必须要对应一个内存帧。实际情况是内存页的需求大于内存帧的实际大小。需求太大的实际原因——每一个进程都想独占整个物理内存。那该怎么解决这个问题呢?联想以下实际生活中的电梯。一个电梯最多容纳10人,而一栋楼有200号人。那我们是不是需要20个电梯才够?其实不然,或许两三个电梯就可以了。理由是:人不会总呆在电梯里面。再来看看我们的内存,内存页相当与人,内存帧则相当于电梯。帧不够了,页出来就行。内存页我们可以放到辅存中,比如磁盘。如果我们突然需要存储在辅存上的内存页时,再将辅存上的内存页与实际内存帧对应。这一行为可以叫做换页。
前面提到了缺页。缺页更严谨的讲是进程尝试访问一个没有内存帧对应的内存页时发生的一种错误。这是候内核会挂起该进程,进行一些调度把内存页和内存帧连接起来,然后再恢复进程。这被称为换进/faulting in。值得注意的是,这种情况并不是什么好事,会减慢程序的运行。页的换进换出做的操作是IO操作。
内存申请,很多人可能认为只有内存不够的时候才需要该操作。但反问一句,内存已经不够了,你上哪儿获取?实际上内存申请会追踪一个进程的数据的地址,确保相同地址的内存不会存进两个完全不同的数据。
进程申请内存有两种方式:exec、编程方式、[fork]。
Exec 可以为进程创建虚拟地址空间,将最基本程序部分加载进去,然后执行程序。一旦程序开始执行,程序使用编程的方式获取额外内存。GNU C库中有两种申请内存的方式:自动申请和动态申请。
内存映射I/O是一种动态虚拟内存申请方式。将虚拟内存的内容映射到IO设备上的常规文件。虚拟内存的任何修改都可以同步到IO上的常规文件。只有当我们访问到了该地址段的虚拟内存,我们才需要做IO读写、访问实际内存地址。所以这是一种非常有效率的读写方式。
进程可以用编程的方式申请内存,也可以释放内存,但是你无法释放以exec方式申请的内存。
虚拟内存按页管理,而进程的虚拟地址则按段管理。合起来称为断页式管理。一个段是一个连续的虚拟地址。一般有三个重要的段:
1、text segment:包含了程序的指令、字面值、还有静态常量。由exec申请,并在整个生命周期中保持相同的大小。
2、data segment:数据段作为程序的工作空间。可以事先有exec申请加载,也可以由进程以编程的方式扩展或缩小其空间大小。但不管你怎么扩大或缩小,本段都有一个固定的最小空间。
3、stack segment:栈段包含一个程序的栈空间。随着程序栈的扩大而扩大,但不会随其缩小而缩小。
Linux升级Glibc
GNU glibc 爆 gethostbyname 缓冲区溢出漏洞