撸代码只是程序员的一项最基本的技能,除此之外,还有很多知识需要程序员掌握。【程序员进阶系列】专题,旨在分享程序员想要进一步提升自我,突破发展瓶颈的一系列技术。今天,我们来一起聊聊计算机中的层次化存储结构。
文章已收录到:
https://github.com/sunshinelyz/technology-binghe
https://gitee.com/binghe001/technology-binghe
层次化存储结构首先,问小伙伴们一个问题:计算机的存储结构为什么需要进行层次化的划分呢?
说的直接一点:就是为了减少经济成本。如果说,CPU的价格非常便宜的话,根本就不需要内存了。可以把所有的内存容量全部都做到CPU里面去,就可以了。但是,事实上,CPU的内存是很精贵的,至今为止,CPU中基本上还是一级缓存和二级缓存。三级缓存比较少见。而且,CPU中的存储容量是非常小的,基本都是KB级别的存储,CPU的内存容量也就几KB,MB级别的CPU内存也是比较少见的。所以,出于经济成本的考虑,计算机中的存储结构是按照层次进行划分的。
为了能够让小伙伴们更加清晰的理解层次化存储结构,我们先来看一张图。
由上图,可以看出:
(1)层次化的存储结构可以分为:CPU、Cache(高速缓存)、主存(内存)、外存(辅存)。
(2)从上往下,速度越来越慢,容量越来越大。
局部性原理是层次化存储结构的支撑。
局部性原理一个编写良好的计算机程序常常具有良好的局部性。也就是说。它们倾向于引用临近于其他最近引用过的数据项的数据项,或者最近引用过的数据项本身。这汇总倾向性,就被称为局部性原理,这是一个持久的概念,对硬件和软件系统的设计和性能都有着极大的影响。
之所以有这个规律,很多人认为原因是:程序的指令大部分时间是顺序执行的,而且程序的集合,如数组等各种数据结构是连续存放的。
局部性原理讲的是:在一段时间内,整个程序的执行仅限于程序的某一部分,相应地,程序访问的存储空间也局限于某个内存区域。主要分为两类:
时间局部性:如果程序中的某条指令一旦执行,则不久之后该指令可能再次被执行;如果某数据被访问,则不久之后该数据可能再次被访问。
空间局部性:是指一旦程序访问了某个存储单元,则不久之后,其附近的存储单元也将被访问。
Cache针对Cache相关的技术,我们主要来聊聊Cache的概念和映像相关的技术。
Cache-概念这里的Cache表示的是高速缓冲,在计算机的存储体系系统中,Cache是除寄存器外访问速度最快的层次。 使用Cache改善系统性能的依据是程序的局部性原理 。
如果以h代表对Cache的访问命中率,t1表示Cache的周期时间,t2表示主存储器的周期时间,以读操作为例,使用“Cache+主存储器”的系统的平均周期为t3,则可以得出如下运算公式。
t3 = h * t1 + (1 - h) * t2其中。(1 - h)又称为失效率,也就是未命中率。
Cache-映像Cache的映像分为三种,分别是:直接相联映像、全相联映像、组相联映像。
直接相联映像:硬件电路比较简单,但冲突率最高。
全相连映像:电路难于设计和实现,只适用于小容量的Cache,冲突率比较低。
组相联映像:直接相联与全相联的折中。
地址映像是将主存与Cache的存储空间划分为若干大小相同的页(或称为块)。
例如,一台计算机的主存容量为1GB,划分为2048页,每页512KB;Cache的容量为8MB,划分为16页,每页512KB。接下来,我们由此来详细图解直接相联映像、全相联映像和组相联映像。
直接相联映像我们可以画一组图来表示Cache的直接映像。首先,我们先来简单画一个主存标记、Cache页号和页内地址的示意图。如下所示。
如上图所示,主存标记为7位,Cache页号为4位,页内地址为19位。
记录主存区号的示意图如下所示。
有了上面两张图的基础后,我们再来看直接相联映像的示意图如下所示。
这里,我们将容量为1GB的主存划分成2048页,总共127个区,每页的容量为512KB。将容量为8MB的Cache划分为16页,每页容量为512KB。