Ø 计算机的应用从单纯的科学计算逐步转移到数据处理,特别是在该阶段的后期,数据处理已经成为计算机应用的主要目的。主要限于对文件的插入、删除、修改和查询等基本操作。
Ø 数据按照一定的逻辑结构组成文件,并通过文件实现数据的外部存储。即数据是以文件的方式存储在外部存储设备中,如磁盘、磁鼓等。
Ø 数据具有一定的独立性。由于数据是以文件的方式存储,文件的逻辑结构与存储结构可以自由地进行转换,所以多个程序可以通过文件系统对同一数据进行访问,实现了一定程度的数据共享。
Ø 文件形式具有多样化,除了数据文件以外还产生了索引文件、链接文件、顺序文件、直接存取文件和倒排文件等。
Ø 基本上以记录为单位实现数据的存取。
缺点:
Ø 数据和程序并不相互独立,数据冗余度仍然比较大。一个程序基本上是对应着一个或一组文件,即数据还是面向应用的,不同的程序还需建立自己的数据文件,能真正实现数据共享的情况并不多。原因在于,文件中数据的逻辑结构与其对应的程序密切相关,而且没有统一标准的逻辑结构。
Ø 难以保证数据一致性。由于文件之间没有关联机制,所以当对一个数据进行更改时难以保证对该数据的其他副本进行同样的更改。
Ø 文件的数据表达能力十分有限。这主要体现在,文件中的数据结构比较单一,也比较简单,还难以表示复杂的数据结构。
3. 数据库系统阶段(1965-至今)
数据库系统阶段始于20世纪60中后期,一直到现在。这时计算机除了用于科学计算以外,更多时候是用于数据管理,而且数据的量已经很大,管理功能也越来越强大。
计算机硬件本身也发生了深刻的变化,出现了大容量磁盘和高主频的CPU等。
在软件上,数据的管理软件已经由原来的文件系统上升到了数据库管理系统(DBMS)。
数据管理的主要特点是数据集中存放在一个地方,这个地方就是所谓的数据库。应用程序要实现对数据库中的数据进行访问,则必须通过数据库管理系统来完成。
数据库技术是基于数据库的数据管理技术。其特点:
• 数据组织的结构化。从总体上看,文件系统中的数据是“涣散”的,而数据库中的数据是结构化的,具有统一的逻辑结构。数据的结构化是数据库的主要特征之一,是数据库和文件系统的最大和根本的区别。
• 减少数据冗余度,增强数据共享性。从整个系统上看,数据不再面向某一个特定的应用程序,而是面向由所有应用程序组成的系统。所以一个数据可以为多个应用程序所共享,一个应用程序也可以同时访问多个数据。
• 保证数据的一致性。通过建立文件间的关联,使得在对某一个数据进行更新时,与之相关的数据也得到相应更改。
• 具有较高的数据独立性。在数据库系统中,数据独立性包含两个方面,一个是数据的物理独立性,另一个是数据的逻辑独立性。
数据的物理独立性是指在数据的物理存储结构发生改变时,数据的逻辑结构可以不变的特性;
数据的逻辑独立性是指在总体逻辑结构改变时,应用程序可以不变的一种特性。
数据库之所以具有较好的数据独立性,主要是因为数据库提供了两个映象功能:数据的存储结构和逻辑结构之间的映象或转换功能以及数据的总体逻辑结构和局部逻辑结构之间的映象功能。前者保证了数据的物理独立性,后者则保证了数据的逻辑独立性。
• 以数据项为单位进行数据存取。相对文件系统而言,数据库可以实现更小粒度的数据处理,满足更多的应用需求。
• 具有统一的数据控制功能。这些功能包括数据的安全性控制、完整性控制、并发控制和一致性控制等功能。
数据管理技术发展的这三个阶段是一个渐进的过程,它们的区别主要体现在应用程序和数据的关系上:
Ø 在人工管理阶段,应用程序和数据是“混合”在一起;
Ø 在文件系统阶段,应用程序则通过文件系统完成对数据的访问,实现了数据和程序一定程度的分离;
Ø 在数据库系统阶段,应用程序是通过数据库管理系统(DBMS)对数据进行访问,实现了数据和程序的高度分离。
三个阶段之间的关系表示: