(一)高水位标记(High Water Mark,HWM)的概念
所谓高水位标记,是指一个已经分配的段中,已经使用的空间与未使用的空间的分界线。在表的使用过程中,随着数据的不断增多(insert),HWM不断向数据段未使用部分方向移动,而在删除数据(delete)的过程中,HWM并不会向反方向移动,即使删除全部数据,HWM依然不会改变。但是如果使用了truncate命令,则表的HWM会被重置为0。
图1.segment
(二)高水位标记的影响
全表扫描要读出直到HWM标记的所有的属于该表的数据块(used space),即使该表中没有任何数据;
即使HWM下有空闲的数据块,如果在插入数据时使用了append参数,则在插入数据时使用HWM以上的数据块,HWM会自动增大。
(三)如何知道一个表的HWM
1.首先对表进行分析
SQL > ANALYZE TABLE table_name ESTIMATE/COMPUTE STATISTICS;
2.查看水线
SELECT blocks, --该表曾经使用过的数据块的数目,即水线 empty_blocks, --代表分配给该表,但是在水位线以上的数据块,即从来没有使用过的数据块 num_rows FROM user_tables WHERE table_name = ‘table_name’;
*注:在Oracle 11g中,收集数据库对象信息的最好方法,不再是使用带ESTIMATE或COMPUTE的ANALYSE语句,而是使用最新的DBMS_STATS包。但是,如果要收集数据库对象存储格式的有效性以及收集表与簇中的行迁移、行链接情况,还得使用ANALYSE。
(四)Oracle表段中的高水位线
每个Oracle数据块在ASSM段中都属于下面的一种状态:
高水位线以上
这些块未被格式化且从来没有被使用过。
高水位线以下(3类)
--已经分配,但是未格式化和未使用;
--格式化,且含有数据;
--格式化,不含有数据,因为数据被删除了。
(1)在创建表的时候,HWM位于segment左边的起始处,因为没有数据插入,segment中全部的block未被格式化和从未被使用。
(2)假设一个事务将行数据插入到segmnet中,数据库必须分配一组数据块去保存行信息,被分配的数据块全在HWM之下,数据库格式化一个位图块来保存元数据,但是没有指定是哪一个数据块。
在HWM以下的数据块是被分配的,在HWM以上的数据块从未被分配和格式化。当insert时,数据可以写到有可用空间的任何块中。low HWM以下的部分,所有的块都被格式化,因为它们要么含有数据,要么以前包含数据。
(3)当insert时,数据库选择在HWM和low HWM之间的任意一个块进行写入,或者是HWM以下的一个有空闲空间的块进行写入。下图中,在Low HWM与HWM之间已写满块的两侧的数据块还未格式化。
(4)low HWM对于全表扫描是非常重要的。因为HWM以下的数据块只有在要使用时才格式化,有一些块还未格式化。基于这个原因,数据库会去bitmap块查询low HWM的位置,然后会去读low HWM以下的全部数据块,因为数据库已经知道这些块全部被格式化了,对于在low HWM和HWM之间的数据块,数据库会挑选那些已经格式化了的数据块进行读操作。
(5)假设一个新的事务进行插入操作,但是bitmap指示目前在HWM以下已经没有足够的空间了,数据库会向右移动该segment的HWM,分配一组新的未格式化的数据块。
(五)降低HWM
降低HWM可以使用rebuild、truncate、shrink、move等操作。
(5.1)SHRINK
shrink技术是一种段收缩技术,可将表与索引高水位以下的碎片进行有效压缩,并将高水位进行回退。
使用方法如下:
step1. 启用行移动
SQL > ALTER TABLE table_name ENABLE ROW MOVEMENT;
step2. 压缩数据及下调HWM
SQL > ALTER TABLE table_name SHRINK SPACE CASCADE; --压缩表及相关数据段并下调HWM
或