QEMU 使用的镜像文件：qcow2 与 raw

日期：2020-05-31 栏目：程序人生浏览：次

本文介绍了 qcow2 和 raw，它们都是 QEMU(KVM)虚拟机使用的磁盘文件格式，本文将从其实现原理，支持特性，以及读写效率等进行对比和分析，最后还要介绍这两种格式的磁盘文件如何转化。

qcow2 的基本原理

qcow2 镜像格式是 QEMU 模拟器支持的一种磁盘镜像。它也是可以用一个文件的形式来表示一块固定大小的块设备磁盘。与普通的 raw 格式的镜像相比，有以下特性：

更小的空间占用，即使文件系统不支持空洞(holes)；

支持写时拷贝（COW, copy-on-write），镜像文件只反映底层磁盘的变化；

支持快照（snapshot），镜像文件能够包含多个快照的历史；

可选择基于 zlib 的压缩方式

可以选择 AES 加密

qcow2 镜像文件格式头部信息

每一个 qcow2 文件都以一个大端（big-endian）格式的头开始，结构如下:

清单 1. qcow2 Header

typedef struct QCowHeader { uint32_t magic; uint32_t version; uint64_t backing_file_offset; uint32_t backing_file_size; uint32_t cluster_bits; uint64_t size; /* in bytes */ uint32_t crypt_method; uint32_t l1_size; uint64_t l1_table_offset; uint64_t refcount_table_offset; uint32_t refcount_table_clusters; uint32_t nb_snapshots; uint64_t snapshots_offset; } QcowHeader;

下面以一个 10G 的 qcow2 文件为例来分析各字段的含义。

清单 2. qcow2 文件的 16 进制表示

# file 1.cow2 1.cow2: QEMU QCOW Image (v2), 10737418240 bytes 0000000: 5146 49fb 0000 0002 0000 0000 0000 0000 QFI............. 0000010: 0000 0000 0000 0010 0000 0002 8000 0000 ................ 0000020: 0000 0000 0000 0014 0000 0000 0003 0000 ................ 0000030: 0000 0000 0001 0000 0000 0001 0000 0000 ................ 0000040: 0000 0000 0000 0000 0000 0000 0000 0000 ................ 0000050: 0000 0000 0000 0000 0000 0000 0000 0000 ................ 0000060: 0000 0004 0000 0068 0000 0000 0000 0000 .......h........ 0000070: 0000 0000 0000 0000 0000 0000 0000 0000 ................ ......

前 4 个比特包含了字符 Q，F，I，然后是 0xfb，实例中的 5146 49fb 是 magic 字段。

接下来的 4 个比特包含了该镜像文件的版本号，实例中的 0000 0002 是 version 字段，代表使用的是 qcow2 版本。

backing_file_offset 占用 8 个字节，实例中 0000 0000 0000 0000，给出一个从某个文件开始偏移量。

backing_file_size 给出了一个不以 null 结尾的字符串的长度，实例中为 0000 0000。如果这个镜像文件是一个写时拷贝的，那么它是原始文件的路径。

cluster_bits，32 位（0000 0010），描述了如何映射一个镜像的地址到一个本地文件，它决定了在一个 cluster 中，偏移地址的低位是如何作为索引的。因为 L2 表占用了一个单独的 cluster 并且包含 8 字节的表项（entry），所以 cluster_bits 只有不足 3 个位，作为 L2 表的索引。

接下来的 size ，8 字节代表了该镜像文件所表示的块设备的大小，实例中为 0000 0002 8000 0000 字节，也就是 10G 的空间。

crypt_method 如果为 1 代表使用 AES 加密。

l1_size（0000 0014）和 l1_table_offset（0000 0000 0003 0000::）分别给出了 L1 表大小和偏移量。

refcount_table_offset 给出 refcount 表的偏移量（0000 0000 0001 0000）而 refcount_table_clusters 描述了以 cluster 为单位的 refcount 表的大小（0000 0001）。

nb_snapshots 给出了该镜像包含的快照数量（0000 0000）， snapshots_offset 给出每个快照到 QCowSnapshotHeader 的偏移量（0000 0000 0000 0000）。

一个典型的 qcow2 镜像文件包含一下几部分：

上文中提到的头部信息

L1 表

refcount 表

一个或者多个 refcount 块

快照头

L2 表

数据 cluster

2 级查找

在 qcow2 中，磁盘的内容是保存在 cluster 中（每个 cluster 包含一些大小为 512 字节的扇区）。为了找到给定地址所在的 cluster，我们需要查找两张表，L1->L2。L1 表保存一组到 L2 表的偏移量，L2 表保存一组到 cluster 的偏移量；

所以一个地址要根据 cluster_bits（64 位）的设置分成 3 部分，比如说 cluster_bits=12；

低 12 位是一个 4Kb cluster 的偏移（2 的 12 次方=4Kb）；

接下来 9 位是包含 512 个表项目的 L2 表；

剩下 43 位的代表 L1 表偏移量。

为了获取一个给定地址（64 位）的偏移位置：

从 Head 域中的 l1_table_offset 取得 L1 表的地址

用前（64-l2_bits-cluster_bits）位地址去索引 L1 表

在 L1 表中的偏移量获得 L2 表的地址

用地址中的接下来的 l2_bits 去索引 L2 表，获得一个 64 位的表项

用 L2 表中的偏移量获得 cluster 的地址

用地址中剩下的 cluster_bits 位去索引该 cluster，获得该数据块

如果 L1 表和 L2 表中的偏移量都是空，这块区域就尚未被镜像文件分配。

注意 L1 表和 L2 表中的偏移量的前两位被保留，用做表示'copied' 或'compressed'。

Copy-on-Write 镜像文件

转载注明出处：http://www.heiqu.com/17135.html

QEMU 使用的镜像文件：qcow2 与 raw

相关推荐