跟着大彬读源码 - Redis 10 - 对象编码之整数集合

日期：2021-06-18 栏目：程序人生浏览：次

整数集合是 Redis 集合键的底层实现之一。当一个集合只包含整数值元素，并且元素数量不多时，Redis 就会使用整数集合作为集合键的底层实现。

1 整数集合的实现

整数集合是 Redis 用于保存整数值的集合抽象数据结构。它可以保存类型为 int16_t、int32_t、int64_t 的整数值，并且保证集合中不会出现重复元素。

每个 intset.h/intset 结构表示一个整数集合：

typedef struct intset { uint32_t encoding; uint32_t length; int8_t contents[]; } intset;

encding：编码方式

length：集合包含的元素数量

contents[]：保存元素的数组

contents 数组是整数集合的底层实现：整数集合的每个元素都是 contents 数组的一个数组项，各个项在数组中按值的大小从小到大有序排列，并且数组中不包含重复项。

length 属性记录了整数集合记录的元素数量，也就是 contents 数组的长度。

虽然 intset 结构将 contents 属性声明为 int8_t 类型的数组，但实际上 contents 数组并不保存任何 int8_t 类型的值，contents 数组的真正类型取决于 encoding 属性的值，比如：如果 encoding 属性的值为 INTSET_ENC_INT16，那么 contents 就是一个 int16_t 类型的数组，数组里的每个项都是一个 int16_t 类型的整数值，取值范围为：[-32768-32767]（2^(16-1)）。

与之类似，encoding 的值为 INTSET_ENC_INT32，那么数组每项的取值范围为：[-2147483648, 2147483647]（2^(32-1）。

这里也引发了一个问题，当我们对一个 encoding 为 INTSET_ENC_INT8 的 intset，插入 129 时（int8_t 的取值范围是 [-128, 127]），会出现什么？

这也就引发了 intset 的升级操作。与之对应，也有降级操作。接下来，我们来详细认识下 intset 的升降级操作。

2 升级操作

每当我们要将一个新元素添加到整数集合时，如果新元素的类型比整数集合的 encoding 类型大，整数集合就需要先进行升级操作（upgrade），然后才能将新元素添加到整数集合中。

整个升级操作源码如下：

// intset.c/intsetUpgradeAndAdd() /* Upgrades the intset to a larger encoding and inserts the given integer. */ static intset *intsetUpgradeAndAdd(intset *is, int64_t value) { uint8_t curenc = intrev32ifbe(is->encoding); uint8_t newenc = _intsetValueEncoding(value); int length = intrev32ifbe(is->length); int prepend = value < 0 ? 1 : 0; /* First set new encoding and resize */ is->encoding = intrev32ifbe(newenc); is = intsetResize(is,intrev32ifbe(is->length)+1); /* Upgrade back-to-front so we don't overwrite values. * Note that the "prepend" variable is used to make sure we have an empty * space at either the beginning or the end of the intset. */ while(length--) _intsetSet(is,length+prepend,_intsetGetEncoded(is,length,curenc)); /* Set the value at the beginning or the end. */ if (prepend) _intsetSet(is,0,value); else _intsetSet(is,intrev32ifbe(is->length),value); is->length = intrev32ifbe(intrev32ifbe(is->length)+1); return is; }

升级整数集合并添加新元素，共分为三步进行：

扩展底层数组大小。根据新元素的类型，扩展整数集合底层数组的大小，并为新元素分配空间。

元素转换，并保持原有顺序。将底层数组现有的所有元素，都转换成与新元素相同的类型，并将转换后的元素放在正确的位置上，保证原有顺序不发生改变。

将新元素添加到底层数组中。

此外，一旦因插入新元素引发升级操作，就说明新插入的元素比集合中现有的所有元素的长度大，所以这个新元素的值要么大于所有现有元素（正值），要么就小于所有现有元素（负值），那么：

在新元素小于所有现有元素时，新元素就会被放在底层数组的最开头的位置，即索引为 0 的位置；

在新元素大于所有现有元素时，新元素就会被放在底层数组的最末尾的位置；

3 升级优势

整数集合的升级策略主要有以下两个好处：

提示整数集合的灵活性；

尽可能的节约内存；

3.1 提示灵活性

因为 C 语言是静态类型语言，为了避免类型错误，我们通常不会将两种不同类型的值放在同一个数据结构中。

但是，因为有了升级操作，整数集合可以通过它来自适应新元素，所以我们可以随意地将 int16_t、int32_t、和 int64_t 类型的整数添加到集合中，而不必担心出现类型错误，大大的提升了整数集合的灵活性。

3.2 节约内存

当然，要让一个数组可以同时保存 int16_t、int32_t、和 int64_t 类型的整数值，我们可以粗暴的直接使用 int64_t 类型的数组作为整数集合的底层实现，来保存不同类型的值。但是，这样一来，即使添加到集合中的都是 int16_t、int32_t 类型的值，数组也都是需要使用 int64_t 类型的空间去保存，出现浪费内存的情况。

转载注明出处：https://www.heiqu.com/zywxwz.html

跟着大彬读源码 - Redis 10 - 对象编码之整数集合

相关推荐