一、集合类型(Sets)
集合对象是不同的(不可重复)hashable对象的无序集合。常见用法包括:成员关系测试、移除序列中的重复、以及科学计算,例如交集、并集、差分和对称差分。通俗点来说,集合是一个无序不重复元素的数据集,其基本功能是进行成员关系测试和消除重复元素。
目前有两种内置的集合类型:set 和 frozenset。set类型是可变的--可以使用add() 和 remove()等方法更改其内容。由于它是可变的,它没有hash值,因此它不能被当做字典的键值或另一集合的元素。frozenset类型是不可变的 和 hashable的,它的内容不能再创建后改变,因此它可以用作字典的键值或作为另一个集合的元素。
set类构建函数 class set([iterable]) class frozenset([iterable]) set的构建方式将一个用逗号分割的元素列表放在一堆花括号内可以创建一个非空set集合,如{'Tom', 'Jerry', 'Peter'}
给set的构建函数传递一个空值将会创建一个空set集合(注意:{}表示的是一个空字典而不是空set集合)
给set的构架你函数传一个非空iterable参数将会创建一个非空set集合
注意:
再次强调,一个set集合内的元素必须是hashable的(不可变的)。要想表示一个set的set,那么内部的set必须是frozenset对象,因为frozenset是不可变的,是hashable的。
set构建示例 >>> {'Tom', 'Jerry', 'Peter'} # 使用花括号创建非空set集合 {'Jerry', 'Tom', 'Peter'} >>> set() # 使用set构建函数创建空set集合 set() >>> set((1, 2, 3 ,4)) # 使用set构建函数创建非空set集合 {1, 2, 3, 4} >>> set((1, 2, 3 ,['a', 'b', 'c'])) # set集合中的元素必须是不可变的、可哈希的 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unhashable type: 'list' set 和 frozenset都支持的操作作为无序集合,set不记录元素位置或插入顺序。因此set不支持索引、切片或其他类序列行为。
len(set) # 获取集合中的条目个数 x in set # 成员关系测试--包含 x not in set # 成员关系测试--不包含 for x in set # 循环遍历集合中的条目 isdisjoint(other) # 判断该集合是否与另外一个集合不相交(当且仅当交集为空),不相交则返回True issubset(other) 或 set <= other # 判断该集合是否是另外一个集合的子集 set < other # 判断该集合是否是另外一个集合的真子集 issuperset(other) 或 set >= other # 判断该集合是否是另外一个集合的父集 set > other # 判断该集合是否是另外一个集合的真父集 union(other,...) 或 set | other | ... # 求该集合与另外一个或多个集合的并集 intersection(other,...) 或 set & other & ... # 求该集合与另外一个或多个集合的交集 difference(other,...) 或 set - other - ... # 求该集合与另外一个或多个集合的差集(该集合中存在但其它集合中不存在的元素集合) symmetric_difference(other) 或 set ^ other # 求该集合与另外一个集合的对称差集(该集合中存在但另一集合中不存在,或另一集合中存在但该集合中不存在的元素集合) copy() # 返回一个新的浅拷贝集合说明:
a) union()、intersection()、differnce()、symmetric_difference()、issubset() 和 issuperset()方法的可接受任何可迭对象作为参数。相比之下,它们的基于运算符的相应操作需要它们的参数是set。这避免了像set('abc') & 'cbs'这样易出错的结构,有利于更易读的结构,如set('abc').intersection('cbs')。
>>> set('abc') {'c', 'a', 'b'} >>> set('abc') & 'cbs' # 使用操作符进行相关操作,操作符两边都必须是set类型 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unsupported operand type(s) for &: 'set' and 'str' >>> set('abc') & set('cbs') {'c', 'b'} >>> set('abc').intersection('cbs') # 调用方法进行相关操作,参数可以是任意可迭代对象 {'c', 'b'} >>> set('abc').intersection(['c','s', 'b']) {'c', 'b'}b) set和frozenset支持 集合与集合进行比较操作。
当且仅当每个集合的每个元素都包含在另一个(每个集合都是另一个的子集)时,两个集合是相等的;
当且仅当第一集合是第二集合的真子集(是子集,但不相等)时,集合小于另一集合;
当且仅当第一集合是第二集合的真父集(是父集,但不相等)时,集合大于另一集合;