Python str、list、numpy分片操作

日期：2020-06-12 栏目：程序人生浏览：次

在Python里，像字符串(str)、列表(list)、元组(tupple)和这类序列类型都支持切片操作

对对象切片，s是一个字符串，可以通过类似数组索引的方式获取字符串中的字符，同时也可以用s[a:b:c]的形式对s在a和b之间，以c为间隔取值，c的值还可以为负，负值则意味着反向取值

>>> s = 'bicycle'
>>> s[0]
'b'
>>> s[1]
'i'
>>> s[::3]
'bye'
>>> s[::-1]
'elcycib'
>>> s[::-2]
'eccb'

给切片赋值

首先，生成一个长度为16，从0到15的列表

>>> l = list(range(16))
>>> l
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

用[20,30]将取代索引[2，5)的值

>>> l[2:5] = [20, 30]
>>> l
[0, 1, 20, 30, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

索引[5,8)将被删除

>>> del l[5:8]
>>> l
[0, 1, 20, 30, 5, 9, 10, 11, 12, 13, 14, 15]

从数组第9个索引开始，以两个单位为间隔，将[11,22]赋值给左边的分片对象，如果赋值数组中元素的个数和分片对象中元素的个数不同，则会报错

>>> l[9::2]
[13, 15]
>>> l[9::2] = [11, 22]
>>> l
[0, 1, 20, 30, 5, 9, 10, 11, 12, 11, 14, 22]
>>> l[6::2]
[10, 12, 14]
>>> l[6::2] = [66, 77, 88] # 同理，l[6::2]必须为[n1,n2,n3]的数组，如果不是则将其赋值为[66, 77, 88]则会报错
>>> l
[0, 1, 20, 30, 5, 9, 66, 11, 77, 11, 88, 22]

列表l[2:5]的结果是[20, 30, 5]，而我们的赋值是[30, 33]，所以30会代替20,33会代替30，而5则会被去除。如果左边数组元素的个数少于赋值数组中元素的个数，则原数组分片之后的元素会排在新元素之后

>>> l[2:5]
[20, 30, 5]
>>> l[2:5] = [30, 33]
>>> l
[0, 1, 30, 33, 9, 66, 11, 77, 11, 88, 22]
>>> l[2:5]
[30, 33, 9]
>>> l[2:5] = [-10, -20, -30, -40, -50]
>>> l
[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]

拷贝一个分片对象，并修改其中的值，并不会修改原列表对象中的值

>>> l1 = l[2:5]
>>> l1
[-10, -20, -30]
>>> l1 = [10, 20, 30]
>>> l1
[10, 20, 30]
>>> l
[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]

如果将一个数字赋值给左边的分片对象，则会报错

>>> l[2:5] = 10
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: can only assign an iterable

numpy基本的索引和切片

>>> import numpy as np
>>> arr = np.arange(10)
>>> arr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> arr[5]
5
>>> arr[5:8]
array([5, 6, 7])
>>> arr[5:8] = 12 # 这里不会像之前会报错
>>> arr
array([ 0, 1, 2, 3, 4, 12, 12, 12, 8, 9])

如上所示，当你将一个标量赋值给一个切片对象时（如arr[5:8] = 12），该值会自动传播到整个选区。跟之前列表的分片的区别在于，numpy数组分片是原始数组的视图，数据没有被复制，视图上任何的修改都会直接反映到源数据上，如果不希望修改到源数据，则用arr[5:8].copy()：

>>> arr_slice = arr[5:8]
>>> arr_slice
array([12, 12, 12])
>>> arr_slice[1] = 99
>>> arr_slice
array([12, 99, 12])
>>> arr
array([ 0, 1, 2, 3, 4, 12, 99, 12, 8, 9])
>>> arr_slice[:] = 66
>>> arr
array([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])
>>> arr_slice_copy = arr[5:8].copy()
>>> arr_slice_copy
array([66, 66, 66])
>>> arr_slice_copy[:] = 88
>>> arr_slice_copy
array([88, 88, 88])
>>> arr
array([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])

在一个二维数组中，各索引位置上的元素不再是标量而是一维数组：

>>> arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
>>> arr2d[2]
array([7, 8, 9])
>>> arr2d[0][2]
3
>>> arr2d[0, 2]
3

按照行或者列来进行分片

>>> arr2d
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
>>> arr2d[:2] # 取前两行，即第0行和第1行
array([[1, 2, 3],
[4, 5, 6]])
>>> arr2d[:2, 1:] # 取前两行的第零列之后所有元素
array([[2, 3],
[5, 6]])
>>> arr2d[:, 1:2] # 取所有行的第一列元素（列索引从0开始）
array([[2],
[5],
[8]])
>>> arr2d[1, :2] # 取第一行的前两列的元素元素
array([4, 5])
>>> arr2d[2, :1] # 取第二行的第零列元素
array([7])
>>> arr2d[:, :1] # 取所有行的第零列元素
array([[1],
[4],
[7]])
>>> arr2d[:, 1:] = 0 # 同样，分片表达式的赋值操作也会扩散到源数据
>>> arr2d
array([[1, 0, 0],
[4, 0, 0],
[7, 0, 0]])

布尔型索引

假设我们有一个用于存储数据的数组以及一个存储姓名的数组（含有重复项）。

转载注明出处：https://www.heiqu.com/9bac84459a536169e2d968c3061b3082.html

Python str、list、numpy分片操作

相关推荐