要想知道每个函数的具体用法,***的办法还是浏览官方库
Input/output — pandas 1.3.2 documentation (pydata.org)
Pandas: 强大的 Python 数据分析支持库 | Pandas 中文 (pypandas.cn)
Series pandas.Series(data=None, index=None)其中, data 可以是字典,或者NumPy 里的 ndarray 对象等。 index 是数据索引,索引是 Pandas 数据结构中的一大特性,它主要的功能是帮助我们更快速地定位数据。
像字典一样,可以直接通过键值提取数据 生成时,默认的键值是0,1,2,3...
与Dataframe有一点明显的不同,Series支持数字索引提取行(大概是只有一列的缘故)
常用操作 增删改查 拼接元素 删除元素 Series运算对于Series的加减乘除来说是按照索引对齐的
此外的方法还有
s4.add(s3)# 加 s4.sub(s3)# 减 s4.mul(s3)# 乘 s4.div(s3)# 除 s4.median()# 中位 s4.sum()# 和 s4.max()# 最大 s4.min()# 最小 DataFrameDataFrame 是 Pandas 中最为常见、最重要且使用频率最高的数据结构。DataFrame 和平常的电子表 格或 SQL 表结构相似。你可以把 DataFrame 看成是 Series 的扩展类型,它仿佛是由多个 Series 拼合而 成。它和 Series 的直观区别在于,数据不但具有行索引,且具有列索引。
DataFrame 基本结构如下:
pandas.DataFrame(data=None, index=None, columns=None)区别于 Series,其增加了 columns 列索引。DataFrame 可以由以下多个类型的数据构建:
一维数组、列表、字典或者 Series 字典。
二维或者结构化的 numpy.ndarray 。
一个 Series 或者另一个 DataFrame。
文件的IO读取Input/output — pandas 1.3.2 documentation (pydata.org)
csv文件 #写入 pandas.read_csv() #读取 df.to_csv(\'animal.csv\') excel文件 pd.read_excel(\'animal.xlsx\', \'Sheet1\', index_col=None, na_values=[\'NA\']) df3.to_excel(\'animal.xlsx\', sheet_name=\'Sheet1\') 文件的预览 #显示头几行 df.head() #显示后几行 df.tail() #显示大致的描述 df.describe() 基于索引的访问 基于数字的索引单个数字作为索引用来选取一行
基于列表的多行访问 基于切片的列访问 基于切片的行列访问 基于标签名的访问df.loc[] 可以接受的类型有:
单个标签。例如: 2 或 \'a\' ,这里的 2 指的是标签而不是索引位置。
列表或数组包含的标签。例如: [\'A\', \'B\', \'C\'] 。
切片对象。例如: \'A\':\'E\' ,注意这里和上面切片的不同之处,首尾都包含在内。
布尔数组。
可返回标签的函数或参数。
data.列名在列名中没有点的时候也可以用
对dataframe信息进行筛选通过逻辑表达式可以对dataframe中的内容进行筛选