PYTHON数据分析-Pandas学习

要想知道每个函数的具体用法,***的办法还是浏览官方库

Input/output — pandas 1.3.2 documentation (pydata.org)

Pandas: 强大的 Python 数据分析支持库 | Pandas 中文 (pypandas.cn)

Series pandas.Series(data=None, index=None)

其中, data 可以是字典,或者NumPy 里的 ndarray 对象等。 index 是数据索引,索引是 Pandas 数据结构中的一大特性,它主要的功能是帮助我们更快速地定位数据。

像字典一样,可以直接通过键值提取数据 生成时,默认的键值是0,1,2,3...

与Dataframe有一点明显的不同,Series支持数字索引提取行(大概是只有一列的缘故)

image

常用操作 增删改查 拼接元素

image

删除元素

image

Series运算

对于Series的加减乘除来说是按照索引对齐的

image

此外的方法还有

s4.add(s3)# 加 s4.sub(s3)# 减 s4.mul(s3)# 乘 s4.div(s3)# 除 s4.median()# 中位 s4.sum()# 和 s4.max()# 最大 s4.min()# 最小 DataFrame

DataFrame 是 Pandas 中最为常见、最重要且使用频率最高的数据结构。DataFrame 和平常的电子表 格或 SQL 表结构相似。你可以把 DataFrame 看成是 Series 的扩展类型,它仿佛是由多个 Series 拼合而 成。它和 Series 的直观区别在于,数据不但具有行索引,且具有列索引。

DataFrame 基本结构如下:

pandas.DataFrame(data=None, index=None, columns=None)

区别于 Series,其增加了 columns 列索引。DataFrame 可以由以下多个类型的数据构建:

一维数组、列表、字典或者 Series 字典。

二维或者结构化的 numpy.ndarray 。

一个 Series 或者另一个 DataFrame。

文件的IO读取

Input/output — pandas 1.3.2 documentation (pydata.org)

csv文件 #写入 pandas.read_csv() #读取 df.to_csv(\'animal.csv\') excel文件 pd.read_excel(\'animal.xlsx\', \'Sheet1\', index_col=None, na_values=[\'NA\']) df3.to_excel(\'animal.xlsx\', sheet_name=\'Sheet1\') 文件的预览 #显示头几行 df.head() #显示后几行 df.tail() #显示大致的描述 df.describe()

image

基于索引的访问 基于数字的索引

单个数字作为索引用来选取一行

image

基于列表的多行访问

image

基于切片的列访问

image

基于切片的行列访问

image

基于标签名的访问

df.loc[] 可以接受的类型有:

单个标签。例如: 2 或 \'a\' ,这里的 2 指的是标签而不是索引位置。

列表或数组包含的标签。例如: [\'A\', \'B\', \'C\'] 。

切片对象。例如: \'A\':\'E\' ,注意这里和上面切片的不同之处,首尾都包含在内。

布尔数组。

可返回标签的函数或参数。

image

data.列名在列名中没有点的时候也可以用

对dataframe信息进行筛选

通过逻辑表达式可以对dataframe中的内容进行筛选

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zgfgjz.html