PYTHON数据分析-Pandas学习

日期：2022-10-30 栏目：程序人生浏览：次

要想知道每个函数的具体用法，***的办法还是浏览官方库

Input/output — pandas 1.3.2 documentation (pydata.org)

Pandas: 强大的 Python 数据分析支持库 | Pandas 中文 (pypandas.cn)

Series pandas.Series(data=None, index=None)

其中， data 可以是字典，或者NumPy 里的 ndarray 对象等。 index 是数据索引，索引是 Pandas 数据结构中的一大特性，它主要的功能是帮助我们更快速地定位数据。

像字典一样，可以直接通过键值提取数据生成时，默认的键值是0，1，2，3...

与Dataframe有一点明显的不同，Series支持数字索引提取行（大概是只有一列的缘故）

常用操作增删改查拼接元素

删除元素

Series运算

对于Series的加减乘除来说是按照索引对齐的

此外的方法还有

s4.add(s3)# 加 s4.sub(s3)# 减 s4.mul(s3)# 乘 s4.div(s3)# 除 s4.median()# 中位 s4.sum()# 和 s4.max()# 最大 s4.min()# 最小 DataFrame

DataFrame 是 Pandas 中最为常见、最重要且使用频率最高的数据结构。DataFrame 和平常的电子表格或 SQL 表结构相似。你可以把 DataFrame 看成是 Series 的扩展类型，它仿佛是由多个 Series 拼合而成。它和 Series 的直观区别在于，数据不但具有行索引，且具有列索引。

DataFrame 基本结构如下：

pandas.DataFrame(data=None, index=None, columns=None)

区别于 Series，其增加了 columns 列索引。DataFrame 可以由以下多个类型的数据构建：

一维数组、列表、字典或者 Series 字典。

二维或者结构化的 numpy.ndarray 。

一个 Series 或者另一个 DataFrame。

文件的IO读取

Input/output — pandas 1.3.2 documentation (pydata.org)

csv文件 #写入 pandas.read_csv() #读取 df.to_csv(\'animal.csv\') excel文件 pd.read_excel(\'animal.xlsx\', \'Sheet1\', index_col=None, na_values=[\'NA\']) df3.to_excel(\'animal.xlsx\', sheet_name=\'Sheet1\') 文件的预览 #显示头几行 df.head() #显示后几行 df.tail() #显示大致的描述 df.describe()