Python数据分析库Pandas (4)

日期：2022-09-14 栏目：程序人生浏览：次

     grouped = df.groupby([\'A\',\'B\']).groups
           print(df)
           print(grouped)
           print(grouped[(\'foo\', \'three\')])

# 分组计算函数方法

s = pd.Series([1, 2, 3, 10, 20, 30], index = [1, 2, 3, 1, 2, 3])
grouped = s.groupby(level=0) # 唯一索引用.groupby(level=0)，将同一个index的分为一组
print(grouped)
print(grouped.first(),\'→ first：非NaN的第一个值\n\')
print(grouped.last(),\'→ last：非NaN的最后一个值\n\')
print(grouped.sum(),\'→ sum：非NaN的和\n\')
print(grouped.mean(),\'→ mean：非NaN的平均值\n\')
print(grouped.median(),\'→ median：非NaN的算术中位数\n\')
print(grouped.count(),\'→ count：非NaN的值\n\')
print(grouped.min(),\'→ min、max：非NaN的最小值、最大值\n\')
print(grouped.std(),\'→ std，var：非NaN的标准差和方差\n\')
print(grouped.prod(),\'→ prod：非NaN的积\n\')

DataFrame 读取分组

import os 引入修改默认引入路径
os.chdir(\'c:/zzz/www\')

导入普通文本文件类型

pd.read_table(\'data1.txt\',delimiter=\',\',sep=False)

导入Excel数据表格少量数据

dataexcel = pd.read_excel(\'地市级党委***数据库（2000-10）.xlsx\',sheet_name=\'中国人民***地市级党委***数据库（2000-10）\',header=0)
print(dataexcel.head())

导入CSV大型数据表格

datacsv = pd.read_csv(\'地市级党委***数据库（2000-10）.csv\',encoding = \'utf-8\')
print(datacsv.head())

转载注明出处：https://www.heiqu.com/zggddj.html

Python数据分析库Pandas (4)

相关推荐