grouped = df.groupby([\'A\',\'B\']).groups
print(df)
print(grouped)
print(grouped[(\'foo\', \'three\')])
s = pd.Series([1, 2, 3, 10, 20, 30], index = [1, 2, 3, 1, 2, 3])
grouped = s.groupby(level=0) # 唯一索引用.groupby(level=0),将同一个index的分为一组
print(grouped)
print(grouped.first(),\'→ first:非NaN的第一个值\n\')
print(grouped.last(),\'→ last:非NaN的最后一个值\n\')
print(grouped.sum(),\'→ sum:非NaN的和\n\')
print(grouped.mean(),\'→ mean:非NaN的平均值\n\')
print(grouped.median(),\'→ median:非NaN的算术中位数\n\')
print(grouped.count(),\'→ count:非NaN的值\n\')
print(grouped.min(),\'→ min、max:非NaN的最小值、最大值\n\')
print(grouped.std(),\'→ std,var:非NaN的标准差和方差\n\')
print(grouped.prod(),\'→ prod:非NaN的积\n\')
DataFrame 读取分组
import os 引入 修改默认引入路径
os.chdir(\'c:/zzz/www\')
导入普通文本文件类型
pd.read_table(\'data1.txt\',delimiter=\',\',sep=False)
导入Excel数据表格 少量数据
dataexcel = pd.read_excel(\'地市级党委***数据库(2000-10).xlsx\',sheet_name=\'中国人民***地市级党委***数据库(2000-10)\',header=0)
print(dataexcel.head())
导入CSV大型数据表格
datacsv = pd.read_csv(\'地市级党委***数据库(2000-10).csv\',encoding = \'utf-8\')
print(datacsv.head())