Python数据分析库Pandas (4)

     grouped = df.groupby([\'A\',\'B\']).groups
           print(df)
           print(grouped)
           print(grouped[(\'foo\', \'three\')])

# 分组计算函数方法

s = pd.Series([1, 2, 3, 10, 20, 30], index = [1, 2, 3, 1, 2, 3])
grouped = s.groupby(level=0)  # 唯一索引用.groupby(level=0),将同一个index的分为一组
print(grouped)
print(grouped.first(),\'→ first:非NaN的第一个值\n\')
print(grouped.last(),\'→ last:非NaN的最后一个值\n\')
print(grouped.sum(),\'→ sum:非NaN的和\n\')
print(grouped.mean(),\'→ mean:非NaN的平均值\n\')
print(grouped.median(),\'→ median:非NaN的算术中位数\n\')
print(grouped.count(),\'→ count:非NaN的值\n\')
print(grouped.min(),\'→ min、max:非NaN的最小值、最大值\n\')
print(grouped.std(),\'→ std,var:非NaN的标准差和方差\n\')
print(grouped.prod(),\'→ prod:非NaN的积\n\')
 

 DataFrame 读取分组

      import os       引入 修改默认引入路径
       os.chdir(\'c:/zzz/www\')

     导入普通文本文件类型

   

  pd.read_table(\'data1.txt\',delimiter=\',\',sep=False)     
 

 

     导入Excel数据表格  少量数据

   

dataexcel = pd.read_excel(\'地市级党委***数据库(2000-10).xlsx\',sheet_name=\'中国人民***地市级党委***数据库(2000-10)\',header=0)
       print(dataexcel.head())
 

     导入CSV大型数据表格

  

   datacsv = pd.read_csv(\'地市级党委***数据库(2000-10).csv\',encoding = \'utf-8\')
      print(datacsv.head())
 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zggddj.html