前面一篇文章我们介绍了numpy,但numpy的特长并不是在于数据处理,而是在它能非常方便地实现科学计算,所以我们日常对数据进行处理时用的numpy情况并不是很多,我们需要处理的数据一般都是带有列标签和index索引的,而numpy并不支持这些,这时我们就需要pandas上场啦!
WHAT?
Pandas是基于Numpy构建的库,在数据处理方面可以把它理解为numpy加强版,同时Pandas也是一项开源项目 。不同于numpy的是,pandas拥有种数据结构:Series和DataFrame:
下面我们就来生成一个简单的series对象来方便理解:
In [1]: from pandas import Series,DataFrame In [2]: import pandas as pd In [3]: data = Series([1,2,3,4],index = ['a','b','c','d']) In [4]: data Out[4]: a 1 b 2 c 3 d 4 dtype: int64