pandas入门指南 (2)

日期：2021-06-06 栏目：程序人生浏览：次

merge方法
第一个参数、第二个参数：需要合并的矩阵
on：公有列名
how：处理非公有行的方式，inner：去除非公有行，outer：对非公有的行进行NaN值填充然后合并，left：保留左矩阵的所有行，对非公有的元素进行NaN值填充，right：保留右边矩阵的所有行，对非公有的元素进行NaN值填充
indicator：是否显示每一行的merge方式
suffixes：非公有列的列名后缀

df1 = pd.DataFrame({ 'key':['K1', 'K2', 'K3'], 'A':['A1', 'A2', 'A3'], 'B':['B1', 'B2', 'B3'] }) df2 = pd.DataFrame({ 'key':['K1', 'K2', 'K3'], 'C':['C1', 'C2', 'C3'], 'D':['D1', 'D2', 'D3'] }) print(pd.merge(df1, df2, on='key')) df3 = pd.DataFrame({ 'key1':['K1', 'K1', 'K0'], 'key2':['K1', 'K0', 'K1'], 'col':[1, 2, 3] }) df4 = pd.DataFrame({ 'key1':['K0', 'K1', 'K0'], 'key2':['K1', 'K0', 'K0'], 'col':[6, 7, 8] }) # how = {'inner', 'outer', 'left', 'right'} print(pd.merge(df3, df4, on=['key1', 'key2'], how='right', suffixes=['_left', '_right'], indicator=True)) 八、pandas数据可视化

pandas数据可视化依赖matplotlib库，所以在可视化数据之前应该先导入该库

import matplotlib.pyplot as plt

首先通过np.ramdom方法生成四列随机数据
然后通过cumsum对随机数据做累加
再通过scatter方法以其中两列为绿色点X, Y的值，另两列为蓝色点X, Y的值
最后使用plt.show()方法画图

data = pd.DataFrame(np.random.randn(1000, 4), index=np.arange(1000), columns=list("ABCD")) data = data.cumsum() # plot methods: # 'bar', 'hist', 'box', 'kde', 'area', 'scatter', 'hexbin', 'pie' ax = data.plot.scatter(x='A', y='B', color='blue', label='class 1') data.plot.scatter(x='C', y='D', color='green', label='class 2', ax=ax) plt.show()

转载注明出处：https://www.heiqu.com/wpxswg.html

pandas入门指南 (2)

相关推荐