pd.pivot_table(data=df,index='Year',values='Global_Sales',aggfunc=np.mean,margins=True,margin s_name='总计')
pd.crosstab(index=df['Platform'],columns=df['Genre'],margins=True)
df=pd.read_csv('online_order.csv',encoding='gbk',dtype={'customer':str,'order':str})
df.info()
df.columns#输出字段名称
#透视图
#行分组键
#par1:数据名;par2:行分组键;par3:分组字段;par4:多个统计量;margins:是否总计
pd.pivot_table(data=df,index='weekday',values='total_items',aggfunc=[np.mean,np.max,np.min],margins=True,margins_name='总计商品情况')
#列分组键
#par1:数据名;par2:行分组键;par3:分组字段;par4:多个统计量;margins:是否总计
pd.pivot_table(data=df,index='weekday',columns='cusomer',values='total_items',aggfunc=np.mean,margins=True,margins_name='总计商品情况',fill_value=0)#缺失值为0
#参数不好记?
pd.pivot_table?
#交叉表:主要计算频数
#周一到周天 不同折扣下的订单数
pd.crosstab(index=df['weekday'],columns=df['discount%'])
#margins:总计;normalize:'all'所有数据正则化;index对行归一化
pd.crosstab(index=df['weekday'],columns=df['discount%'],margins=True,normalize='all')
#行百分比,每一个数/全行的总和
pd.crosstab(index=df['weekday'],columns=df['discount%'],margins=True,normalize='index')