Python设计学生成绩程序 python学生成绩录入和分析

转载

落笔成诗 2023-06-16 19:20:42

文章标签 Python设计学生成绩程序数据 ci 四舍五入 文章分类 Python 后端开发

目标：分析学生成绩的影响因素

1.导入原始数据，以及需要用到的库

import pandas as pd
import numpy as np
df = pd.read_csv('StudentsPerformance.csv')

(数据来源于kaggle)

2.查看文件

Python设计学生成绩程序 python学生成绩录入和分析_四舍五入

Python设计学生成绩程序 python学生成绩录入和分析_Python设计学生成绩程序_02

从上面的信息可以看出这一千个学生的数据中是没有空值，而且可以看出各列数据的类型。

还可以通过unique来查看某列数据都有哪些值，是否有无效数据。

df['parental level of education'].unique()
df['test preparation course'].unique()

Python设计学生成绩程序 python学生成绩录入和分析_Python设计学生成绩程序_03

再来查看成绩是否为有效值（使用loc）

df.loc[(df['math score']<0) | (df['math score']>100) | (df['reading score']<0) | (df['reading score']>100) | (df['writing score']<0) | (df['writing score']>100)]

Python设计学生成绩程序 python学生成绩录入和分析_Python设计学生成绩程序_04

可以看出成绩中没有无效值

3.数据处理
根据目标，删除一些不需要的列（使用drop）

df.drop(['gender','race/ethnicity'],axis=1)
#参数axis默认值为0，指行，要删除列的话将axis设为1
df_1 = df.drop(['gender','race/ethnicity'],axis=1)

Python设计学生成绩程序 python学生成绩录入和分析_ci_05

求学生成绩平均值

df_1['average']= round((df_1['math score']+df_1['reading score']+df_1['writing score'])/3)
#round()用来对数据四舍五入

Python设计学生成绩程序 python学生成绩录入和分析_Python设计学生成绩程序_06

4.分析学生成绩影响因素

df_1.groupby('parental level of education')['average'].agg([np.mean]).plot.bar()
df_1.groupby('lunch')['average'].agg([np.mean]).plot.bar()
df_1.groupby('test preparation course')['average'].agg([np.mean]).plot.bar()

Python设计学生成绩程序 python学生成绩录入和分析_数据_07

Python设计学生成绩程序 python学生成绩录入和分析_ci_08

Python设计学生成绩程序 python学生成绩录入和分析_ci_09

从上面三张图可以初步得出结论：

1.父母学历越高，学生成绩越好

2.午餐吃的好的同学成绩较高

3.考试准备充分的同学成绩较高

以下，用相关系数分析父母学历对哪科成绩影响最大

先按照父母学历高低将表中数据替换为数值

df_1.replace({'some high school':1, 'high school':2,'some college':3,"associate's degree":4,"bachelor's degree":5,"master's degree":6},inplace = True)
#inplace = True是为了改变文档的源数据

Python设计学生成绩程序 python学生成绩录入和分析_Python设计学生成绩程序_10