加载可能用到的包
library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)
读取数据
打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txt
page"new1.txt")
JokicJokic[[9]]
list(Jokic)
df1colnames(df1)
首先看一看约基奇5个赛季常规赛的首发出场次数、场均出场时间、场均出手次数、命中率的变化趋势
散点图加折线图
df1_1%
select(Season,GS,MIN,FGA,"FG%")
df1_1
df1_1head(df1_1)
ggplot(df1_1,aes(x=Season,y=value,color=variable))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_wrap(~variable,scales = "free")+
theme_bw()+
theme(legend.position = "none")+
labs(x="",y="")
Rplot.png
从上图我们可以看到约基奇的命中率在17-18赛季最低,最近两个赛季在稳步上升,出手次数在19-20赛季略有下降,但出手次数整体是上升趋势,侧面反映约基奇从一个二轮秀到逐渐成为掘金队进攻核心的过程。场均出场时间17-18赛季达到最大值,恰好也是命中率最低的一个赛季,那我们可以合理猜测一下,要想最大效率的发挥约基奇的作用,应该合理安排他的出场时间。毕竟这桶行走的百岁山体力问题可能是一个较大的困扰。
接下来看一下得分、助攻、篮板、抢断、失误的数据
df1_2%
select(Season,PTS,REB,AST,TOV,BLK)
df1_2ggplot(df1_2,aes(x=Season,y=value,color=variable))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_wrap(~variable,scales = "free",ncol=3,nrow=2)+
theme_bw()+
theme(legend.position = "none",
axis.text.x = element_text(angle=60,vjust=0.5))+
labs(x="",y="")
Rplot01.png
从上图我们可以看到约基奇的得分、篮板、助攻数据在18-19赛季达到最大值,19-20赛季略呈下降趋势。可能的原因有很多,这里我猜可能是休赛季参加世界杯没有得到充足的休息导致的。
我们知道约基奇在场上的作用是组织核心,接下来看看在19-20赛季季后赛中约基奇的得分、助攻与比赛胜负的关系
数据来源是 https://www.basketball-reference.com/players/j/jokicni01/gamelog-playoffs/
df2"new2.txt",header=F,
stringsAsFactors = F)
df2_1%
select(V3,V9,V11,V13,V14,V24,V29)
colnames(df2_1)"Game","w_or_l","MIN","FGA","FG%","AST","PTS")
head(df2_1)
df2_1$w_or_l$w_or_l,1,1)
df2_1$MIN$MIN,1,2)
df2_1$MIN$MIN)
head(df2_1)
df2_1"Game",'w_or_l'))
head(df2_1)
ggplot(df2_1,aes(x=Game,y=value,color=w_or_l))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_grid(variable~.,scales = "free")+
theme_bw()+
theme(
legend.title = element_blank(),
axis.text.x = element_text(angle=60,vjust=0.5))+
labs(x="",y="")
Rplot03.png
比赛的胜负是诸多因素共同作用的结果,单纯从得分、及助攻等数据很难看出对比赛胜负的影响,除非你的队中有一位叫做波普的运动员。
最后看一看约基奇19-20赛季季后赛和常规赛的数据对比
list(Jokic)
df3df3
colnames(df3)[1]"Game"
colnames(df3)
df3_1%
select(Game,MPG,PPG,RPG,APG,BPG,TPG,"FG%","3P%","FT%")
df3_2df3_2
df3_2$Game$Game,"2019-20 ","")
ggplot(df3_2,aes(x=Game,y=value,fill=Game))+
geom_bar(stat="identity",width=0.5)+
facet_wrap(~variable,scales = "free")+
theme_minimal()+labs(x="",y="")+
theme(legend.position = "top",
legend.title = element_blank())
Rplot04.png
从上图可以看到 场均上场时间(MPG),场均得分(PPG)、场均盖帽(BPG)、三分命中率(3P%)季后赛的表现均高于常规赛。场均助攻数(APG)略少于常规赛,场均失误(TPG)也略多于常规赛。