SQL的学习分为三个步骤:一是对基础知识的系统理解、整合和掌握,方法就是系统地看相关课程,并做思维导图笔记进行归纳整理;二是进行相应的实操作业练习,我是在sqlzoo网站完成了所有的操作练习;三是项目实战操作,所以我把自己实战的经过整理成了这篇文章。
业务是数据分析的核心目的,在进行数据分析之前,首先应该要明确分析目标。接下来要用MySQL对数据分析职位进行分析。
一、明确目标
1、数据分析在不同城市的职位数量
2、工作年限对薪酬的影响
3、数据分析职位的教育要求
4、数据分析的主要工作领域
5、数据分析的职位类型
二、数据导入
1、创建数据库
2、创建表格
创建成功的数据表
然后导入文件,选择文件格式为CSV
中途出现了导入数据错误的情况
几经尝试发现是因为编码不对,用notepad进行了转码,数据就导入成功了。
三、数据清洗
1、统一为小写格式
2、去重
3、删除salary中的dirty read
4、对薪资进行切分
首先插入最低薪资、最高薪资和平均薪资这三列。
bottomsalary = bots
topsalary = tops
averagesalary = aves
命令如下:
看到表格里列添加成功
然后对薪资这三列进行计算
计算成功
四、构建模型
1、数据分析职位在不同城市的职位数量和平均薪资
通过数据可以发现,数据分析职位在北、上、深、杭、广的需求明显高于其他城市,尤其是北京,占了所有岗位总和将近一半。其次是上海约占20%,然后是深圳约占10%,杭州约占8%,广州约占7%。再往后其他的城市占比明显降低。并且平均薪资也是北上深杭较高。
2、工作年限对薪资的影响
通过以上数据结果可以发现,1-3年和3-5年的需求是最大的,均在30%以上。相比较而言,10年以上的需求却很小,可能是因为数据分析是新兴的职位的原因。观察平均薪资可以发现,随着工作时间的增加,每月薪资涨幅在6-7k左右,说明职业发展较好。
3、数据分析职位对学历的要求
通过以上数据结果可以发现,本科学历所占比为76%,为数据分析的主力军,大专和硕士占比分别为12%和6%,博士学历所占最少。观察平均薪资可以发现,学历越高,平均薪资越高。
4、数据分析的主要工作领域
对数据工作领域的职位进行分类整理
通过数据可以发现,移动互联网、金融、O2O、数据服务和电子商务的职位数目较多,并且平均薪资在18k左右。
上面方式计算的职位数目是各领域不交叉,下面看一下在“移动互联网、金融、O2O、数据服务和电子商务”这些单独的标签下,岗位的数量情况。
从该数据可以看到,移动互联网的职位数目最多。
下面可以继续分析不同城市的不同领域的职位数目。
通过数据可以发现,在各个城市当中,移动互联网的数量是最多的,然后是金融和数据服务。
总结:
在实战之前做好基础知识的框架建立,并做好相应的实操练习对项目的顺利进行帮助很大。由于之前通过学习网上教程,系统地学习了两本书《sql必知必会》、《SQL基础教程》并归纳整理了思维导图笔记,在sqlzoo里面扎实地完成了所有的实操练习,所以做起项目来相对来说还算顺利,但是也会遇到一些问题,比如开始导入数据的时候不成功,后来才发现是因为编码不对的原因。可见纵然知识体系掌握得再好也是需要经过不断的实际操作练习才能巩固和应用所学的知识。在数据分析这条路上,需要不断学习不断操作实际项目才能越走越远~