大家好,我是小一七月碎碎念_数据分析

没有想到七月过的如此之快,以至于在我写完这份碎碎念的时候它已经过去了。

有一个好消息分享给大家,上周文章中提到的那个比赛:聊聊最近的现况:被冲了!,我成功晋级了,虽然期间也出过一些乌龙,不过最终结果还是挺让人开心的。

其实,一开始我有考虑过打比赛这件事要不要在文章中提,因为不确定最后会不会有好的结果,而且这也是一个相对比较私人的事情,最重要的是比赛的题目、数据因为涉密,都不可以分享出来。

所以,我一直在犹豫

但是最终,大家也看到了,我还是写了出来,其实说服我的原因也很简单:我写公众号从不是为了什么八股文、内核深层技术的探索,我只是记录自己在学习、在工作中的心路历程,顺便写出来供他人参考

这个从公众号的名称上就能看出来:小一的学习笔记,本就是一个记录学习笔记的平台,但是有幸被这么多人关注却是让我意想不到的事情。包括参加这次比赛,虽然工作上的要求是主要因素,但是自己感兴趣却是最直接的动力驱使。

关于比赛的内容还是不太能和大家分享,但是我会换种方法写出来,可能会涉及到:基于时间序列的异常检测、聚类算法的应用、回归模型和分类模型的baseline、以及在建模之前我会用到的一些数据分析方法。后面抽空我会分享出来,感兴趣的可以期待一下

七月碎碎念_数据分析_02

总结一下七月的学习,大概收获了以下几点:


  • 时间序列刚入门,了解了常用的几个算法
  • 神经网络在原来的基础上基本掌握,实现起来也不是问题
  • 聚类算法、PCA掌握并应用,以前只是知道原理
  • 回归和分类模型在实现中的区别理清了,后面应该都不会再出错了
  • 特征工程应该怎么做有了自己的策略

总得来看,上面这些收获基本都是在参加比赛过程中的所获,毕竟它就花了我大半个月的时间。其他时间也都是被一些零碎的工作所支配,暂时没有什么质的突破,也就没有列出来。

这5项中的每一项都是一个很不错的学习目标,如果你还是学生,刚好暑期出不了门只能在家学习,建议可以找一个方向尝试一下,挺有趣的

后面我在学习整理的过程中,如果哪一个方向能成一个体系,我也会分享出来供大家参考学习。不过这都是后话了,可能需要等一段时间,毕竟我只能下班了抽空弄。


七月碎碎念_数据分析_02

再说回公众号,七月份虽然自己学到了很多东西,但是公众号却是有点搁置了,这个属实抱歉

不过这几周我会补回来的,内容除了上面说的那些之外,还是会延续之前的主线。

可能有的读者也是最近才关注的,不太清楚之前的主线是什么,我大概说一下:


  • 主线1:数据分析扫盲指南,主要是自己在数据分析之路上踩过的一些坑,包括办公自动化等
  • 主线2:爬虫+数分实战,主要是爬取数据并进行分析,目前已经有:住房、微博粉丝、知乎话题、地铁站点、高校位置、医疗机构等内容,后续会继续扩充
  • 主线3:从数据分析的角度去投资理财,主要是从数据分析的角度去关注基金、股票,把握当下最热门的方向。这个随着基金持仓的披露更新,可能一季度也就一两篇,但是绝对超值!

差不多就这些,其他的内容因为太过于零碎我暂时还没整理,暂且都算做支线吧。

去年的文章里面有:Python入门、爬虫入门、算法入门这些,基本都算是完结了,后面大体上不会再增加了,想补充基础的可以点击学习:小一的零基础入门系列


以上就是7月份小一的学习笔记总结,内容有些简略,好多都是一笔带过的,希望不要对大家的阅读造成影响。

哎,其实一笔带过的背后往往都是辛酸,说到这,小一的眼角又湿润了...

就这样结尾吧,开始写文章的时候我还吃着冰棍挺快落的,写到最后突然就有点...