从会计转数分已两年,近期我也在想有关数据分析进阶的事情。

数分所需要的技能其实N个文章都写过了,无非是:office套,sql,python,bi,机器学习等等。等我转行到这个行业后,第一份工作发现最经常做的是:

1、取数(以前我是提工单形式别人给我取)。

2、分析任务。

3、盯着数据,异常要提前分析原因。

4、做一些BI。

5、各种沟通扯皮。等等,

这些事情会让我感觉到和我所想的数分工作不一样,主要是感觉真得不怎么写代码,编程能力要求极弱,感觉这门槛其实很低很低。门槛低这事会让我慌,可能因为会计门槛这事,导致整体待遇根本升不上去,我转出来,就想找门槛相对较高的,没这么容易替代的工作。

转折应该是来到目前这厂,因为身处技术部门,这里经常强调工具化、自动化。在半年的工作过程中,让我感到一个数分相对难替代的技能:“开发数据产品的能力”。常见的数据产品:分析报告、BI工具、爬虫工具等。

除了这些我们还能做得更多,例如:

1、日报自动化处理并邮件发送:所需的技能linxu crontab、python核心库 : smtplib、requests 、html table知识。

2、自制化BI工具:主要目前BI工具不能和python进行完美交互,有些时候确实需要自己开发个web端来展示经过复杂数据处理的界面。核心库:plotly.dash 、html&css知识

3、自动分析脚本:其实很多分析工具,比如KPI异常分析这个流程多多少少能固化的,就算不能完美的分析根因,但一定可以缩小根因的范围,这个时候把一个就能做自动分析的工具,然后转化为API,给别人使用。核心库:pandas、flask

4、数据相关自动回复工具(微信聊天机器人): 对于一些简单的取数功能,可以适用这个方法。核心库:itchat

5、python爬虫:核心库:requests、Scrapy、beautifulsoup等,html&css&js知识

6、模型相关:业务上其实也能落地很多模型,用户流失模型预测,CTR预估,客户分级(聚类),异常检测等等。以及这些模型的上线知识。(这整块学问太大),核心库:sklearn、tensorflow、flask、jar包等等。

7、数分H5:像各产品的年终总结一样的H5。(比如支付宝账单,这块没做过,待学),其实就是一键数分报告形成。

应该还有更多,目前我做过的就是以上的前6,往后我会针对这一技能去写相关文章:开发这些产品过程,思路及代码。所需的编程能力,一些优化效率的能力:比如python多进程,多线程、模型调参的效率参数、mapreduce能力。

其实有点往数据分析工程师的方向发展了。但其实大多厂就是叫数据分析师。

目前是9102年了,我觉得不能总捞起什么sql,python,业务能力等老掉牙的东西,想在数据行业脱颖而出,面试有更多的亮点,和大多数据分析师不一样,那“开发数据产品能力”觉得是个不错的方向。