没有进入数据分析行业之前,我是在一家体制内单位上班。那个时候对数据分析的认知完全是从书本上获得的。印象最深的是,家里买了各种工具类的书,VBA、SAS、RLinuxSQL那个时候Python还没太热,对数据挖掘非常感兴趣,各种模型跑起来。面试前的准备也是一顿模型乱操作。因为不知道面试要考什么。

 

后来呢获得一个不错的机会,主要还是面试官不太懂,问的问题基本上还是限于书本理论知识,也算正式的进入互联网行业,工资基本上翻了2.5倍这个样子,而且各种待遇还很好。


现在看纯粹是机遇好,现在我去面试别人的时候,专业知识,工具和项目经验一个都不能少,考的时候还很有刁钻性。


进去这家公司的时候,整个数据团队8个人,基本上都是日常的周日报,日常工具就是EXCEL。


现在看来,这种工作非常的繁琐,对个人成长没一点好处。


大家一听我是专门做数据挖掘的(因为懂各种工具,会写代码),仿佛一眼看到了救星。给了我一个他们近期非常头疼的项目:******


开始的时候,内心是非常心虚的,除了会一点代码外,没有任何优势。慢慢的也是硬着头皮上,开始的一个月天天各种加班,补充业务知识和自身代码能力,现在看那段时间的编程水平提升是最快的。好在最后这个项目没有正式立项,还能在这家公司继续待着。

 

后来因为公司发展原因,调去另外一个项目团队做这种信用模型,要和咨询公司打成一片的那种,算是雇佣军角色。在做该项目的时候,正式的去了解了IT架构、业务类型、业务口径、有哪些常用表、表的字段有哪些、字段口径是什么。因为基建的一塌糊涂,每天做的最多的事就是各种底层数据的清洗,当时还因为一个清洗逻辑与同事争辩到通宵。


就这样时间过了半年,虽然我的title是数据挖掘,但还是在做数据提取工作,每次想看个简单的数如月新增都很难,当时的逻辑是表与表之间的匹配才能算出,但是表太大了,跑一个这样的数都要1个小时,一旦机器挂了又要重新来。每次只要领导一要数据,就要忙到晚上12点以后。在这种问题充分暴露下,公司管理层也是觉得必须要推倒重来,招人建立真正意义上的数据仓库。

 

基于这样的转折点,我也是顺利的去做了自己喜欢的事—机器学习模型,每天写各种代码,包括数据的提取,数据的转换,数据的共线性,特征的提取,模型的搭建和训练,模型的结果。


每天都是在各种调优模型,比如通过数据转换增加很多特征,像字段取对数,最大值最小值标准化,分箱操作等等。乐此不疲,最终比较幸运的是,模型还真的产品化了,上线完之后和外面公司去聊,别人都非常感兴趣。

现在看来,该模型能够发挥大的用途还真不是因为模型有多好,而是在输入层,数据源这里已经非常有优势了,无论是覆盖度还是有效度都非常高,也就是实际上个人提升并不明显。

 

该项目结束以后,也感觉有了一些信心。碰巧遇到公司业务调整,自己也想着不如去尝试一些新机会,进入一家看似很正规的互联网公司,进去之后的半年,一直没适应,整天做的最多的事就是ETL,游离于各种底层表的逻辑,每次写个SQL总是数不对,各种乱七八糟的口径,整个团队氛围也很不好,大家好像都非常安于现状,没有一点寻求改变的意思。


现在看,最大的好处就是把数据怎么来的这件事了解清楚了,从数据采集,到数据传输,再到数据计算和存储,最后是数据仓库的上层应用。以前我都不知道还有数据采集这回事。


慢慢的,觉得自己能力还是很不够,虽然说做数据分析,但是这么多年一直是在打辅助,真正的数据分析流程是怎么样子的我都不清楚。


又是一次公司业务调整,我也主动要求进入BI组,做真正意义上的数据分析师,从需求沟通到问题拆解,提取数据,分析方法,撰写报告,报告落地,基本上这一套都是在那个时候标准化的,也只有通过这种真实的实战经验理解才会深刻。可以说从野路子到正规军转变。

 

公司有段时间迷上了增长黑客,建立了各种虚拟项目团队,比如新增用户留存率提升,在做的过程中,发现增长黑客就是扯啊,很多方法都是理论,根本就没有可实战性,但是周围的人都非常迷恋。也是那个时候,我去想,真正的用户增长应该是围绕用户体验的,所有的术都应该放在一边,而寻求如何去提升用户感知,让用户对产品感兴趣,而不是局限于模型和方法。通过不断的学习和交流(找真正的高手),形成了自身的一套用户增长体系。

 

后来对接的某具体业务流量还行,但就是不赚钱,我也是感觉这样的业务肯定是没戏的,果然后来团队都被撤了,这里我在想,分析师除了要对流量打法熟悉外,更加要知道产品的商业化,否则最后被卖了可能都不知道,我们经常看到各种裁员,其实呢,你自己要做好预判,等到被裁或者被通知裁的时候已经错了最佳时机,出去也谈不起价。这也是很多分析师工作多年的通病,一直在做流量,但对商业化这块一点都不了解。

 

另外一个容易被忽视的点就是,往往太沉迷于当前专业知识,但是如果换了一个方向,可能就没办法继续前进。多年前我的领导跟我说的一句话我仍然记忆犹新:随着职场的发展,你的最大竞争力是那些可以持续沉淀的技能,而不是一些当前手里一些拼命握住的东西。


确确实实是这样,随着大家职场工作年限的增加,会遇到另外一个问题:多年来一直在做一件事,比如专门做的是渠道ROI,但是你敢说,除了对一些数字比较了解外,整个市场,ROI预测,接下来打法真的很了解吗,互联网行业是高度变化的,画风一变,把你排到另外一个项目组做商业化分析,这个时候你怎么办。

 

而这就要求你具备一些通用技能,在我看来包括独立思考、有效表达、工作上的逻辑、解决问题的能力这些。只有掌握了这些技能,你才不会被淘汰,因为你一直在正确思考(而不是胡思乱想),一直在和别人有效沟通(而不是说半天也不知道什么意思),一直有逻辑性(而不是野路子),一直在解决问题(成为一个闭环高手)。只有这样才会处在行业的TOP端。这些技能一旦学会了,终身受用。