公司分派了一个活,预测景区未来的一段时间销量,目的...

一听说做预测,很兴奋,当时真的没有太考虑目的!老大也很高兴,说让我做一个景区未来每天的销量数据,供其他项目无限使用!

第一步、站在巨人的肩膀上

对自己说:“第一次做预测,先向外看看成熟的经验,不要瞎琢磨”

推荐下面的技术参考:

美团的技术博客

机器学习

第二步、准备开工

各种准备之后,觉得景区预测需要使用:线性回归和时间序列。

最*7天、最*30天、去年同期销售额、各种预测数据与真实数据的差距(方差),最终产出了第一版结果,准确率30%

第三步、纠正错误

经历打击之后,发现自己有些偏离轨道,回到初始需求,按照产品给的模型一步一步开发。下面是模型图:

销量预测_html

看不清也没有关系,预测的结果很不理想,因为很复杂&计算成本高,唯一佩服自己的是竟然开发出来了,准确率:50%

第四步、返璞归真

经历了上面的轮番打击,自己日夜加班三周竟然没有出结果,很沮丧,准确率如果不到50%预测就没有意义了!不如不预测,为什么预测的还不如不预测的感知的准确?

于是盯着屏幕,看趋势,发现每周的数据很相*,总结规律:周+节假日,时间*移即可。于是总结中国的节假日,*期*移上周的数据,远期*移去年的数据,结果*均准确率:80% 泪奔了!

销量预测_线性回归_02

总结:没必要上来就时间序列、线性回归、搞机器学习啥的,不如看看趋势图,虽然看起来很low,可简单&实用!

唯一值得分享的是节假日的数据表,很费时间,不过特定场合很实用:

销量预测_线性回归_03