在机器学习所取得的所有成就中,预测能力是推动商业、医疗、执法等领域决策的圣杯。比如,目标营销通常会预测哪些客户会购买其产品,然后根据预测将宣传册寄给那些被标记为潜在购买者的人。


看到广告就想买买买?也许你只是被机器学习套路了……_java


营销的意义在于改变人们的想法、影响他们。但如果被寄送宣传册的潜在购买者中,存在一部分那些无论如何都会购买的顾客——他们根本不需要收到宣传册来被说服,所以这是一笔浪费掉的开销,更不用说其所消耗的纸张及砍伐的树木了。


看到广告就想买买买?也许你只是被机器学习套路了……_java_02

预测新目标:人们是否会受影响?


所以,我们应该做的是用机器学习来预测客户看到宣传册后是否会受到影响,而不是预测其是否会购买。这是两种截然不同的预测。与传统的数据驱动营销模式相比,这是一个翻天覆地的变化。


这同样适用于医疗保健。如果我们根据人们的健康状况因为一种医疗保健法的应用后有所改善,从而推广这种方法的话,那么我们所犯的错误与市场营销完全相同。因为有些病人即使不接受治疗也会好转。如果你吃了一片药,头痛就会停止,你怎么知道头痛本来就不会停止呢?


那么预测哪些病人可能会因治疗而痊愈,哪些会变得更糟呢?因此,与其预测患者是否会因为这种治疗而改善,不如预测患者是否只会因为这种治疗而改善,而不会因为其他治疗而改善,以及这种治疗本身是否会带来积极的变化。


看到广告就想买买买?也许你只是被机器学习套路了……_java_03

这些事情,总会让我们感到困惑……


毕竟,市场营销和医疗保健是非常相似的。在这两种情况下,你都想作出一个最优抉择,以使接受治疗的人能得到最好的康复。这些巨大努力的全部意义——适用于数百万人的所有治疗方法——是为了改善治疗效果,要对世界产生积极的影响。决定治疗的最好方法是预测其是否会产生治疗的预期效果。


说清楚这个问题之后,我们就可以确定:使用机器学习来生成预测模型,预测的不是结果本身,而是治疗对每个患者或客户的影响。如果我们应用这种疗法,它会计算出对这个人产生积极结果的可能性。


所以我们需要的就是让机器学习正确的数据集。通常,我们只使用以前的营销活动结果,因为我们已经对没购买的客户及购买的客户做了跟踪。通过这些购买和不购买的例子,生成一个预测模型,标记出谁可能购买。所以,为了标记出谁可能会受影响去购买,我们只需要一些受影响去购买的人和不受影响的人的例子。   


看到广告就想买买买?也许你只是被机器学习套路了……_java_04

困境:我们无法获得相关数据


呃……但是我们如何追踪谁受到了影响呢?了解某人受影响的唯一方法是,若知道如果我们不联系他们,他们就不会买,那么我们精美的宣传册就会改变他们的想法。但我们确实只有联系了他们才能知道答案,如果我们不联系他们,又怎么知道会发生什么?


看到广告就想买买买?也许你只是被机器学习套路了……_java_05

说服产生于大脑,大脑实际是一个黑匣子


关于谁改变了主意,我们没有确切的数据,包括任何与购买或其他行为有关的事情。毕竟,我们如何得知? 我们没有大脑扫描仪,即使有,我们对大脑的了解也是非常有限的。


好吧,我们可以通过民意调查来询问顾客,但我们是在尝试使用公司已经拥有的真实的消费者行为数据,而不是把钱花在民意调查上,这样我们能得到顾客情况的数量就会减少。此外,顾客对自己是否受到“影响”的反应是主观的。相反,利用现有的公司数据将更为有效,这些数据本质上是观察消费者在“自然栖息地”的自发行为。但发生影响的案例基本上是无法观察到的。


所以,尴尬之处在于——我们无法获得我们最关心的一件事的数据。


行为的目的就是做出一些改变。但我们不能确定一个人是否被说服或受影响。要知道顾客有没有被说服,我们需要两个问题的答案:


1. 与客户联系后其是否购买?


2. 客户是否在没有联系的情况下购买?


如果第一个问题的答案是肯定的,即,当联系时,他们确实买了,同时第二个问题的答案是否定的,即,当没有联系时,他们没有买,那么我们知道联系产生了影响。但是,如果两个答案都是肯定的,我们就知道他们怎样都会购买——他们是“确定”客户——所以营销策略没有任何影响。


问题是,你不能同时回答这两个问题,因为你不能同时联系和不联系同一个人。你不可能干净利落、结论性地测试你的营销材料对任何一个人的说服力。所以我们不能对影响进行观察,我们不能收集其有关数据,所以我们怎么能对其进行分析或预测?


看到广告就想买买买?也许你只是被机器学习套路了……_java_06

说服悖论: 未知论 


这种未知悖论甚至渗透到你的约会生活中。如何优化约会时的行为? 因为你来餐厅不是来吃饭的——你是来销售的。你既是市场总监又是产品总监。因此,对哪些销售或营销信息将影响前景,对更好的销售成果进行预测是非常重要的。


看到广告就想买买买?也许你只是被机器学习套路了……_java_07

上图为电影《土拨鼠日》中的Bill Murray和Andie MacDowell


在电影《土拨鼠日》中,Bill Murray日复一日地重复同样地生活——这是他极其厌烦的——直到他意识到自己的一项前所未有的超能力:他可以预测在完全相同的情况及前景下进行的不同的治疗,看看哪一种会产生积极的结果。


Bill Murray想预测什么? 成功? 结果? 她是否会爱上他?不。他在乎的不是将要发生什么,而是他能做些什么。他试图预测,这种治疗会带来积极的结果吗? 不幸的是,我们不能在现实生活中使用该方法,因为这根本就不存在。除了在电子游戏中。


看到广告就想买买买?也许你只是被机器学习套路了……_java_08

衡量人口的净影响


我们可以衡量对一群人的影响。例如,在一项由潜伏在公共厕所里的专业研究人员进行的研究中,提醒人们洗手的标志将洗手比例从50%提高到了69%,用肥皂洗手而不仅仅是用水冲洗。所以标志确实有积极的影响。但事实上,这种影响只适用于女性。因为这些标志,女性洗手的比例从61%上升到了97%,而男性的比例停留在37%而无较大变化。


看到广告就想买买买?也许你只是被机器学习套路了……_java_09


因此,我们已经开始建立的模型,其衡量的不仅仅是一个人洗手的可能性,还包括这个标志对他们洗手的影响。性别揭示了一种差异,随着我们根据其他因素将公厕使用者划分的部分越来越多,我们可能会变得更好,更好地确定哪个标志对每个人最有影响力。


现在,我们并不是真的建议通过安装传感器来对厕所里的人进行识别,并相应地调整信息——只是用厕所的例子来说明是如何在预测说服中工作的。


像这样将数据分成段和子段叫做决策树——还有其他更复杂的数学技巧用于说服建模技术。


举一个医疗保健方面的例子,研究表明,与其他年龄阶段的人相比,某种艾滋病毒治疗法对儿童的影响更好。一些治疗癌症的药物对具有特定基因的人更有效,因此美国食品和药物管理局(Food And Drug Administration,简称FDA)日益要求在开处方前进行特定的基因筛查。


看到广告就想买买买?也许你只是被机器学习套路了……_java_10

说服机器学习:提升建模


预测说服的机器学习被称为“说服建模”或“提升建模”: 从数据生成一个预测治疗影响的模型。


与传统模型所预测的未来、行为、结果(如购买或改善健康)不同,提升模型预测的是治疗对结果的影响。


对于每个人而言,标准的预测模型都会回答这个问题:“积极结果的可能性有多大?”但是提升建模回答的则是:“这种治疗出现预期结果的可能性有多大?”


毕竟,影响的最好方法是预测影响。想知道向哪些人推销的最直接的方法是知道哪些人可以被说服。以这种方式定位需要一笔营销预算或一支销售团队,并使其更加强大。


事实上, 奥巴马在2012年总统竞选中(也是一种营销活动) 使用了提升建模,通过4亿美元的电视广告预算为其提升了大约18%的说服力,同时因为明确地瞄准了目标,竞选志愿者的有效性也大大提高。这看似避免了敲开“请勿干扰”选民的门,而这实际上会适得其反,无意间为其对手罗姆尼赢得了选票。


看到广告就想买买买?也许你只是被机器学习套路了……_java_11


毕竟,关键不只是预测哪里会有影响,更确切地说,预测哪里会有积极的影响。


在适当的情况下,提升建模可以极大地促进市场营销。对于欧洲大型手机运营商Telenor来说,它将营销活动的投资回报率提高了11倍。


看到广告就想买买买?也许你只是被机器学习套路了……_java_12

提升建模工作原理


调查结果表明,到目前为止,购买数量为中等但不太多的客户(即中等类型的客户)最容易受到营销的积极影响而购买更多产品。这样做的原因可能是,许多根本没买过东西的人很难起步,而那些已经买了很多东西的人,如果你向他们推销的话,可能会受到负面影响——恼火或反感。


看到广告就想买买买?也许你只是被机器学习套路了……_java_13


但说实话,大多数公司仍然在使用标准机器学习(即建模)来预测结果而非影响。毕竟提升建模更加困难,对于训练数据来说,还需要增加一个控制集,而技术方法目前为止仍不太为人所知,也更复杂、更难以评估。


看到广告就想买买买?也许你只是被机器学习套路了……_java_14


看到广告就想买买买?也许你只是被机器学习套路了……_java_15

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货


编译组:狄思云、卢佳琦

相关链接:

https://www.kdnuggets.com/2019/02/dr-data-persuasion-paradox-computers-optimize-influence.html


如需转载,请后台留言,遵守转载规范


推荐文章阅读


EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾


长按识别二维码可添加关注

读芯君爱你


看到广告就想买买买?也许你只是被机器学习套路了……_java_16