推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_人工智能

作者:一元

MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction(CIKM20)

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_炼丹笔记_02

点击率预测是在线广告系统中的一项重要任务。现有的工作主要针对单域CTR预测问题和模型方面,如特征交互、用户行为历史和上下文信息。然而,广告通常以自然内容显示,这为cross domain的CTR预测提供了机会。本文解决了这个问题,并利用辅助数据,从源领域,以提高CTR预测性能的目标领域。

我们的研究是基于UC Toutiao(一个与UC浏览器应用程序集成的新闻订阅服务,每天为数亿用户提供服务),其中源域是新闻,目标域是广告。为了有效地利用新闻数据预测广告的点击率,我们提出了混合兴趣网络(MiNet),它联合建模了三个领域用户兴趣类型:

  • 跨域的长期兴趣;
  • 源域的短期兴趣;
  • 目标域的短期兴趣。

MiNet包含两个层次的attention,其中item-level的attention可以自适应地从点击的新闻/广告中提取有用信息,interest-level可以自适应地融合不同的兴趣表示。离线实验表明,MiNet的预测性能优于几种最新的CTR预测方法。我们在UC头条部署了MiNet,A/B测试结果表明在线CTR也得到了实质性的改善。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_03

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_04

为了有效的利用cross-domain的数据,本文考虑了三类用户兴趣:

  • Long-term interst across domain: 每个用户都有自己的个人资料功能,如用户ID、年龄组、性别和城市。这些配置文件特性反映了用户的长期内在兴趣。基于跨域数据(即用户与之交互的所有新闻和广告),我们能够了解到语义更丰富、统计上更可靠的用户特征嵌入。
  • Short-term interst from the source domain:对于要预测其CTR的每个目标广告,在源域中存在相应的短期用户行为(例如,用户刚刚观看的新闻)。虽然一条新闻的内容可能与目标广告的内容完全不同,但它们之间可能存在一定的相关性。例如,一个用户在观看了一些娱乐星闻之后有很大的概率点击一个游戏广告,基于这样的关系,我们就可以从源域中的有用的信息迁移到目标域中。
  • Short-term interest in the target domain:对于每个目标广告,目标域中也存在相应的短期用户行为。用户最近点击的广告可能对用户在短期内点击的广告有很大的影响。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_05
  1. 并不是所有点击的新闻都表示目标广告的点击率;
  2. 不是所有点击的广告都是关于目标广告点击率的信息;
  3. 模型必须能够将信息从新闻传递到广告;
  4. 这三种用户兴趣的相对重要性在不同的目标广告中可能有所不同;例如,如果目标广告与最近点击的广告相似,那么目标领域的短期利益应该更重要;如果目标广告与最近点击的新闻和广告都无关,那么长期利益应该更重要。
  5. 目标广告和用户感兴趣的三种类型的广告的表示可能具有不同的维度(由于特征的不同数量)。尺寸差异可能会自然地增强或减弱某些表示的影响,这是不希望看到的。

为了应对这些挑战,我们提出了混合兴趣网络(MiNet),其结构下所示。在MiNet中,

  • 用户的长期兴趣通过用户特征嵌入Pu的串联建模,Pu是基于跨领域数据的联合学习,实现了知识的传递;
  • 来自源领域的短期兴趣通过向量as来建模,as聚合了最近点击的新闻信息;
  • 目标域中的短期兴趣是通过向量at来建模的,它聚集了最近点击的广告的信息。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_人工智能_06

MiNet包含了了两种不同的attention(item-level的和interest-level的),

  • item-level的attention同时用于source-domain以及target-domain,我们希望通过此可以直接从source domain和target domain中点击的新闻和广告中抽取有用的信息;(解决上述的挑战1和2)
  • transfer的矩阵被引入用来从新闻到广告的迁移;(解决上述的挑战3)
  • long-term的用户兴趣是基于cross-domain的数据学习的,也可以进行知识迁移(解决上述的挑战3);
  • 引入interest-level的attention动态调整三类用户兴趣的重要性, 关于不同的目标广告(解决上述的挑战4);
  • 线下和线上的实验结果表明了MiNet的有效性;

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_python_07

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_机器学习_08

在线广告点击率预测的任务是建立一个预测模型来估计用户点击特定广告的概率,每个实例可以用用户信息(“用户ID”、“城市”、“年龄”等)和广告信息(“创意ID”、“活动ID”、“标题”等)以及个字段来描述。字段的实例化是一个特性。例如,“用户ID”字段可以包含诸如“2135147”和“3467291”之类的特征。表1显示了一些示例。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_09
  • 我们定义cross-domain CTR预测任务为从source domain中利用数据来提升目标域的CTR预估。

在新闻提要广告中(如图1所示的UC Toutiao),源域是自然新闻提要,目标域是广告。在这个场景中,源域和目标域共享同一组用户,但是没有重叠项。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_10

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_人工智能_06

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_机器学习_12

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_python_13

给定一个用户,对于在目标域中预测其CTR的每个目标广告,用户通常在源域中查看新闻片段。虽然一条新闻的内容可能与目标广告的内容完全不同,但它们之间可能存在一定的相关性。例如,用户在观看一些娱乐新闻后很有可能点击游戏广告。基于这些关系,我们可以将有用的知识从源领域转移到目标领域。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_python_14

item-level的Attention

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_python_15

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_16

给定一个用户,对于每个要预测其CTR的目标广告,该用户在目标域中也有最近的行为。用户最近点击的广告可能对用户在短期内点击的广告有很大的影响。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_17

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_人工智能_18

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_19

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_机器学习_20

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_机器学习_21

1. Effectiveness

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_java_22
  • MiNet不仅考虑了用户的长期兴趣,还考虑了用户对这两个领域的短期兴趣。通过适当地组合这些不同的兴趣信号,MiNet算法的性能明显优于其他方法.

2. Ablation Study: Level of Attention

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_python_23
  • 无论是item-level attention还是interest-level attention都能提高AUC,两种注意水平的使用都能提高AUC。此外,“兴趣-Attention(sigmoid)”的表现比“兴趣-Attention(exp)”差得多。这是因为不恰当的激活函数不能有效地解决维度偏差问题。这些结果证明了所提出的层次注意机制的有效性。

3. Ablation Study: Effect of Modeling Different Types of User Interest

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_python_24
  • 当在MiNet中综合考虑所有这些因素时,我们得到了最高的AUC,表明不同类型的兴趣可以互补,联合建模可以得到最佳和更健壮的性能。

4. Online Deployment

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_人工智能_25
  • 在线A/B测试表明,与DSTN相比,MiNet使在线CTR提高了4.12%。

 

推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估_机器学习_26

本文研究了在线广告的跨域CTR预测问题。我们提出了一种新的方法,称为混合兴趣网络(MiNet),它模拟了三种类型的用户兴趣:

  • 跨域的长期兴趣;
  • 源域的短期兴趣;
  • 目标域的短期兴趣。

MiNet包含两个level的注意,其中item-level attention可以动态地从最近点击的新闻/广告中提取有用信息,interest-level attention可以自适应地调整不同用户兴趣信号的重要性。离线实验验证了三种用户兴趣模型的有效性和分层注意的使用。在线A/B测试结果也验证了该模型在实际网络广告CTR预测任务中的有效性。