背景

在推荐、搜索、广告等领域,CTR(click-through rate)预估是一项非常核心的技术,这里引用阿里妈妈资深算法专家朱小强大佬的一句话:“它(CTR预估)是镶嵌在互联网技术上的明珠”。

本篇文章主要是对CTR预估中的常见模型进行梳理与总结,并分成模块进行概述。每个模型都会从「模型结构」、「优势」、「不足」三个方面进行探讨,在最后对所有模型之间的关系进行比较与总结。本篇文章讨论的模型如下图所示(原创图),这个图中展示了本篇文章所要讲述的算法以及之间的关系,在文章的最后总结会对这张图进行详细地说明。

ctr预估 python CTR预估的流程_Network

ctr预估 python CTR预估的流程_Network_02

目录

本篇文章将会按照整个CTR预估模型的演进过程进行组织,共分为7个大部分:

  • 分布式线性模型
  • Logistic Regression
  • 自动化特征工程
  • GBDT+LR
  • FM模型以及变体
  • FM(Factorization Machines)
  • FFM(Field-aware Factorization Machines)
  • AFM(Attentional Factorization Machines)
  • Embedding+MLP结构下的浅层改造
  • FNN(Factorization Machine supported Neural Network)
  • PNN(Product-based Neural Network)
  • NFM(Neural Factorization Machines)
  • ONN(Operation-aware Neural Networks)
  • 双路并行的模型组合
  • wide&deep(Wide and Deep)
  • deepFM(Deep Factorization Machines)
  • 复杂的显式特征交叉网络
  • DCN(Deep and Cross Network)
  • xDeepFM(Compressed Interaction Network)
  • AutoInt(Automatic Feature Interaction Learning)
  • CTR预估模型总结与比较
  • CTR预估模型关系图谱
  • CTR预估模型特性对比