文章idea
- 文章认为
high-order
交叉特征对CTR
预估非常有效。但是LR
需要大量的特征工程工作;CNN
更加倾向于相邻特征的交互;RNN
更适合处理序列化数据;FNN
与PNN
只捕捉了low-order
交叉特征;Wide & Deep
也同样需要大量特征工程。 - 为了省去特征工程的麻烦,拟合
low-order
与high-order
的特征,因此作者提出了DeepFM
.
文章主旨
FM Component
这部分是标准的fm
,具体细节不做赘述。公式如下:
DNN Component
这部分就是典型的DNN
模型,具体细节不做赘述。
embedding layer
- 每个
field
的长度也许不同,但是经过embedding layer
映射得到的矩阵尺寸是相同的k
,由上图可知,使用了sum
操作。
模型试验
- 数据集:
Company∗
,Criteo
具体实现
整体结构
- 后面的
DNN
部分就是常规的MLP
,所以不需要过多赘述。 - 图中红色方框标注出的部分即是
FM
。该部分细节不需要过多赘述,详见Factorization Machines 一文。