推荐系统主流召回方法综述( 二 )


幻灯片22
7.Node2Vec
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
????deepwalk和node2vec其实就像item2vec一样都是基于“连接即可推荐”的先验的,这里面其实没有判断“推荐是否正确”的强标签信息,在item2vec中是通过两个item在多个session中共现次数的频率来体现item的信息的,而图随机游走embedding中是通过把这种共现次数编辑成边的权重,由边权控制游走概率来反映不同item的信息(这点很重要 , 设想一个场景中生成的图是一个各向同性的图,那么这个图是学不出来什么东西的).图中包含的信息一个是图结构的复杂度(连接是否稠密),一个是图的边权重(item之间共现频率分布是否有大的差异),因此在实际使用中,我们往往需要对自己的场景做上面两个维度的评估和调优.
8.EGES
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
????EGES主要两个创新点一个side information的融入,一个是attention机制,原始的graph embedding正如我前面说到的主要利用节点之间的共现信息,只是利用节点自身的id特征,那么像文中这样在得到id的图embedding之后如何与其它side information的embedding结合是一个很自然的想法.
9.LINE
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
????LINE方法其实是对前面所说的deepwalk这种emdedding使用“连接而推荐”的一种改进了,文中把这种直接连接的关系定义为一阶相似,引入了间接相连的二阶相似,这样的好处是提升了拓展性,使得原来不直接相连的节点也有了更直接的二阶相似度,类似的我们或许可以定义更高阶的相似性,但这样的问题就是推荐会变得发散,在如相关性推荐的场景中就会增加badcase的比例.
10.SDNE
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
11.GraphSAGE
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
????GraphSAGE非常惊艳的是转换了graph embedding问题的研究对象,以前我们是对节点建模,但是对于节点建模,而节点信息是依赖于整个图拓扑结构的,图结构的改动就会影响我们节点表征的结果,而本文则转换研究对象为对局部拓扑结构,通过学习局部拓扑结构与节点表征之间的映射函数间接的得到节点的表征,而实际场景中局部拓扑结构会相对稳定.
12.MIND
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
13.SDM
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
14.DeepFM
推荐系统主流召回方法综述文章插图
推荐系统主流召回方法综述文章插图
????其实用FM或者说DeepFM做排序模型,大家是较为熟悉的,那么如何用FM或者DeepFM做召回有什么特别的地方,一般而言召回过程中FM可以不考虑user特征集合内部的特征之间的交叉,以及item特征集合内部的特征交叉,那么这样对于存入的user embedding 可以直接取user特征集合各个特征embedding的特征加和即可,item embedding直接取item特征集合各个特征embedding的特征加和即可,此时user embedding和item embedding的内积就已经体现了user特征和item特征之间的特征交叉,模型较排序使用的FM更为简化.