博应用想哥收到消息,在IJCAI会议上提出深度学习推荐模型DeepFM,将助力与应用市场,让用户体验到更精准、个性化的应用商店。其特征工程(Feature Engineering)是影响应用商店推荐系统的重要因素。
相比于其他机器学习系统,推荐系统更依赖于特征工程。传统的大规模线性模型(如逻辑回归),通常依赖于人工方式设计特征。同时由于线性模型无法对特征间的非线性关系进行自动建模,通常依赖于特征组合(Feature combination)来实现二阶或高阶特征的构造。例如,在博应用等应用商店场景下:
1、一些流行的应用比较容易被用户下载,说明应用的标识会影响用户下载 (一阶特征)。
2、吃饭时间一些外卖类的应用比较容易被用户下载,说明应用的类型和时间综合起来会影响用户下载 (二阶特征)。
3、年轻男性喜欢下载射击类和角色扮演类的游戏,说明应用类型、用户年龄和用户性别综合起来会影响用户下载 (三阶特征)。
人工方式的特征工程,通常有两个问题:一个是特征爆炸。另一个问题是大量重要的特征组合都隐藏在数据中,无法被专家识别和设计。针对上述两个问题,广度模型和深度模型提供了不同的解决思路。
其中广度模型包括FM/FFM等大规模低秩(Low-Rank)模型,FM/FFM通过对特征的低秩展开,为每个特征构建隐式向量,并通过隐式向量的点乘结果来建模两个特征的组合关系实现对二阶特征组合的自动学习。
FM/FFM相比于Poly-2模型,优势为以下两点。第一,FM/FFM模型所需要的参数个数远少于Poly-2模型。第二,相比于Poly-2模型,FM/FFM模型能更有效地学习参数。总体来说,FM/FFM是一种非常有效地对二阶特征组合进行自动学习的模型。
DeepFM算法架构期实验结果表明:相比较业界最新的推荐算法,DeepFM模型在数据集上,比其它的来得更快些,如果DeepFM成功实现,会是应用市场的一大助力。