深度学习推荐系统笔记之前沿实践

一杯敬朝阳一杯敬月光

312人浏览 · 2021-01-16 18:54:35

一杯敬朝阳一杯敬月光 · 2021-01-16 18:54:35 发布

1.GBDT+LR

14年Facebook发表了广告推荐系统论文Practical Lessons from Predicting Clicks on Ads at Facebook ，提出了经典的GBDT+LR模型。

系统输入：用户（User）、广告（Ad）、上下文（Context）

GBDT构建特征工程和LR预测CTR两步采用相同的优化目标独立训练，GBDT和LR采用不同的更新频率，GBDT部分几天更新一次，LR部分准实时更新。实时数据流架构（online data joiner）服务于模型的准实时训练和特征的准实时更新。

准实时更新实施注意点：

waiting window（数据等待窗口）的设定，指在曝光（impression）发生后，要等待多久才能判定一个曝光行为是否产生了对应的点击
分布式架构与全局统一的action id（行为id）
数据流保护机制，未做保护机制时，一旦data joiner由于某些异常失效，所有样本均会变成负样本，故Facebook建立了异常检测机制，一旦发现实时样本流的数据发生变化，将立即切断在线学习过程。

工程

将采样：均匀采样，负采样
- 负采样会带来CTR预估值的漂移，设真实CTR是0.1%，进行0.01的负采样之后，CTR将会攀升到10%左右。需要对CTR做校准。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

使用概率图路径规划的机器人路径规划研究Octave（Matlab代码实现）

针对复杂未知环境下传统机器人路径规划算法适应性差、避障稳定性弱、全局搜索效率低的问题，本文开展基于概率图的机器人路径规划方法研究。概率图路径规划依托概率路线图建模思想，通过环境随机采样、节点连通性构建、最优路径检索的核心逻辑，摆脱了传统算法对环境精准建模的依赖，具备强环境适配性与高运算效率。本文系统阐述概率图路径规划的核心理论、运行机制与技术优势，基于Octave仿真平台搭建多场景机器人运动规划仿