召回 (Recall)
从数亿级笔记库中筛选数千篇候选笔记,追求效率与广度。
ItemCF
UserCF
双塔模型
向量检索
地理位置
社交关系
粗排 (Coarse Ranking)
使用轻量模型将数千篇候选笔记减少到数百篇,在效率与精度间寻求平衡。
三塔模型
特征交叉
向量缓存
精排 (Fine Ranking)
利用复杂模型精准预估用户偏好,对数百篇候选进行精确打分,筛选出最终几十篇。
多目标学习
MMoE
DCN
Redis特征存储
重排 (Reranking)
考虑内容多样性和业务规则,调整最终展示顺序,提升用户体验。
MMR多样性
DPP算法
业务规则
新鲜度
曝光过滤 (Exposure Filtering)
避免向用户重复展示近期已看过的笔记,提升发现感与体验。
Bloom Filter
Flink实时处理
高效哈希算法