当前位置: 首页 > news >正文

生成式召回-TIGER范式 - 实践

生成式召回-TIGER范式 - 实践

TIGER(Transformer Index for GEnerative Recommenders)是生成式召回的经典力作,其核心思想就是语义ID+Seq2Seq,这一范式启发了后续大量生成式推荐工作。

背景与痛点

可以舍弃的。就是item id是商品在候选库中的独特标识,其具有高度稀疏性,且没有任何物理含义,对于模型训练、新品冷启、可解释性都极不友好。假设一个item的side info足够多,可以完整刻画该item的属性,那么item id完全

TIGER利用多个语义id来表征该item,极大地减少了id embedding词表空间,对工业界生产环境友好;通过模型结构共享相似item的语义信息,提升模型泛化性,利好新品冷启。

✅ TIGER 解决的痛点和优势

痛点TIGER 的解决方法优势
embedding 太大 / 存储高Semantic ID token 数量极小,token vocabulary 可控制内存友好、减小表规模
冷启动 item embedding 缺失Semantic ID 来源于 item 内容特征可推广至新 item,无需训练 embedding
类似 item 无共享相似内容生成相近的 Semantic ID用户语义共享,加强泛化
模型检索复杂Transformer decoder 直接生成端到端简洁流程

核心创新点

Semantic ID表示

语义id

生成式检索(Generative Retrieval)

seq2seq

传统embedding + ANN。Transformer的decoder直接输出item的Semantic ID作为推荐结果。就是通过自回归解码生成目标item id,而不

实验结果

exp
别看实验结果相对值提升很大,很唬人,其实绝对值提升很小。但TIGER范式建模确是一个极大的创新,为生成式推荐打开了思路。

总结

  • TIGER是第一篇将Generative Retrieval 自回归生成方式应用于推荐系统的工作;
  • 它通过Semantic ID 和 Seq2Seq Transformer,突破embedding + ANN的传统限制;
  • 冷启动、多样性、效率和泛化能力上展现强优势;
  • 适用于大规模推荐场景,尤其是content-rich、item海量、频繁上线新品的平台。

参考

http://www.sczhlp.com/news/8305/

相关文章:

  • 支付宝小程序IDE突然极不稳定
  • 8.8总结
  • Ubuntu24.04安装mlpack库
  • 从递归开始入手区间DP
  • 2025.8做题笔记
  • 郑州集训游记
  • 牛客 周赛102 20250806
  • 郑州集训游记 8.6
  • 推柿子
  • iOS上传App Store时invalid swift support错误解决总结
  • 代码随想录算法训练营第三天(链表篇)|Leetcode203移除链表元素,Leetcode707设计链表,Leetcode206反转链表
  • FTT 快速傅里叶变换
  • 莫队分块
  • 从零开始的web前端学习-Vue
  • 详细介绍:Spring Security6.3.x使用指南
  • 2025.08.08 杭电7
  • QOJ11111 + and with a sugar / + , 与糖 题解 [ 蓝 ] [ 线性 DP ] [ 结论题 ] [ 值域分治 ]
  • PCA多变量离群点检测:Hotellings T2与SPE方法原理及应用指南
  • 【题解】P7967 [COCI 20212022 #2] Magneti
  • Java 推送视频到html页面展示 - br
  • centos7防火墙IP白名单维护
  • 题解:AND Sorting
  • Fedora Linux Mount ntfs read-only because of Windows hibernate
  • 基于卷积神经网络的验证码自动识别系统设计与实现
  • OSSEC规则转换工具 - 简化XML规则编写流程
  • 基于 Python 和 PaddleOCR 的验证码识别实战
  • 题解:CF878C Tournament
  • 基于生成式AI的设备维护推荐系统构建指南
  • 基于 PyTorch 的深度学习验证码识别实践
  • 题解:[NOIP 1998 提高组] 拼数