李宏荣获2023年首尔时间检验奖
某中心高级首席科学家李宏因其2010年发表的论文《基于上下文赌博方法的个性化新闻文章推荐》获得2023年首尔时间检验奖。该论文由魏楚、John Langford和Robert E. Schapire共同撰写,提出了一种创新的个性化推荐引擎方法。
研究背景与意义
首尔时间检验奖"每年颁发给在前一届万维网会议上发表的论文作者,该论文正如其名,经受住了时间的考验"。李宏表示:"这篇论文从一个新颖的角度解决了一个重要问题,最终成为出版后多年来的基础技术之一。该论文将推荐视为强化学习问题,这在那时并不是一个流行的观点。"
技术突破
上下文赌博方法
研究团队提出了一种上下文赌博方法来驱动新闻内容的个性化推荐,"在这种方法中,学习算法基于用户和文章的上下文信息顺序选择文章服务用户,同时根据用户点击反馈调整文章选择策略,以最大化总用户点击量。"
李宏指出:"新闻内容在一天内每小时都在变化。这就是为什么我们需要一个解决方案来快速适应变化的内容,并向用户推荐最佳内容。"在这个过程中,解决方案必须平衡两个相互竞争的目标:最大化用户满意度和收集关于用户兴趣与内容"匹配度"的信息。
算法优势
上下文赌博算法是一类特殊的强化学习问题,非常适合这种场景。该论文开发了实用的上下文赌博算法,优化了用户参与度指标,如点击率、下游收入或其他业务影响。
实际应用价值
作者报告称,他们的"计算高效的上下文赌博算法"不仅带来了更高的点击率,而且解决了扩展挑战,因为它可以"使用先前记录的随机流量进行可靠的离线评估"。该评估技术本身也在其他基于网络的场景中得到了应用。
长期影响
李宏后来致力于将其方法扩展到以长期用户参与度衡量效用的场景。"实际上,决策会改变用户行为,进而改变他们与网站交互的未来方式以及未来的效用。因此,系统应该能够考虑这些长期影响,并做出决策以最大化长期效用而不是短期效用。"
获奖感言
李宏表示:"科学家经常在论文中发表创新。当发明停留在纸面上而没有到达现实世界时,感觉故事并不完整。这个奖项是对该发明产生持久影响的认可,不仅在我们研究的问题上,而且在该领域和行业的其他部分。我很感激获得这个奖项,并欣慰地看到这项已有13年历史的工作仍然有用。"
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码