当前位置: 首页 > news >正文

对抗训练提升产品搜索技术解析

对抗训练改进产品发现

深度学习在自然语言处理任务中非常成功,但在信息检索任务(如产品发现)中效果较差,主要原因是缺乏负训练样本。虽然容易训练模型理解“Fire HD 10”查询匹配同名产品,但教它识别“Fire HD 10保护套”和“Fire HD 10充电器”不匹配同一产品则更加困难,需要大量负样本。然而,为大型产品目录中的每个项目识别和标注负样本是一项巨大工程。

在计算语言学协会年会上,我们提出了一种通过自动生成负训练样本来训练基于深度学习的产品发现系统的新方法。实验表明,该方法比现有最佳方法性能提升16%,比商业产品发现系统常用方法提升62%。

技术方法

我们的技术使用对抗学习,近年来在视觉图像生成系统中证明非常成功。在典型对抗学习系统中,合成数据的生成器和区分真实数据与合成数据的判别器一起训练。但在我们的案例中,系统不是试图识别合成样本,而是准确分类合成样本。这一差异使我们能够设计一种新的神经架构,使对抗学习更简单高效。

匹配与不匹配

系统输入是客户查询和产品名称,输出是判断产品是否与查询匹配的良好结果。

对于这样的系统,正训练样本相对容易自动创建。输入“Fire HD 10”查询的许多购物者可能点击保护套和充电器链接,但更多可能点击设备本身链接。通过聚合多个客户查询的统计数据,自动化系统可以可靠地产生良好匹配的查询和产品示例。

负样本更难获取。客户有时会故意点击不匹配的项目(如查询“Fire HD 10”后点击保护套和充电器),而缺乏点击也不能保证查询和项目不匹配。

现有自然语言处理系统可以确定“望远镜”与“跑鞋”查询不匹配,但产品发现系统从如此明显不匹配的示例中学到的东西有限。我们的目标是开发一个生成器,自动产生更具挑战性的负样本,如产品“徒步鞋”与查询“跑鞋”不匹配。

对抗学习应用

在训练期间,我们向网络提供自动标记的正样本。基于随机选择,它将其中一些转换为负样本。生成器覆盖示例的一半(查询),并将其标签从“匹配”改为“不匹配”。

在对抗学习的典型应用中,生成器和判别器同时在竞争目标上训练,这使机器学习过程复杂化。但在我们的案例中,我们在训练期间简单地在目标之间切换。

此外,切换机制是网络内执行的一组简单算术操作,这意味着我们可以使用标准机器学习算法(反向传播)训练网络。

我们网络的另一个关键是分类层之前的注意力层。注意力层学会将分类器的注意力集中在查询和产品名称中对评估匹配特别重要的元素上。

例如,如果查询是“Fire HD 10保护套”,匹配产品是Fire HD 10保护套,注意力层将给词“保护套”比“Fire”更大的权重,因为“保护套”能更好地区分查询与其他与Fire平板相关的查询。

实验结果

在实验中,我们将模型与其他四个模型比较,包括产品发现领域常用的梯度提升决策树,以及四年前提出的MatchPyramid模型(已被证明在匹配任务上显著优于其他模型)。

我们使用两个不同指标衡量性能,这两个指标都考虑了假阳性和假阴性:F1分数和精确召回曲线下面积(APR)。MatchPyramid是基线中表现最好的,但我们的模型在F1分数上超过它16%,在APR上超过8%。与梯度提升决策树相比,我们的模型在F1分数上改进62%,在APR上改进57%。

我们的注意力层为产品描述中每个术语(列标签)分配的查询术语(行标签)权重示意图。根据右侧图例,较浅颜色表示较高权重。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.sczhlp.com/news/187184/

相关文章:

  • 大同格泰网站建设lol做框网站
  • 古云网站建设wordpress侧边栏折叠
  • 免费建设物流网站网页的设计与制作
  • 高端网站建设jm3q工业设备外观设计公司
  • 网站开发的pc或移动端精品手机网站案例
  • 中信银行门户网站系统WordPress代码改silder
  • 网站做图尺寸大小锡林浩特网站建设开发
  • 字画网站建设佛山企业一般在哪网站发布消息
  • 重庆网站制作天机械加工网配件销售网
  • 网站的空间是什么阿里云心选建站
  • 优化网站工具找公司做网站要注意什么问题
  • 珠海建设网站公司哪家好汽车网站建设论坛
  • 杭州市建设工程造价管理协会网站ui设计师掌握技能
  • 做亚马逊联盟一定要有网站吗医院网站建设的资料
  • 社区网站建设资金申请网络推广方法技巧
  • 网站排名前十初级软件工程师报考条件
  • 哈尔滨专业做网站seo排名工具有哪些
  • 什么是网站解决方案什么网站做的号
  • 卖菜网站应该怎么做天津专业网站制作流程优势
  • 网站备案自己备案和代理备案娄底住房和城乡建设部网站
  • 网站网络结构设计服务商标是什么意思
  • 网站在线压缩品牌建设不足怎么表达
  • 红色简约的手机社区类网站html5响应式模板下载如何利用php开源系统建立php网站
  • 网站文件夹没有权限网站重新设计需要多久
  • 网站备案 失败外贸人才网招聘网
  • 新手php网站建设安徽建设工程信息网技术服务电话
  • 夷陵区住房和城乡建设局网站响应式所长网址导航网页模板下载
  • 厦门做网站多少钱深圳网站开发找哪里
  • 免费1级做爰片在线观看 历史网站wordpress建站教程
  • 永久免费网站建设系统安阳信息网官网