当前位置: 首页 > news >正文

网站开发搜索功能怎样编程制作自己的app

网站开发搜索功能,怎样编程制作自己的app,餐饮网站建设可行性分析,wordpress设定主页定制是关键#xff01; 生成式人工智能对企业最有影响力的应用之一是创建自然语言界面#xff0c;这些界面经过定制#xff0c;可以使用特定领域和用例数据来提供更好、更准确的响应。这意味着回答有关特定领域的问题#xff0c;例如银行、法律和医疗领域。 我们经常谈…定制是关键  生成式人工智能对企业最有影响力的应用之一是创建自然语言界面这些界面经过定制可以使用特定领域和用例数据来提供更好、更准确的响应。这意味着回答有关特定领域的问题例如银行、法律和医疗领域。   我们经常谈论实现这一目标的两种方法  检索增强生成 (RAG)将这些文档存储在向量数据库中并在查询时根据它们与问题的语义相似性检索文档然后将它们用作 LLM 的上下文。监督微调 (SFT)根据代表特定领域知识的一组提示和响应来训练现有的基础模型。    虽然大多数尝试使用 RAG 的组织都希望利用其内部知识库来扩展 LLM 的知识但许多组织如果不进行重大优化就无法实现预期结果。同样整理足够大且高质量的数据集以进行微调也是一项挑战。这两种方法都有局限性微调将模型限制在其训练数据中使其容易受到近似和幻觉的影响而 RAG 为模型奠定了基础但仅根据文档与查询的语义接近度来检索文档——这可能不相关并且可能导致推理不充分的答案。  参考链接 微软 Azure OpenAI 试用申请 RAFT 来救援  我们可以结合使用 RAG或微调而不是只选择其中一种将 RAG 视为一场开卷考试模型查找相关文档来生成答案。微调就像一场闭卷考试模型依赖于预先训练的知识。就像在考试中一样最好的结果来自于学习和随手记笔记。  检索感知微调 (RAFT) 是一种强大的技术可用于为特定领域的开放式设置例如域内 RAG准备微调数据。它改变了语言模型的格局结合了 RAG 和微调的最佳部分。RAFT 通过提高模型理解和使用特定领域知识的能力帮助模型针对特定领域进行量身定制。它是 RAG 和特定领域的 SFT 之间的最佳结合点。  它是如何工作的  RAFT 分为三个步骤   准备数据集来教模型如何回答有关您的领域的问题。使用准备好的数据集对模型进行微调  评估新的、定制的、领域适应模型的质量  RAFT 的关键在于训练数据生成其中每个数据点都包含一个问题 (Q)、一组文档 (Dk) 和一个思路链式答案 (A)。文档分为包含答案的 Oracle 文档 (Do) 和不包含答案的干扰文档 (Di)。微调教会模型区分这些文档从而生成一个自定义模型该模型的表现优于仅使用 RAG 或微调的原始模型。我们使用 GPT-4o 生成训练数据并微调 GPT-4o mini从而根据您的用例量身定制经济高效、速度更快的模型。这种称为蒸馏的技术使用 GPT-4o 作为教师模型使用 4o-mini 作为学生模型。            在本博客的下一部分中我们将开始实践。如果您想自己跟进或查看参考代码请查看https://aka.ms/aoai-raft-workshop。我们将为银行用例创建一个领域适配模型该模型能够回答有关银行在线工具和账户的问题。   笔记本 1- 生成 RAFT 训练数据  首先收集特定领域的文档在我们的示例中这些是银行文档的 PDF。为了生成我们的训练数据我们将 PDFS 转换为 markdown 文本格式。该文档为 PDF 格式包含许多表格和图表我们将使用 GPT-4o 将页面内容转换为 markdown。我们使用 Azure OpenAI GPT 4o 将所有这些信息提取到 Markdown 文件中以用于下游处理。然后我们使用 GPT-4o我们的教师模型生成合成的“问题-文档-答案”三元组包括“黄金文档”高度相关和“干扰项”误导的示例。这将确保模型学会区分相关信息和不相关信息。RAFT利用思维链 (CoT) 过程通过集成 CoT RAFT 过程提高了模型提取信息和执行逻辑推理的能力。这种方法有助于防止过度拟合并增强训练鲁棒性使其对于需要详细和结构化思维的任务特别有效  然后我们将这些数据格式化以进行微调将其分为训练集、验证集和测试集。验证集用于训练测试集用于最后测量性能。  笔记本2-RAFT微调   现在是时候教我们的学生了准备好训练和验证数据后下一步是将这些数据上传到 Azure OpenAI 并创建微调作业。这非常简单在 AI Studio 中选择您的模型、上传您的训练和验证数据以及设置您的训练参数只需点击几下即可。我们将选择 4o-mini 作为我们的学生模型进行训练。 在实验室中我们将向您展示如何使用 SDK 上传和触发微调作业。UI 使其成为一种简单的实验方式而 SDK 方法是生产化和启用 llmops 策略以在生产中部署的首选方式。 一旦微调作业开始运行我们就可以监控其进度并在完成后在 Azure OpenAI Studio 中分析微调后的模型。最后我们使用微调后的模型创建一个新的部署准备用于我们的专业领域任务。  笔记本 3 - 我们的 RAFT 模型真的比基础模型更好吗让我们检查一下  您可以首先查看 AI Studio 返回的内置指标显示损失和准确度。我们希望看到准确度提高而损失下降  但是我们可以做更多的事情来衡量模型的质量。还记得我们一开始的测试数据集吗这就是我们准备它的原因  虽然有很多评估选项包括 AI Studio 评估但在我们的示例中我们使用开源库 RAGAS它使用答案相关性、忠实度、答案相似性和答案正确性等指标来评估 RAG 管道。这些指标要么依靠 LLM 作为评判者要么依靠嵌入模型来评估生成答案的质量和准确性。  gpt4o-mini 与 gpt4o-mini-raft 对比 我们可以通过调整训练参数和/或生成额外的训练数据来进一步改善模型指标。
http://www.sczhlp.com/news/171516/

相关文章:

  • 电子设计全国网站建设vs2008 新建网站
  • 抚顺市营商环境建设局网站网站后台权限管理怎么做的
  • 中文 网站模板WordPress文章不让搜索
  • wap网站发布wordpress导入插件
  • 中国江西网官方网站seo是哪个英文的简写
  • 网站建设丨下拉找金手指上词快郑州做网站 熊掌号
  • 关于门户网站建设古色古香网站模板
  • 北京网站建设华网天下郑州网站建设公司怎么选
  • 网站买了服务器后该怎么做婚纱网站模板下载
  • 建设部资质查询网站青岛网站建设排名
  • 怎么查看网站啥系统做的手机优化专家下载
  • 十堰秦楚网 十堰新闻门户网站资阳公司网站建设
  • 阿里云服务器可以做几个网站alexa排名官网
  • 网站怎么做自己站长wordpress批量删除字段
  • 小说网站建设多少钱慢慢网站建设
  • 网站的开发费用吗网址导航是什么浏览器
  • 免费网站软件正能量制作app用什么软件好
  • 网站是如何盈利网页传奇手游游戏大全
  • 漯河网站建设 付永磊如何建设网站安全
  • 个人做外贸的网站有哪些网站改版怎样做301
  • 南通做网站的公司婚介网站方案
  • 微信网站开发平台jsp做网站教程
  • 做电子商城网站建设银行e房通网站
  • 介绍几个能进去的a站网络运营是什么意思
  • 佛山网站建设公司有哪美食网站开发的意义
  • 网站定位 怎么做免费空间说说赞领取网站
  • html官方网站项目加快网站访问速度
  • php网站开发 vip常用的网页编辑软件
  • 综合门户网站有哪些公司注册网站怎么做
  • 东莞网站推广青岛网站建设费用