网站首页生成静态页面,介绍西安网页设计,山西省经济建设投资公司网站,网站网页的收录数量note
Anthropic的工程经验#xff1a; 大道至简#xff0c;尽量维护系统的简洁#xff1b;尽量让过程更加透明#xff08;因为你依赖的是LLM的决策#xff0c;如果只看输出不看过程#xff0c;很容易陷入难以debug的情况#xff09;#xff1b;对LLM需要调用的工具 大道至简尽量维护系统的简洁尽量让过程更加透明因为你依赖的是LLM的决策如果只看输出不看过程很容易陷入难以debug的情况对LLM需要调用的工具尽可能地好好进行工具说明和测试。 文章目录 note一、构建块、工作流和Agent二、一些典型 workflowsBuilding block: The augmented LLMWorkflow: Prompt chainingWorkflow: RoutingWorkflow: ParallelizationWorkflow: Orchestrator-workersWorkflow: Evaluator-optimizer 三、Agent系统Reference 一、构建块、工作流和Agent
workflows是人来定义明确的规则和流程然后中间步骤由LLM来执行但是 agents 是为了更加灵活地处理某些任务且决策是由模型决定的而不是预定义的规则。
当需要更多复杂性时工作流可以为明确定义的任务提供可预测性和一致性而当需要大规模灵活性和模型驱动的决策时Agent是更好的选择。
二、一些典型 workflows
Building block: The augmented LLM
无论是 workflows 还是 agents基础组件都是增强版的LLM
Workflow: Prompt chaining
Prompt-Chaining: 当任务可以被清晰地划分成多个steps。一般用于用更高的延迟来换取更高的准确率。
Workflow: Routing
Routing当需要考虑针对不同场景要采用不同模型时可使用这种导航的workflow。
Workflow: Parallelization
Parallelization并行处理当需要同时得到多个结果最后集成在一起时使用。
Workflow: Orchestrator-workers
Orchestrator-workers这个跟上面的区别在于使用一个模型来判断任务要怎么划分你事先可能没有一个明确的子任务划分。 Workflow: Evaluator-optimizer
Evaluator-optimizer迭代优化工作流。让LLM的结果不断自我优化。使用这种工作流一般需要满足两点1.LLM的输出确实可能有很大的提升空间2.LLM有能力对输出提供有价值的评价
三、Agent系统
真正的 agents 系统是为了解决
复杂的开放性问题难以对问题进行明确的分解、分步难以规划 例如一个经典场景编程助手不是单单代码补全或者简单的代码问答而是能直接操作一个工程的内部流程可能是这样的 可以参考Anthropic的项目https://www.anthropic.com/research/swe-bench-sonnet
目前 Agents 落地最成功的两个场景就是
客服系统 常规的QA功能对接数据库查询功能修改用户数据自动化票据生成 编程IDE 著名的Cursor编程IDE例如 Anthropic自己对SWE-bench做的工具https://www.anthropic.com/research/swe-bench-sonnet
Reference
[1] 2024 AI Agents2025将是Agentic系统之年 [2] https://github.com/anthropics/anthropic-cookbook/tree/main/patterns/agentshttps://www.anthropic.com/research/building-effective-agents [3] https://www.anthropic.com/research/building-effective-agents