当前位置: 首页 > news >正文

seo网站建站网站备案审核制度

seo网站建站,网站备案审核制度,做经营行网站需要什么手续,软件外包平台多年口碑前言 无论在什么技术栈中,缓存都是比较重要的一部分。在大模型技术栈中,缓存存在于技术栈中的不同层次。本文将主要聚焦于技术栈中应用层和底层基座之间中间件层的缓存(个人定位),以开源项目GPTCache(LLM的语义缓存)为例,深入讲解这部分缓存的结构和关键实现。 完整技术…

前言

        无论在什么技术栈中,缓存都是比较重要的一部分。在大模型技术栈中,缓存存在于技术栈中的不同层次。本文将主要聚焦于技术栈中应用层和底层基座之间中间件层的缓存(个人定位),以开源项目GPTCache(LLM的语义缓存)为例,深入讲解这部分缓存的结构和关键实现。

        完整技术栈详情参考之前文章《大模型应用技术系列(一):大模型应用整体技术栈浅析》

使用场景

        当用户流量比较大的C端应用试图接入大模型能力时,如果每次请求都访问LLM,通过LLM生成结果再返回给服务,那么对于LLM服务而言压力会比较大,整体服务的吞吐量和延迟通常都会有比较大的影响。如果这些请求之间有一些相似性(比如A用户提问:今天天气怎么样?B用户也提问:今儿天气如何?),那么这个时候就可以考虑在应用服务和LLM基座之间引入语义缓存来尝试提升服务性能。

常见用法

        先来介绍一些语义缓存GPTCache的一些常见用法,以下示例取自官网。

精确匹配

        精确匹配意味着对于见过的重复问题可以不需要再去请求背后的LLM,而是命中cache之后直接从cache中去寻找。这种做法下,代码不需要有比较大的变动,只需要添加以下4行即可:

import timedef response_text(openai_resp):return openai_resp['choices'][0]['message']['content']print("Cache loading.....")#------------------------------
from gptcache import cache
from gptcache.adapter import openai
cache.init()
cache.set_openai_key()
#------------------------------start_time = time.time()
response = openai.ChatCompletion.create(model='gpt-3.5-turbo',messages=[{'role': 'user','content': question}],
)
print(f'Question: {question}')
print("Time consuming: {:.2f}s".format(time.time() - start_time))
print(f'Answer: {response_text(response)}\n')

语义相似匹配

        精确匹配只能匹配完全相同的问题,这在大多数场景下不是特别有用(用户可能以不同的方式问出相似的问题)。在这种情况下,基于语义相似匹配的cache可能更有用。通过缓存相似语义问题的回答来解决当前的问题。这种方式在初始化cache的时候,需要加上一些其他的模块,这些模块后续会进行介绍。

import time
def response_text(openai_resp):return openai_resp['choices'][0]['message']['content']#--------------------------------------------------
from gptcache import cache
from gptcache.adapter import 
http://www.sczhlp.com/news/61967/

相关文章:

  • 长沙知名网站推广中国诗歌网个人网页
  • 广州网站排名酷虎云建站
  • 个人网站备案核验单网站建设公司新排行榜
  • 服务周到的网站建设辽宁省工程招投标信息网
  • 最好的网站建设系统做网站一年的维护费用是多少
  • wordpress网站多语言包哪里设计网页便宜
  • msvc之实现编译时函数废弃警告
  • 从GCP云函数窃取访问令牌的渗透测试指南
  • Java集合框架-18.LinkedHashMap特点
  • 继承
  • 网站建设公司的企业特色有哪些自己做项目的网站
  • .net 网站开发书籍维护网站要做哪些工作
  • 网站重新接入备案上海十大网站建
  • 湖州市建设培训中心网站网页封装app
  • 开源能源管理系统 MyEMS:赋能能源高效管理的创新利器
  • charles抓包教程
  • 强化学习 - Agent、状态、动作、奖励、Markov 决策过程
  • Java集合框架-17.HashMap特点
  • 平湖城乡规划建设局网站长春网站推广公司
  • 网站建设公司 六安做gif网站
  • 桂林 网站建设汕头市网络科技有限公司
  • 湖南长沙网站建设公司电话osCommerce购物网站架设全攻略
  • 南通做网站企业用wordpress做的站点
  • html 5电影网站源码长春个人做网站哪家好
  • 怎么进成品网站后台办公电脑租赁
  • 农化网站建设商标注册的原则
  • 外贸网站建设论坛城市宣传网站建设方案
  • 江苏SEO网站建设wordpress修改网站地址
  • 岳阳网站建设的公司百度快照网站
  • 塘厦高铁站图片类网站开发需求