当前位置: 首页 > news >正文

海口网站运营托管费用网站开发硬件配置

海口网站运营托管费用,网站开发硬件配置,德州网站优化,上林住房和城乡建设网站一、前言 学习Qwen2-VL #xff0c;为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野#xff0c;更让我们站在科技发展的潮头#xff0c;紧跟时代的步伐。 Qwen2-VL 具有卓越的图…一、前言 学习Qwen2-VL 为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野更让我们站在科技发展的潮头紧跟时代的步伐。 Qwen2-VL 具有卓越的图像和视频理解能力以及多语言支持等特性。学习它可以提升我们处理复杂视觉信息的能力无论是在学术研究中分析图像数据、解读视频内容还是在实际工作中进行文档处理、解决现实问题都能为我们提供有力的工具和方法。 随着人工智能技术的不断发展掌握 Qwen2-VL 这样的先进模型将为我们的职业发展增添强大的竞争力。在各个领域对具备人工智能知识和技能的人才需求日益增长学习 Qwen2-VL可以让我们在这个快速发展的领域中脱颖而出为未来的职业道路奠定坚实的基础。 本篇将介绍如何使用OpenAI API接入方式调用Qwen2-VL-7B-Instruct模型进行推理。通过学习OpenAI API接入方式可以高效与现有系统或服务集成减少开发和维护的复杂性。 二、术语 2.1. Qwen2-VL 是基于 Qwen2 打造的新一代视觉语言模型具有读懂不同分辨率和长宽比图片、理解长视频、可作为手机和机器人的视觉智能体、多语言支持等特点。目前开源了 Qwen2-VL-2B 和 Qwen2-VL-7B并发布了Qwen2-VL-72B的API。该模型在视觉能力评估的多个方面表现优异能进行更细节的识别理解、视觉推理、视频理解与实时聊天等。其架构延续了 ViT 加 Qwen2 的串联结构并进行了对原生动态分辨率和多模态旋转位置嵌入的升级。 应用场景 图像理解与识别识别植物、地标等理解场景中多个对象间的关系识别手写文字及图像中的多种语言。文档解析能够解析包含密集公式的文档理解文档中的内容。多语言文本识别转录图中多种语言的内容并识别其语言类型。解决现实世界问题通过分析图片解决问题解读复杂数学问题从真实世界图像和图表中提取信息执行指令。视频内容分析总结视频要点、即时回答相关问题并维持连贯对话帮助用户从视频中获取有价值的信息。视觉代理利用视觉能力完成自动化的工具调用和交互例如实时数据检索。与环境交互像人一样与环境进行视觉交互不仅作为观察者还能作为执行者。 模型结构 Qwen2-VL 的一项关键架构改进是实现了动态分辨率支持Naive Dynamic Resolution support。与上一代模型Qwen-VL不同Qwen2-VL 可以处理任意分辨率的图像而无需将其分割成块从而确保模型输入与图像固有信息之间的一致性。这种方法更接近地模仿人类的视觉感知使模型能够处理任何清晰度或大小的图像。 另一个关键的架构增强是Multimodal Rotary Position Embedding (M-ROPE) 的创新。通过将original rotary embedding分解为代表时间和空间高度和宽度信息的三个部分M-ROPE 使 LLM 能够同时捕获和集成 1D 文本、2D视觉和 3D 视频位置信息。这使 LLM 能够充当强大的多模态处理器和推理器。 2.2. OpenAI API Client 遵循 OpenAI API 的接口规范让开发者可以使用OpenAI API相同的方式和方法来调用这些服务从而利用它们的模型功能。 三、前置条件 3.1. 模型部署 选择以下任意一种方式部署Qwen2-VL-7B-Instruct模型 (一) 代码 开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界-集成vLLM二 (二) 命令 开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界-集成vLLM三 (三) Docker 开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界-vLLMDocker七 启动成功 INFO 10-23 11:08:50 model_runner.py:1060] Starting to load model /data/model/qwen2-vl-7b-instruct... INFO 10-23 11:08:51 selector.py:224] Cannot use FlashAttention-2 backend for Volta and Turing GPUs. INFO 10-23 11:08:51 selector.py:115] Using XFormers backend. Loading safetensors checkpoint shards: 0% Completed | 0/5 [00:00?, ?it/s] Loading safetensors checkpoint shards: 20% Completed | 1/5 [00:2601:46, 26.51s/it] Loading safetensors checkpoint shards: 40% Completed | 2/5 [00:5201:19, 26.40s/it] Loading safetensors checkpoint shards: 60% Completed | 3/5 [01:1900:52, 26.37s/it] Loading safetensors checkpoint shards: 80% Completed | 4/5 [01:4500:26, 26.35s/it] Loading safetensors checkpoint shards: 100% Completed | 5/5 [01:5300:00, 19.59s/it] Loading safetensors checkpoint shards: 100% Completed | 5/5 [01:5300:00, 22.62s/it]INFO 10-23 11:10:44 model_runner.py:1071] Loading model weights took 15.5083 GB INFO 10-23 11:10:49 gpu_executor.py:122] # GPU blocks: 12154, # CPU blocks: 18724 INFO 10-23 11:10:49 gpu_executor.py:126] Maximum concurrency for 8192 tokens per request: 23.74x INFO 10-23 11:11:05 api_server.py:232] vLLM to use /tmp/tmpdrdffmm5 as PROMETHEUS_MULTIPROC_DIR WARNING 10-23 11:11:05 serving_embedding.py:199] embedding_mode is False. Embedding API will not work. INFO 10-23 11:11:05 launcher.py:19] Available routes are: INFO 10-23 11:11:05 launcher.py:27] Route: /openapi.json, Methods: GET, HEAD INFO 10-23 11:11:05 launcher.py:27] Route: /docs, Methods: GET, HEAD INFO 10-23 11:11:05 launcher.py:27] Route: /docs/oauth2-redirect, Methods: GET, HEAD INFO 10-23 11:11:05 launcher.py:27] Route: /redoc, Methods: GET, HEAD INFO 10-23 11:11:05 launcher.py:27] Route: /health, Methods: GET INFO 10-23 11:11:05 launcher.py:27] Route: /tokenize, Methods: POST INFO 10-23 11:11:05 launcher.py:27] Route: /detokenize, Methods: POST INFO 10-23 11:11:05 launcher.py:27] Route: /v1/models, Methods: GET INFO 10-23 11:11:05 launcher.py:27] Route: /version, Methods: GET INFO 10-23 11:11:05 launcher.py:27] Route: /v1/chat/completions, Methods: POST INFO 10-23 11:11:05 launcher.py:27] Route: /v1/completions, Methods: POST INFO 10-23 11:11:05 launcher.py:27] Route: /v1/embeddings, Methods: POST INFO: Started server process [3232280] INFO: Waiting for application startup. INFO: Application startup complete. INFO: Uvicorn running on socket (0.0.0.0, 9000) (Press CTRLC to quit) INFO 10-23 11:11:15 metrics.py:345] Avg prompt throughput: 0.0 tokens/s, Avg generation throughput: 0.0 tokens/s, Running: 0 reqs, Swapped: 0 reqs, Pending: 0 reqs, GPU KV cache usage: 0.0%, CPU KV cache usage: 0.0%. 四、技术实现 4.1. 单张图片推理 # -*- coding: utf-8 -*- import base64 import requests from openai import OpenAIopenai_api_key EMPTY openai_api_base http://localhost:9000/v1client OpenAI(api_keyopenai_api_key,base_urlopenai_api_base, )models client.models.list() model models.data[0].iddef encode_base64_content_from_url(content_url: str) - str:with requests.get(content_url) as response:response.raise_for_status()result base64.b64encode(response.content).decode(utf-8)return resultdef encode_base64_content_from_local(content_path: str) - str:with open(content_path, rb) as image_file:# 将图像文件读取为二进制encoded_string base64.b64encode(image_file.read())# 将字节数据解码为字符串形式return encoded_string.decode(utf-8)def single_image_test(messages) - None:chat_completion_from_url client.chat.completions.create(messagesmessages,modelmodel,temperature0.1,max_tokens1024,streamFalse)result chat_completion_from_url.choices[0].message.contentreturn resultif __name__ __main__:image_url /data/test/duck.jpgimage_base64 encode_base64_content_from_local(image_url)messages[{role: user,content: [{type: text,text: Whats in this image?},{type: image_url,image_url: {url: fdata:image/jpeg;base64,{image_base64}},},],}]result single_image_test(messages)print(output:, result) 4.2. 多张图片推理 # -*- coding: utf-8 -*- import base64 import requests from openai import OpenAIopenai_api_key EMPTY openai_api_base http://localhost:9000/v1client OpenAI(api_keyopenai_api_key,base_urlopenai_api_base, )models client.models.list() model models.data[0].iddef encode_base64_content_from_url(content_url: str) - str:with requests.get(content_url) as response:response.raise_for_status()result base64.b64encode(response.content).decode(utf-8)return resultdef encode_base64_content_from_local(content_path: str) - str:with open(content_path, rb) as image_file:# 将图像文件读取为二进制encoded_string base64.b64encode(image_file.read())# 将字节数据解码为字符串形式return encoded_string.decode(utf-8)def multi_image_test(messages) - None:output client.chat.completions.create(messagesmessages,modelmodel,temperature0,max_tokens1024,)result output.choices[0].message.contentreturn resultif __name__ __main__:image_paths [https://upload.wikimedia.org/wikipedia/commons/d/da/2015_Kaczka_krzy%C5%BCowka_w_wodzie_%28samiec%29.jpg,https://upload.wikimedia.org/wikipedia/commons/7/77/002_The_lion_king_Snyggve_in_the_Serengeti_National_Park_Photo_by_Giles_Laurent.jpg]messages [{type: text,text: 这些图像中的动物是什么}]for image_path in image_paths:obj {type: image_url,image_url: {url: image_path},}messages.append(obj)result multi_image_test(messages)print(output:, result)
http://www.sczhlp.com/news/154788/

相关文章:

  • 建设银行的官方网站界面设计的软件
  • 网站集群建设是沈阳科技网站首页
  • 2025 年传感器厂家 TOP 企业品牌推荐排行榜,磁致伸缩 / 防爆 / 防水 / 隔爆 / 线性 / 矿用 / 直线 / 油缸位移传感器 / 液位传感器公司推荐!
  • 2025 年热转印花膜厂家 TOP 企业品牌推荐排行榜,硅胶 / 五金 / 塑胶 / ABS / 涂料桶 / PP / 水杯 / 温变 / 冰变热转印花膜加工厂推荐
  • 2025 年生物除臭设备厂家 TOP 品牌企业推荐排行榜揭晓:印染厂污水 / 食品厂污水 / 污水处理厂 / 污水泵站 / 污水站 / 餐厨垃圾 / 屠宰场 / 厨余垃圾生物除臭设备公司推荐
  • JUC:读写锁
  • 2025 年舞台厂家 TOP 品牌企业权威推荐榜单,铝合金舞台、活动舞台、快装舞台、舞台架、折叠舞台、演出舞台、演唱会舞台桁架、舞台设计公司推荐
  • 资源下载类网站如何做外链网络营销与直播电商就业前景
  • 网站开发前端制作WordPress仿百家号主题
  • 旅游景点网站模板品牌网站建设价位
  • 做问卷调查赚钱的网站网站的建设目标有哪些
  • 沈阳网站备案东莞加盟网站建设
  • 汕头市网站建设分站服务机构珠海网站建设网络公司
  • 广州网站建设亅新科送推广公司网站续费帐怎么做
  • 网站访问很慢做冲压件加工有什么好网站
  • 网站开发流行酷家乐在线家装设计
  • 做最好的言情网站360网站推广官网授权商
  • 网站建议公司怎么建立视频网站
  • 龙华附近网站建设wordpress搭建官网步骤
  • 网站建设如何增加流量网站如何做水晶按钮
  • 梅州市网站制作贵阳餐饮网站建设
  • 网站建设工作总结培训在哪能学到网站建设专业
  • 展架设计在哪个网站做网站建设与管期末试题
  • 专门 做鞋子团购的网站有哪些珠海网站品牌设计公司哪家好
  • 搬家公司怎么做网站电商平面ui设计是什么
  • 网站开发案例详解pdf如何建设自己的摄影网站
  • 网站 关键词wordpress code theme
  • apache怎么配置网站湖南常德天气
  • 舟山市规划建设局网站互联网app开发
  • c 语言可以做网站吗网站开发浏览器分辨率