当前位置: 首页 > news >正文

巴州网站建设网站的备案流程

巴州网站建设,网站的备案流程,购物网站如何做,正邦设计公司招聘要求引言 本博客介绍LLava1.5多模态大模型的安装教程、训练教程、预测教程,也会涉及到hugging face使用与wandb使用。 源码链接:点击这里 demo链接:点击这里 论文链接:点击这里 一、系统环境 ubuntu 20.04 gpu: 2*3090 cuda:11.6 二、LLava环境安装 1、代码下载…

引言

本博客介绍LLava1.5多模态大模型的安装教程、训练教程、预测教程,也会涉及到hugging face使用与wandb使用。

源码链接:点击这里

demo链接:点击这里

论文链接:点击这里

一、系统环境

ubuntu 20.04
gpu: 2*3090
cuda:11.6

二、LLava环境安装

1、代码下载

git clone https://github.com/haotian-liu/LLaVA.git
cd LLaVA

2、虚拟环境构建

conda create -n llava python=3.10 -y
conda activate llava
pip install --upgrade pip  # enable PEP 660 support

3、模型预测安装

pip install -e .

4、模型训练环境安装

pip install -e ".[train]"
pip install flash-attn --no-build-isolation  # 可能安装失败

5、flash-attn离线环境安装

根据对应环境格式下载相应flash-attn,
flash-attn下载链接点击这里
实际为whl的离线文件,在使用pip install *.whl 即可

三、LLava推理运行

1、启动网页预测(类似服务端与客户端)

Launch a controller

python -m llava.serve.controller --host 0.0.0.0 --port 10000

Launch a gradio web server.

python -m llava.serve.gradio_web_server --controller http://localhost:10000 --model-list-mode reload

注:host 0.0.0.0表示自动填充本机ip,网页将其替换本机ip即可,web server启动后会有网页ip,若在其它电脑将其0.0.0.0替换运行服务器的ip即可。

2、推理权重下载

我们使用llava-v1.5-7b模型做推理。

llava-v1.5-7b权重下载

权重下载地址:点击这里

权重下载,需要使用hugging face才能下载,自己注册账号即可,文件格式如下:
在这里插入图片描述

将图示文件全部下载,内有一个config.json文件,该文件很重要,部分内容如下:

在这里插入图片描述

该文件可看出视觉编码也缺少相应权重,需下载如下内容,并将其路径修改本地权重保存文件。

clip-vit-large-patch14-336权重下载

权重下载地址:点击这里
该文件可通过点击链接连接,也可在hugging face自行搜索。
在这里插入图片描述

同理,也是全部下载,放到一个文件夹中。

3、启动预测模型

若已完成权重下载,便可执行以下模型启动命令,而–model-path后面需跟模型权重路径文件,若联网能范文hugging face便可无需修改直接使用官方给定命令。

python -m llava.serve.model_worker --host 0.0.0.0 --controller http://localhost:10000 --port 40000 --worker http://localhost:40000 --model-path liuhaotian/llava-v1.5-13b

–load-4bit: 该指令也可加上,使用4bit模型推理

四、LLava的lora训练

1、权重下载

根据下图的finetune_lora.sh文件指定权重在hugging face下载即可,如下图。

在这里插入图片描述

下载好对应权重,即可修改路径路径,如下:
在这里插入图片描述

2、数据准备

使用官网也行,若不想下载太多,使用下面代码准备部分也行,如下:

import jsonif __name__ == '__main__':json_root=r'*\llava_v1_5_mix665k.json'with open(json_root, 'r') as f:json_info = json.load(f)save_info=json_info[:1000]+json_info[480000:481000]+json_info[620000:621000]with open('info.json', 'w') as fp:json.dump(save_info, fp, indent=4)

数据图如下:
在这里插入图片描述

3、训练命令

我是将其移动到LLAVA文件内,直接执行此命令:

finetune_lora.sh

4、报错处理

模型有可能报数据错误,此时不用担心,该问题是数据的问题,如下:
在这里插入图片描述

直接修改上面代码如下:

def get_modality_length_grouped_indices(lengths, batch_size, world_size, generator=None):# We need to use torch for the random part as a distributed sampler will set the random seed for torch.assert all(l != 0 for l in lengths), "Should not have zero length."mm_indices, mm_lengths = zip(*[(i, l) for i, l in enumerate(lengths) if l > 0])# lang_indices, lang_lengths = zip(*[(i, -l) for i, l in enumerate(lengths) if l < 0])lang_indices, lang_lengths=mm_indices, mm_lengthsassert len(mm_indices) > 0, "Should have at least one multimodal sample."assert len(lang_indices) > 0, "Should have at least one language sample."

也有可能有其它数据问题,是可能无eval数据,添加以下红色框即可,如下:

在这里插入图片描述

5、训练效果

若完成以上方式,使用训练命令,可实现如下训练效果:
在这里插入图片描述

6、训练使用wandb

llava训练自带wandb方式显示化查看,训练代码会自动提醒你,你只需注册,然后将其key复制,即可实现,其效果如下:
在这里插入图片描述

在这里插入图片描述

总结

以上便llava所有运行过程,愿踩过的坑对你有帮助。最后,我额外说下,我使用4090显卡搭建,跑测试问题不大,大概16g左右吧,跑训练一张24G卡有些够呛。

http://www.sczhlp.com/news/65542/

相关文章:

  • 精美个人网站松江品划网站建设
  • 营销网站和展示型网站中等职业学校专业建设规划
  • 网站建设和维护工作内容北京app制作多少钱
  • 做网站必须知道的问题淮北建设工程质量安全站网站
  • 怎样切图做网站动画专业最好的大学
  • 福州云建站赤峰建设淘宝网站
  • html网站服务器搭建电子产品网页设计模板
  • 手机网站开发项目数码电子产品网站名称
  • 甜品网站建设项目规划书网站建设行业导航站点
  • 小型网站开发小论文360排名优化工具
  • 人格测试
  • Excel|锁定行列不移动
  • 《音频焦点管理》最佳实践:让鸿蒙应用中的每一段声音,都不被打扰
  • PostgreSQL 词汇表(含关键字)
  • 1688域名网站柠檬网络科技网站建设
  • 网站做文件检查鹤壁建设企业网站公司
  • 给企业做网站 内容需要对方提供兰州市门户网站
  • xshell如何做网站全网营销张启明
  • 俄罗斯门户网站有哪些首页排名seo
  • 网站建设多少带宽洛阳住房和城乡建设厅网站
  • 网站建设项目计划书如何写获取网站的路径
  • 做网站没签合同网站策划的内容有那些
  • 网站随机代码国家建设部人才交流中心网站
  • 最专业的网站建设收费平面设计网络培训
  • 网站建设方案免费下载怎么用自己的电脑搭建网站
  • 淄博网站公司渭南网站建设推广
  • 个人备案的网站可以做商城吗flash网站引导页
  • 营销推广网站建设设计配色的网站
  • 做网站需要什么源码网上打工赚钱的项目
  • mysqldump参数详解