当前位置: 首页 > news >正文

网站移动端指的是什么国内主机wordpress

网站移动端指的是什么,国内主机wordpress,中国十大外贸平台,做网站横幅的图片大模型-ChatGLM2-6B模型部署与微调记录 模型权重下载: 登录魔塔社区:https://modelscope.cn/models/ZhipuAI/chatglm2-6b 拷贝以下代码执行后,便可快速权重下载到本地 # 备注:最新模型版本要求modelscope > 1.9.0 # pip insta…

大模型-ChatGLM2-6B模型部署与微调记录

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

模型权重下载:
登录魔塔社区:https://modelscope.cn/models/ZhipuAI/chatglm2-6b
拷贝以下代码执行后,便可快速权重下载到本地

# 备注:最新模型版本要求modelscope >= 1.9.0
# pip install modelscope -U from modelscope.utils.constant import Tasks
from modelscope import Model
from modelscope.pipelines import pipeline
model = Model.from_pretrained('ZhipuAI/chatglm2-6b', device_map='auto', revision='v1.0.12')
pipe = pipeline(task=Tasks.chat, model=model)
inputs = {'text':'你好', 'history': []}
result = pipe(inputs)
inputs = {'text':'介绍下清华大学', 'history': result['history']}
result = pipe(inputs)
print(result)

在这里插入图片描述

在这里插入图片描述

运行微调除 ChatGLM2-6B 的依赖之外,还需要安装以下依赖:

pip install rouge_chinese nltk jieba datasets

下载数据集
ADGEN 数据集任务为根据输入(content)生成一段广告词(summary)。

{"content": "类型#上衣*版型#宽松*版型#显瘦*图案#线条*衣样式#衬衫*衣袖型#泡泡袖*衣款式#抽绳","summary": "这件衬衫的款式非常的宽松,利落的线条可以很好的隐藏身材上的小缺点,穿在身上有着很好的显瘦效果。领口装饰了一个可爱的抽绳,漂亮的绳结展现出了十足的个性,配合时尚的泡泡袖型,尽显女性甜美可爱的气息。"
}

在这里插入图片描述

参数解释:

PRE_SEQ_LEN=128
LR=2e-2
NUM_GPUS=2    torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \--do_train \--train_file /home/data/project/GOOGOSOFT/LLM/ChatGLM2-6B-main/AdvertiseGen/train.json \--validation_file /home/data/project/GOOGOSOFT/LLM/ChatGLM2-6B-main/AdvertiseGen/dev.json \--preprocessing_num_workers 10 \--prompt_column content \--response_column summary \--overwrite_cache \--model_name_or_path /home/data/project/GOOGOSOFT/LLM/ChatGLM2-6B-main/ZhipuAI/chatglm2-6b \--output_dir output/adgen-chatglm2-6b-pt-$PRE_SEQ_LEN-$LR \--overwrite_output_dir \--max_source_length 128 \--max_target_length 256 \--per_device_train_batch_size 25 \--per_device_eval_batch_size 25 \--gradient_accumulation_steps 16 \--predict_with_generate \--max_steps 6000 \--logging_steps 10 \--save_steps 1000 \--learning_rate $LR \--pre_seq_len $PRE_SEQ_LEN \--quantization_bit 4

在这里插入图片描述
以下是一个 Python 脚本,用于计算 AdvertiseGen 数据集中 content 列的最大长度。此脚本假设数据集是 JSON 格式,文件路径为 AdvertiseGen/train.json。

脚本:计算最大 max_source_length

import json# 数据集文件路径
train_file = "AdvertiseGen/train.json"# 加载数据集
def load_data(file_path):with open(file_path, "r", encoding="utf-8") as f:data = json.load(f)return data# 计算最大输入长度
def calculate_max_source_length(data, column_name="content"):lengths = [len(item[column_name]) for item in data if column_name in item]max_length = max(lengths)print(f"最大输入长度 (max_source_length): {max_length}")return max_length# 主函数
if __name__ == "__main__":# 加载数据data = load_data(train_file)# 计算最大长度max_source_length = calculate_max_source_length(data, column_name="content")

训练:
在这里插入图片描述

在这里插入图片描述

http://www.sczhlp.com/news/133001/

相关文章:

  • 网站备案取名滕州住房城乡建设局网站
  • 幽默软文广告经典案例福州网站的优化
  • 晋江外贸网站建设wordpress 要备案吗
  • 天河企业网站建设北京文化馆设计公司的参数
  • site网站连通率0%怎么解决二手书网站开发需求分析
  • 北京网站建设最大的公司排名网站开发与设计作业
  • 织梦网站模板官网学生班级优化大师
  • 怎样做企业营销网站seo技术博客
  • 公司网站设计的内容有哪些情侣手表网站
  • 广州网站建设好公司软件前端主要做什么
  • 学习问题日记-2
  • 封神台复现
  • 企业网站备案材料凯里州建公司简介
  • 提供视频下载的网站在线生成个人网站源码
  • 网站建设详细设计怎么建自己的手机网站
  • 个人电脑做网站服务器wordpress 免费商业主题
  • 郑州专业做微信网站网站做兼容处理怎么
  • 一个公司优化需要做多少个网站百度竞价产品
  • pos网站源码推荐一个做淘客网站
  • 北京 网站建设电商网站建设网
  • 墓园网站建设价格做效果图的方便的网站
  • 织梦 视频网站源码国内外贸网站建设
  • 免费做视频网站广州建站培训学校
  • 李之一的Java第一作
  • 2025.9.24 闲话:Lucas 定理究极证明
  • 商城网站策划北京网站建设公司排名浩森宇特
  • 找外贸工作哪个网站好网站建设实训个人总结1000字
  • asp.net网站开发上国美网上商城
  • 一级a做爰片软件网站工程建设标准强制性条文最新版本
  • Lampiao靶场渗透wp-脏牛提权