当前位置: 首页 > news >正文

【Datawhale AI夏令营--task2】科大讯飞AI大赛(大模型技术)

进入baseline2 开启python编码阶段啦

感想:
开始的晚了一些,准备环境花了好久哦,好在ai可以帮忙安装环境需要的各种包,并且运行的报错也可以解决。
以及硅基流动的免费api超级慢TT,遍历数据花费的时间过长了。
听到分享会上可以用阿里百炼的api,但在调用上还有些问题,接下来要再多试一下。
阅读了一下代码,发现代码是每行调用一次大模型,优化点其实是可以一次性调用完的,这样应该能节省很多时间。 下一步还是要自己优化下代码呀。

我的BaseLine运行后的分数 : 56

本期小白重点

  1. python环境的安装
  2. vscode中项目的运行,包的安装:pandas、requests、re、json、tqdm
  3. 硅基流动注册,api领取, apikey的使用
  4. 大模型返回值数据错乱的处理。
  5. 代码逻辑学习

方案思路

1. 模型蒸馏方法

将一个强大的教师模型(如Qwen3-8B)在特定任务上的知识,迁移到我们最终需要微调的学生模型上

具体步骤:

  1. 表格数据文本化:将结构化的列车时刻表数据(每一行代表一趟列车的信息)转换为易于大模型理解的文本格式。

  2. 编程生成问题:针对每一行列车数据,我们手动设计问题模板,并通过编程方式(例如Python脚本)批量生成问题。例如,对于“车次”、“检票口”、“终到站”等字段,可以生成“{车次}号车次应该从哪个检票口检票?”、“{车次}次列车的终到站是哪里?”等问题。这种方式确保了生成问题的语法正确性和与表格内容的强相关性。

  3. 教师模型生成答案:将文本化的列车信息和编程生成的问题作为Prompt输入给一个能力更强的教师模型。教师模型根据其强大的理解和推理能力,为每个问题生成对应的答案。

  4. 构建SFT数据集:将编程生成的问题和教师模型生成的答案配对,形成{"instruction": "问题", "output": "答案"}的JSON格式数据集。这个数据集就是用于微调学生模型的SFT数据。

  5. 学生模型LoRA微调:将构建好的SFT数据集上传到讯飞星辰MaaS平台,并使用LoRA技术对选定的基础模型(学生模型)进行微调。微调后的模型将能够根据用户提出的问题,从内部学习到的表格知识中给出准确的回答。

代码块分析

3个代码块

  1. 读取数据
  2. 遍历每行,调用大模型,存储返回值
  3. 将返回值转化为结构化,符合格式的数据,并生成训练数据集对应格式的json

重新上传新的数据集,进行训练.

  1. 直接使用案例baseline代码,硅基流动api调用花费了小一个小时 TT
  2. 数据集训练不到10分钟
  3. 得分56.

分数提升方案

  1. 提升api速度: 避免遍历,一次性生成返回; 切换api源
  2. prompt提升,增强对复杂数据的对应
  3. 挑战:python编码是新的挑战呀
http://www.sczhlp.com/news/530.html

相关文章:

  • 记录一次vue3+mqtt.js连接华为云mqtt的成功经历
  • 狂神说Java|Java基础
  • 每日题单
  • 在常量时间内实现单向链表的插入与删除
  • cpp的单头文件
  • (阶段三:整合)面向用户 面向商户,场景之:shop
  • 现代Web框架的性能基准测试(6084)
  • 服务端推送技术的现代实现(8430)
  • 跨平台Web服务开发的新选择(1992)
  • Astro机器人流畅运动背后的科技原理
  • 实时通信协议的Rust实现(5234)
  • 现代Web框架的性能基准测试(8409)
  • 现代Web服务器性能革命:我的Rust框架探索之旅(1820)
  • 实战项目:文件分块上传系统(4936)
  • HTTP请求处理的高效封装(8307)
  • 实时通信的革命:WebSocket技术的深度探索(1440)
  • Rust生态系统在Web开发中的优势(9219)
  • 高并发处理的Rust实现方案(2866)
  • 从零开始构建高性能实时聊天系统:Hyperlane框架实战指南(5696)
  • 内存使用效率的终极对决:零拷贝技术的实战应用(9040)
  • 推荐6本书《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理设计应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》
  • 实时通信协议的Rust实现(2554)
  • 零依赖Web框架的设计哲学(5850)
  • 微服务架构的轻量级解决方案(8414)
  • WebSocket服务端的高效处理(1857)
  • 利用数据绑定让动画更智能:在Rive中创建动态黄金计算器
  • 服务器配置的精细化控制(5106)
  • HTTP响应处理的灵活设计(3253)
  • 现代Web框架的性能基准测试(6931)
  • 微服务架构的轻量级解决方案(0378)