当前位置: 首页 » 资讯 » 科技头条 » 正文

​Unsloth Studio 发布:首个本地可视化大模型微调平台,显存占用降低 70%

IP属地 中国·北京 编辑:苏婉清 Chinaz 时间:2026-03-18 16:32:17

知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面,旨在大幅降低软件工程师微调大语言模型(LLM)的门槛,让开发者彻底告别复杂的 CUDA 环境配置与高昂的硬件成本。

Unsloth Studio 的底层采用了由 Triton 语言编写的定制化反向传播内核,相比标准微调框架实现了质的飞跃:

训练速度翻倍:训练效率提升了2倍。

显存节省70%:在不损失模型精度的前提下,大幅减少了对 GPU 显存的依赖。

消费级显卡友好:开发者现在可以在 RTX4090或5090等单块消费级显卡上,微调原本需要多卡集群才能运行的8B 或70B 参数模型(如 Llama3.3、DeepSeek-R1)。

该平台将数据准备、训练到部署的完整生命周期整合进了一个直观的 Web UI 中:

可视化数据配方:引入节点式工作流,支持 PDF、JSONL 等多种格式的自动摄取,并能利用 NVIDIA DataDesigner 将杂乱文档转化为结构化的指令数据集。

强化学习支持:内置对 GRPO(群组相对策略优化)的支持。这种技术源自 DeepSeek-R1,能够在无需额外“批判模型”的情况下,让本地硬件也能训练具备多步逻辑推理能力的 AI。

一键导出部署:支持一键导出为 GGUF、vLLM 或 Ollama 格式,打通了从训练检查点到生产环境推理的“最后一公里”。

随着 Unsloth Studio 的发布,大模型微调正从依赖昂贵的云端 SaaS 转向更加私密、低成本的本地开发模式。它不仅为 Llama4和 Qwen 系列提供了即时兼容,更为企业所有权的定制化模型开发提供了强大工具。

技术详情:https://unsloth.ai/docs/new/studio

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。