Unsloth AI

开源平台，加速大语言模型微调，最高提升32倍速度并减少显存占用。

社区:

大语言模型 (LLMs)AI 开发者工具调研工具 AI 智能体开发

访问官网

Atoms - 用 AI 构建网站与应用，无需编码

InsForge

Sponsor

智能体原生的AWS替代。免配置，支持AI通过 CLI/Skills 端到端运行全栈。

概览
替代方案
数据分析

Atoms - 用 AI 构建网站与应用，无需编码

产品概览

什么是Unsloth AI？

Unsloth AI是一款先进的开源框架，专为大幅提升和简化大语言模型（LLM，如Llama-3、Mistral、Phi-3、Gemma）微调流程而设计。通过手动优化计算密集型数学运算和GPU内核，Unsloth在单GPU上可实现高达10倍、在多GPU上高达32倍的训练加速，相较传统方法如Flash Attention 2有显著提升。支持从Tesla T4到H100的NVIDIA GPU，同时兼容AMD与Intel GPU。Unsloth大幅降低约70%显存占用，使Google Colab或个人笔记本等有限硬件也能微调大模型。平台提供简洁API、丰富文档和与主流工具及推理引擎的无缝集成，适合开发者、研究者及AI爱好者使用。

主要功能

极致训练速度
通过手动优化GPU内核和数学运算，在单张GPU上实现高达10倍、在多GPU系统上实现高达32倍的微调加速。
高效内存使用
显著减少约70%的GPU显存占用，使有限硬件也能无损精度地微调大模型。
广泛模型与硬件支持
支持多种主流LLM，包括Llama（v1-3）、Mistral、Gemma、Phi-3，并兼容NVIDIA、AMD、Intel等主流GPU。
简洁API与开源
提供基于Transformers的易用Python API，配套完善文档和开源代码，便于上手和自定义。
无缝集成
兼容Google Colab、Kaggle等平台，并支持导出模型到Ollama、llama.cpp、vLLM等推理引擎。
先进训练技术
支持多种微调方法，包括QLoRA、LoRA、强化学习（DPO、PPO）及自定义训练流程。