所需硬件配置

运行 WeClone（尤其是模型微调阶段）对显存有较高要求。推荐使用独立 GPU 设备或云端 GPU 租赁服务，不建议在集成显卡或仅使用 CPU 的环境下运行。

项目默认使用 Qwen2.5-7B-Instruct 模型，并采用 LoRA 方法进行微调，显存需求约为 16GB。
同时，请预留 20GB 以上硬盘空间，以存储模型文件、中间结果和缓存数据。

下表列出了不同模型规模与微调方法所需的显存估算，多模态模型根据图片大小和数量会占用更多显存：

微调方法	精度 (bits)	7B 模型	14B 模型	30B 模型	70B 模型	`x`B 模型
Full (`bf16` / `fp16`)	32	120GB	240GB	600GB	1200GB	`18x` GB
Full (`pure_bf16`)	16	60GB	120GB	300GB	600GB	`8x` GB
Freeze / LoRA / GaLore / APOLLO	16	16GB	32GB	64GB	160GB	`2x` GB
QLoRA	8	10GB	20GB	40GB	80GB	`x` GB
QLoRA	4	6GB	12GB	24GB	48GB	`x/2` GB
QLoRA	2	4GB	8GB	16GB	24GB	`x/4` GB

如果你希望启用 QLoRA 微调方式，请查阅后续章节 “启用 QLoRA（可选配置）” 了解如何切换微调策略。

WARNING

使用量化后的模型进行微调后权重将无法合并到原模型中。

TIP

显存 ≥16GB：推荐使用默认的 LoRA 微调方案。
显存 <16GB：可考虑切换至 QLoRA 或选择更小参数量的模型。

所需硬件配置 ​