DGX Spark 实践解析（二）：ComfyUI 篇

DGX Spark + fp8 + LoRA，仅需4步就能生成高质量图片。

赞奇科技Xsuperzone

683人浏览 · 2025-11-03 15:33:21

赞奇科技Xsuperzone · 2025-11-03 15:33:21 发布

AI 绘画的效率瓶颈，如今有了突破性解决方案。通过使用 DGX Spark，并采用 fp8 格式的 Qwen 系列模型并加载 LoRA，现在仅需4步就能生成高质量图片，显存占用显著降低，出图速度提升数倍。

核心优化：fp8 + LoRA，双剑合璧

对于 ComfyUI 用户而言，模型运行效率和资源占用一直是核心痛点。我们最新测试表明，当前阶段最推荐的性能优化组合是：

模型格式：采用fp8精度的 Qwen 系列图像模型（如 Qwen-Image/Qwen-Image-Edit-2509）
关键技术：为模型加载对应的4步 LoRA文件
惊人效果：采用此组合后，仅需4步采样就能获得出色效果，彻底打破以往需要20步以上的传统

技术简析
fp8 格式如同模型的"精简模式"，在几乎不损失画质的前提下，大幅减小模型体积和显存占用。LoRA 则像是"风格滤镜"，能精准控制画面内容。两者结合，真正实现了"又快又好"的目标。

性能实测：

基于 DGX Spark 环境的详细测试结果，让你直观了解性能提升：

1. 图片编辑任务：Qwen-Image-Edit-2509模型

配置：fp8精度 + LoRA + vl7b
显存占用：28 GB
生成速度：约 3.25秒/步
总耗时（4步）：仅需 17秒 完成一次编辑！

2. 文生图任务：Qwen-Image模型

配置：fp8精度 + LoRA + vl7b
显存占用：20 GB
生成速度：约 3.25秒/步
总耗时（4步）：仅需 21.2秒 完成图片生成！

数据解读

效率飞跃：从传统的十几二十步缩减到4步，总生成时间压缩到半分钟内，效率提升具有颠覆性
资源友好：显存占用大幅降低，显著优化了硬件资源使用效率

实践价值：给 ComfyUI 用户的建议

高效迭代：如需快速进行创意构思和效果预览，此组合是不二之选。十几秒一张图，让你可以海量尝试不同提示词和参数；
资源节约：更低的显存占用意味着更大的创作空间，可同时运行其他任务，或为更高分辨率输出留出余地；
升级路径：建议优先寻找和部署fp8精度的Qwen系列模型，并关注对应 LoRA 文件，这是优化工作流的关键一步。

fp8 精度模型 + LoRA + 4 步采样的组合，无疑是当前在 ComfyUI 上实现高性能 AI 绘画的"最优解"。它成功平衡了质量、速度和资源消耗，让 AI 绘画变得更加流畅易用。得益于 DGX Spark 高达 128G 同存的容量，现在我们可以毫无压力地运行各种 AI 生图模型，再不用担心OOM啦！

当然，在体验完fp8格式的快速后，下一步我们就是使用更小更快的FP4格式了，更多使用指南请关注我们。