【云馨AI-大模型】大模型部署进阶:Qwen3-30B-A3B + vLLM + Docker Compose全解析(A100显卡实测)
本文详细介绍了使用Docker部署Qwen3-30B-A3B大语言模型的完整流程。首先提供Docker和Git-LFS的安装教程链接,然后指导用户快速拉取vLLM 0.9.0镜像。接着说明如何通过Git-LFS下载约60G的模型文件。重点讲解了docker-compose.yaml文件的配置方法,包括GPU资源分配和参数设置,并提供了验证API调用的curl命令示例。最后展示了模型推理效果,并附有
·
前置条件
- docker、docker-compose安装教程
https://blog.csdn.net/u010800804/article/details/141754183 - git-lfs 安装教程
https://blog.csdn.net/u010800804/article/details/146534351
vLLM镜像拉取
- 拉取 vLLM 0.9.0版本:
docker pull crpi-33mr80vehc50lqh8.cn-chengdu.personal.cr.aliyuncs.com/yunxinai/vllm-openai:v0.9.0
- 可以看到,速度还是非常快的

模型下载
- 基于git-lfs下载完整的模型文件
https://modelscope.cn/models/Qwen/Qwen3-30B-A3B/files git lfs installgit clone https://www.modelscope.cn/Qwen/Qwen3-30B-A3B.git- 模型文件大小差不多60G左右

模型部署
yaml文件编写
services:
vllm:
container_name: vllm
restart: no
image: crpi-33mr80vehc50lqh8.cn-chengdu.personal.cr.aliyuncs.com/yunxinai/vllm-openai:v0.9.0
ipc: host
volumes:
- /data/vllm:/models
command: ["--model", "/models/Qwen3-30B-A3B", "--served-model-name", "Qwen3_30B_A3B", "--gpu-memory-utilization", "0.75", "--tensor-parallel-size", "2", "--uvicorn-log-level", "debug", "--api-key", "EHmTL656TaTBlCnSQbpqbhG6NXDWItpo"]
ports:
- 30041:8000
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: all
capabilities: [gpu]
-
command 参数信息信息参考博文:https://blog.csdn.net/qq_61897309/article/details/146996336
-
在yaml目录执行:
docker-compose up -d
日志查看
- 执行查看日志命令:
docker-compose logs vllm -f --tail=50
模型验证
curl -X POST "http://127.0.0.1:30041/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer EHmTL656TaTBlCnSQbpqbhG6NXDWItpo" \
-d '{
"model": "Qwen3_30B_A3B",
"messages": [
{
"role": "user",
"content": "一大爷带着二大爷上三大爷家里说四大爷被五大爷骗到六大爷家偷七大爷放在柜子里九大爷,谁是小偷"
},
{
"role": "system",
"content": "请帮我仔细回答问题"
}
],
"temperature": 0.5,
"stream": false
}'

关注微信公众号「云馨AI」,回复「微信」,
无论你是AI爱好者还是初学者,这里都能为你打开AI世界的大门!加入我们,与志同道合的朋友一起探索AI的无限可能,共同拥抱智能未来!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐


所有评论(0)