【云馨AI-大模型】大模型部署进阶：Qwen3-30B-A3B + vLLM + Docker Compose全解析（A100显卡实测）

本文详细介绍了使用Docker部署Qwen3-30B-A3B大语言模型的完整流程。首先提供Docker和Git-LFS的安装教程链接，然后指导用户快速拉取vLLM 0.9.0镜像。接着说明如何通过Git-LFS下载约60G的模型文件。重点讲解了docker-compose.yaml文件的配置方法，包括GPU资源分配和参数设置，并提供了验证API调用的curl命令示例。最后展示了模型推理效果，并附有

rundreamsFly

739人浏览 · 2025-06-04 10:31:27

rundreamsFly · 2025-06-04 10:31:27 发布

前置条件

docker、docker-compose安装教程
https://blog.csdn.net/u010800804/article/details/141754183
git-lfs 安装教程
https://blog.csdn.net/u010800804/article/details/146534351

vLLM镜像拉取

拉取 vLLM 0.9.0版本：

docker pull crpi-33mr80vehc50lqh8.cn-chengdu.personal.cr.aliyuncs.com/yunxinai/vllm-openai:v0.9.0

可以看到，速度还是非常快的

模型下载

基于git-lfs下载完整的模型文件
https://modelscope.cn/models/Qwen/Qwen3-30B-A3B/files
git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen3-30B-A3B.git
模型文件大小差不多60G左右

模型部署

yaml文件编写

services:
  vllm:
    container_name: vllm
    restart: no
    image: crpi-33mr80vehc50lqh8.cn-chengdu.personal.cr.aliyuncs.com/yunxinai/vllm-openai:v0.9.0
    ipc: host
    volumes:
      - /data/vllm:/models
    command: ["--model", "/models/Qwen3-30B-A3B",  "--served-model-name", "Qwen3_30B_A3B",  "--gpu-memory-utilization", "0.75",  "--tensor-parallel-size", "2",  "--uvicorn-log-level", "debug",  "--api-key", "EHmTL656TaTBlCnSQbpqbhG6NXDWItpo"]
    ports:
      - 30041:8000
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

command 参数信息信息参考博文：https://blog.csdn.net/qq_61897309/article/details/146996336
在yaml目录执行：docker-compose up -d

日志查看

执行查看日志命令：docker-compose logs vllm -f --tail=50

模型验证

curl -X POST "http://127.0.0.1:30041/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer EHmTL656TaTBlCnSQbpqbhG6NXDWItpo" \
  -d '{
        "model": "Qwen3_30B_A3B",
        "messages": [
            {
                "role": "user",
                "content": "一大爷带着二大爷上三大爷家里说四大爷被五大爷骗到六大爷家偷七大爷放在柜子里九大爷，谁是小偷"
            },
            {
                "role": "system",
                "content": "请帮我仔细回答问题"
            }
        ],
        "temperature": 0.5,
        "stream": false
    }'

在这里插入图片描述

关注微信公众号「云馨AI」，回复「微信」，
无论你是AI爱好者还是初学者，这里都能为你打开AI世界的大门！加入我们，与志同道合的朋友一起探索AI的无限可能，共同拥抱智能未来！

火山引擎开发者社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

超越工具，重塑核心：构建企业AI价值中枢的深度范式

企业AI应用正从"技术项目"转向"业务价值中枢"，通过构建智能能力中间层实现AI价值转化。报告提出三大核心操作：1）能力组件化，将AI封装为可复用的业务积木；2）流程自动化，实现端到端智能业务流；3）交互Agent化，打造拟人化业务伙伴。实施路径分为四阶段：价值锚定、平台构建、生态扩展和原生进化。成功关键在于组织转型，从项目制转向产品制运营，建立跨职能团队和