本地部署AI大模型（保姆级教程）vLLM从零基础到性能优化，看这一篇就够了！

在云服务器的数据盘里，新建一个“LLM”文件夹，专门用来存放模型，同时，在根目录下，新建一个“download.py”文件，将刚刚复制的代码复制进去，这里需要注意的是，model_dir里，是直接缓存到云服务器上，我们后面需要使用该模型，所以在模型后面增加一个“catch_dir”，制定下载路径，这里我把模型下载到我刚刚新建的LLM文件夹下。这里需要注意的是，python文件里的端口号需要改成vl

程序员维他命

1215人浏览 · 2025-08-16 10:56:01

程序员维他命 · 2025-08-16 10:56:01 发布

目前开源大模型的一大优势就是，它可以本地化部署，只要你的显卡硬件配置能满足要求，你可以在自己的本地部署属于自己的大模型，不用担心数据泄露等问题。下面康师傅将从部署设备、部署架构、部署模型，带大家初步尝试AI大模型的本地化部署，本篇以VLLM为例进行介绍。

1.部署设备

AI大模型的部署环境其实比较复杂，比如Anaconda、CUDA、CUDNN、pytorch、python等各种环境，，配置起来很容易出错，如果在自己的电脑上进行配置，会有各种报错，同时会影响你自己电脑的使用。这里康师傅建议各位尝试租赁使用云服务器，推荐两种方式：

1.1阿里、腾讯等云服务器

大品牌，价格也不贵，根据不同的模型部署框架，根据它的安装要求，进行云服务器环境配置，如下图所示：

但这种有一些不太方便的，这些云服务器配置起来也不方便，得从头到尾配置一遍，而且他最低也是以“天”为单位，对我们初始学习来说，太贵了。

1.2AutoDL算力云服务器

这个服务器本人强烈推荐，最适合小白刚开始上手的时候练习了。一方面价格便宜，4090的显卡（此处建议大家直接选择4090，因为现在很多框架对算力的要求都提升了，不如直接选个4090），租赁一小时只需要2.4元；

另一方面，他可以帮你配置好大模型正常需要的环境配置，如pytorch、python、CUDA等，如下图所示：

选择好按量计费-基础环境后，点击创建开机后，即可使用该服务器。

1.3远程连接VS code

选择好云服务器后，为了方便我们后面使用python代码编写和项目管理，我们使用vs-code，其提供了有图形界面的远程开发环境-SSH，同时提供接口转发功能，适合开发经验为0的小白使用，点击下载即可。

安装好后，需要进行2步操作：

安装中文包

在扩展里搜索“Chinese”，选择搜索项的第一个，安装后软件将自动显示为简体中文模式。

安装远程服务

vscode有一个很大的便捷是，提供了SSH，让远程连接百年的更加简洁，特别是针对小白。在扩展项里搜索“Remote”，点击安装后，首页会出现“远程资源管理器”入口。

点击“远程资源管理器”，出现管理界面，然后点击“+”添加完成服务器，在SSH连接命令中，输入刚刚AutoDL中租赁服务器的登录指令，复制后粘贴。

选择本机中的config配置文件

右下角点击连接

输入AutoDL租赁服务器中的密码，回车进入

点击“打开文件夹”输入“root”，进入服务器根目录

进入，可以看到当前的服务器概况介绍，这里说数据盘为“/root/autodl-tmp”，建议大家后续实操的时候，将数据文件放在这个目录下面。这个时候服务器基本就配置好了。

2.部署架构

前面讲过，目前AI大模型的主要部署框架有3个：ollama、vllm、lmdeploy。ollama主要是针对个人用户，这里康师傅就不演示了，有兴趣的同学可以自己搜索了部署试一试。我这里就先演示vllm和lmdeploy两种。

2.1vllm中文文档

我们使用某一个部署框架时，一定要先去看它的中文文档，比如vllm，一般直接搜索“vllm中文文档”，点击进入后可以查看部署要求和运行方法。

2.2创建虚拟环境

每个大模型部署框架所需要的环境配置不一样，因此针对每个大模型框架，建议对应的创建一个虚拟环境，python版本选择3.12.我这里使用命令创建一个名为“vllm”的虚拟环境：conda create -n vllm python=3.12 -y。

查看配置环境：conda env list，用该命令查看虚拟环境是否配置好。这里可以看到，除了base环境，我还有一个vllm虚拟环境。

激活虚拟环境：source activate vllm，此时的环境变换为“vllm”

2.3配置vllm

如果是NVIDIA的GPU，那么可以直接使用pip来进行安装，输入命令“pip install vllm”。下载的东西比较多，大概需要10-20min，过程如图所示：

安装vllm后，界面如下图所示，warning可以忽略

3.部署模型

开源模型有2个下载的地方，一个为国外的huggingface平台，上面的模型很全，国外模型的更新速度也很快，但是国内没有访问权限，需要科学上网；另一个就是国内的魔搭社区，是国内阿里巴巴推出的开源AI模型社区，这里面主流的模型也有，我这里以魔搭社区-DeepSeek1.5B模型为例：

3.1安装modelscope

安装魔搭社区里的模型，首先需要魔搭社区的modelscope，直接在终端输入命令：pip install modelscope

下载成功后如图所示：

3.2选择对应的模型，进行SDK下载

这里以DeepSeek1.5B模型为例，在魔搭社区的模型库里搜索“DeepSeek”，选择其中的1.5B模型，点击后进入模型下载页面，选择SDK下载，复制其中的代码：

选择SDK下载模式，复制其中的代码：

保存download.py文件，cd进入该文件所在目录，执行该py文件，在命令行输入“pip download.py”，则开始下载刚刚选择的DeepSeek1.5B模型。这里需要注意的是，魔搭社区里，模型下载完成后，他的successfully提示不是在最下面，而是在中间，如果有Download model 'deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B' successfully提示，则该模型下载完成。

点击LLM文件夹，可以看到有2个AI文件，这两个模型文件一模一样，使用其中一个就行。

3.3运行模型

模型下载后，可以利用vllm模型部署框架加载并运行模型。vllm里面模型的运行比较简单，就是vllm serve 模型的绝对路径。我这里就是“vllm serve /root/autodl-tmp/.autodl/LLM/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B”，此时可以看到，模型已经后台开始运行，本地的端口号为8000.

此时，新建一个终端，通过一个多轮对话的python文件，调用这个DeepSeek1.5B模型，具体命令为python run 文件名称。

这里需要注意的是，python文件里的端口号需要改成vllm里的8000，另一个，虽然本地模型其实是没有apikey的，但是框架是要求必须有，所以这里随便写一个就行。

文件调用成功后，输入你的文件，大模型会给你它的think过程以及最后的输出结果：

如图所示，这里我问他请介绍下他自己，大模型给了我具体的思考过程以及最终的回答。

以上，就是以vllm部署框架的大模型调用，其实也比较简单，大家有空可以试一试，亲手操作一下，练完了，记得将autodl的云服务器关闭，要不然会一直扣费。

下一篇会以国内更常用的lmdeploy为例，介绍如何使用，它是上海人工智能实验室开发的大模型部署框架，用起来更好，效率更高，同时还是国产化架构，后面的案例会多以lmdeploy为例给大家进行介绍。

相信国产化的力量！！！

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战项目来学习。（全套教程文末领取哈）
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型，我这份资料就可以无偿分享给你学习，我国在这方面的相关人才比较紧缺，大模型行业确实也需要更多的有志之士加入进来，我也真心希望帮助大家学好这门技术，如果日后有什么学习上的问题，欢迎找我交流，有技术上面的问题，我是很愿意去帮助大家的！

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述