大模型本地部署保姆级教程！三种方法教会你如何部署~

今天分享下关于大模型本地部署的一些基础知识，做一个简单的入门，并科普相关的工具使用。

Python_chichi

1200人浏览 · 2025-07-09 19:02:27

Python_chichi · 2025-07-09 19:02:27 发布

今天分享下关于大模型本地部署的一些基础知识，做一个简单的入门，并科普相关的工具使用。

一、大模型本地部署有哪些方式

大模型本地部署，顾名思义就是把大模型部署到我们本地的笔记本或者台式机上。

由于大模型本身动辄几十亿甚至上百亿的参数，使用普通的方法去部署大模型会非常吃力。为此，研究员们开发了很多本地部署的框架的应用来帮助我们更好的进行本地部署。

按照推理使用的方式不同，可以分为两类，CPU 部署和 GPU 部署。CPU 部署主要是用 CPU 进行推理，因此需要占用大量的内存空间去存放大模型的参数。而 GPU 部署会把大模型部署到 GPU 上，由于 GPU 的价格比较昂贵，现在主流的部署框架都支持这两种方式供大家选择。

按照使用方式的不同，主要分为源码部署和应用部署。源码部署就是自行配置相关的 python 以及开发环境，这种就要求大家需要一定的编程基础才能搞懂。另外应用部署，就是使用一些厂商预先提供好的工具直接安装后进行部署使用，适合新手入门。

常见的源码部署主要有 transformers、vLLM、llama.cpp 等，而应用部署可以选择 ollama 或者 LM Studio。下面，我们将分别讲述几种不同的部署方式。

二、采用 ollama 本地部署

我们简单和大家讲解下 ollama 以及 LM Studio 两种不同应用部署的具体步骤。这两者的基本功能都比较类似，均可以支持不同大模型的本地部署，并且会优先使用 GPU 进行推理。如果没有发现 GPU，就会使用 CPU 推理，因此也会占用一部分内存。从实际使用来看，笔记本内存应该至少为 8GB 才能正常运行。

ollama 的官网：ollama.com/

直接点击下方的 Download 进行下载安装即可，安装完成后会发现一个羊驼一样的图标。

在这里插入图片描述

以 MAC 为例，在启动台可以展示这个图标就表示安装成功。点击就可以运行

在这里插入图片描述

Ollama 运行后，默认是没有 webui 界面的，想要添加 webui，需要自己安装另外的项目。比如可以安装 anythingllm，去配置好本地的端口就可以在 ui 中使用 ollama 的模型了。 anythingllm.com/download

这里，我们重点讲下命令行调用的方式。首先，是安装模型，我们如下图所示，点击网页上的 Models 页面，然后点击红框内的 llama3.1 进入到模型详情页。

在这里插入图片描述

在此页面中，我们可以看到 ollama 支持的llama3.1 的详细信息，8b 的模型大小是 4.7GB,因此至少需要 8GB 显存才能正常使用。使用 ollama run llama3.1:8b 命令就可以直接启动这个模型。如果之前没有下载，该命令还会帮我们直接下载此模型。

在这里插入图片描述

在命令行中执行 ollama list 可以看到我们现在本地存在的模型，并可以使用 run 命令将其启动。

在这里插入图片描述

Run 一个不存在的模型时，会先进行下载，然后再启动。

在这里插入图片描述

下载完成后，就会直接进入回答的窗口，可以直接输入提示词让大模型进行回答。

在这里插入图片描述

使用也比较简单，可以直接进行对话。直接在命令行输入提示词就可以，理论上电脑性能越好，输出的速度就越快。

在这里插入图片描述

输入 /bye 就可以退出这个程序。

在这里插入图片描述

LM Studio

LM Studio 功能比 ollama 更强一些，而且有 UI 界面可以直接使用，更适合新手小白。因此，更加推荐大家尝试和使用这个软件去部署本地大模型。

官网：lmstudio.ai/ 同样，找到对应的版本，直接下载就可以了。

在这里插入图片描述

下载完成后同样会显示一个图标，直接点开登录就可以。

在这里插入图片描述

登录之后，会看到下面这个界面，然后在搜索的地方，可以搜索你喜欢的模型。

在这里插入图片描述

我们以 llama3.1 为例，去使用这个搜索功能。在搜索框中输入 llama3.1，然后点击 Go 按钮。

在这里插入图片描述

LM Studio 会搜索网上的资源，并进行展示。左侧是它搜索出来的所有 llama 3.1 相关的资源，我们可以任意点击一个进去查看更详细的信息。点击之后，会出现右侧所示的内容，可以看到不同版本的模型供我们下载。

在这里插入图片描述

其中，提示语显示为绿色的就是我们电脑支持的模型大小，可以随便下载。而蓝色的则表示，使用时速度会受一些影响，红色的则表示当前模型在我们电脑上无法运行。大家根据实际情况，下载适合自己电脑的版本就可以了。下载完模型后，可以点击左侧红色框的地方，进行和大模型的对话。在上面红色框的地方，可以加载现在安装到你本地的模型。

在这里插入图片描述