【实战】零基础搭建Qwen-Agent：保姆级教程，带你一步步成为AI开发者！

本文介绍了Qwen-Agent的部署与应用开发流程。首先通过Python环境配置和模型部署，展示了如何调用本地Qwen文本模型（14B）和多模态模型（7B）。随后通过RAG代码示例、工具调用和多Agent路由等实际案例，演示了模型在文本处理、图像理解和任务协作等方面的能力。最后探讨了AI大模型学习的重要性，提出了分阶段学习路径（从基础应用到模型训练再到商业部署），并分享了包含提示词工程、RAG系统

我算是程序猿

1042人浏览 · 2025-08-08 14:00:26

我算是程序猿 · 2025-08-08 14:00:26 发布

一、配置环境

Pythongit clone https://github.com/QwenLM/Qwen-Agent.gitconda create --name qwen-agent python=3.12 conda activate qwen-agentcd Qwen-Agentpip install -e ./"[rag,code_interpreter,python_executor]"

二、模型部署

Qwen-Agent 既能够对接阿里云 DashScope服务所提供的 Qwen 模型服务，也支持借助 OpenAI API 的方式接入开源的 Qwen 模型服务。

鉴于我们的业务恰好是基于 Qwen 大模型开展润色工作，因此这里选择调用本地模型服务。以下是我们在 GPU 机器上部署的两个 Qwen 大模型：

# 文本模型：Qwen2.5-14B-Instructllm_cfg = {    'model': 'Qwen/Qwen2.5-14B-Instruct',    'model_server': 'http://127.0.0.1:9995/v1',    'api_key': 'EMPTY',
    'generate_cfg': {        'top_p': 0.9    }}
# 多模态模型：Qwen2-VL-7B-Instructllm_cfg_vl = {    'model': 'Qwen/Qwen2-VL-7B-Instruct',    'model_server': 'http://127.0.0.1:9993/v1',    'api_key': 'EMPTY',
    'generate_cfg': {        'top_p': 0.9    }}

三、应用开发

RAG

代码示例：

from qwen_agent.agents import Assistant# 文本模型：Qwen2.5-14B-Instructllm_cfg = {    'model': 'Qwen/Qwen2.5-14B-Instruct',    'model_server': 'http://127.0.0.1:9995/v1',    'api_key': 'EMPTY',    'generate_cfg': {        'top_p': 0.9    }}def test():    bot = Assistant(llm=llm_cfg)    messages = [{'role': 'user', 'content': [{'text': '介绍图一'}, {'file': '/home/work/lixiang29/agent/Qwen-Agent/examples/Making_Retrieval-Augmented_Language_Models_Robust_to_Irrelevant_Context.pdf'}]}]    for rsp in bot.run(messages):        print(rsp)if __name__ == '__main__':    test()

运行结果：

用户输入

模型输出

介绍图一

（下图为论文中的图1及其上下文）

图1展示了一个例子，说明检索增强如何导致Llama-2-13B模型出错。当检索到与问题无关的上下文时，模型会给出错误的答案（右图），而没有检索的情况下，模型能够正确回答问题（左图）。具体来说，当被问及“谁在《General Hospital》中扮演Jason？”时，虽然模型正确答案是Steve Burton，但检索到的关于扮演Cooper的演员的信息导致模型被“分散注意力”，给出了错误的答案。

四、工具调用

import osfrom typing import Optionalfrom qwen_agent.agents import Assistantfrom qwen_agent.gui import WebUIos.environ['AMAP_TOKEN'] = '***'  # 需要去高德开放平台申请key# 文本模型：Qwen2.5-14B-Instructllm_cfg = {    'model': 'Qwen/Qwen2.5-14B-Instruct',    'model_server': 'http://127.0.0.1:9995/v1',    'api_key': 'EMPTY',    'generate_cfg': {        'top_p': 0.9    }}def init_agent_service():    system = ('你扮演一个天气预报助手，你具有查询天气和画图能力。'              '你需要查询相应地区的天气，然后调用给你的画图工具绘制一张城市的图。')

运行结果：

用户输入

模型输出

今天武汉市的天气怎么样？根据天气情况帮我绘制一张黄鹤楼的图

今天武汉市的天气是多云，29度，我绘制的图如下

Generated image

五、多Agent路由

import osfrom typing import Optionalfrom qwen_agent.agents import Assistant, ReActChat, Routerfrom qwen_agent.gui import WebUI# 文本模型：Qwen2.5-14B-Instructllm_cfg = {    'model': 'Qwen/Qwen2.5-14B-Instruct',    'model_server': 'http://127.0.0.1:9995/v1',    'api_key': 'EMPTY',    'generate_cfg': {        'top_p': 0.9    }}# 多模态模型：Qwen2-VL-7B-Instructllm_cfg_vl = {    'model': 'Qwen/Qwen2-VL-7B-Instruct',    'model_server': 'http://127.0.0.1:9993/v1',    'api_key': 'EMPTY',    'generate_cfg': {        'top_p': 0.9    }}def init_agent_service():    tools = ['image_gen', 'code_interpreter']    bot_vl = Assistant(llm=llm_cfg_vl, name='多模态助手', description='可以理解图像内容。', function_list=tools)    bot_tool = ReActChat(        llm=llm_cfg,        name='工具助手',        description='可以使用画图工具和运行代码来解决问题',        function_list=tools,    )    bot = Router(        llm=llm_cfg,        agents=[bot_vl, bot_tool],    )    return botdef app_tui():    bot = init_agent_service()    messages = []    while True:        query = input('user question: ')        image = input('image url (press enter if no image): ')        if not query:            print('user question cannot be empty！')            continue        messages.append({'role': 'user', 'content': [{'text': query}]})        if image:            messages[-1]['content'].append({'image': image})        response = []        for response in bot.run(messages):            print('bot response:', response)        messages.extend(response)if __name__ == '__main__':    app_tui()

用户输入

模型输出

告诉我这张图在描绘什么？请根据描绘编写一首诗，然后根据诗的内容重新绘制一幅抽象风格的艺术画。

路由到多模态助手

第一步借助code_interpreter工具，将图片加载进来

{'role': 'assistant', 'content': '', 'name': '多模态助手', 'function_call': {'name': 'code_interpreter', 'arguments': "py\nfrom PIL import Image\nimg = Image.open('dog_and_girl.jpeg')\nimg.show()\n"}},

第二步借助多模态模型描绘图片内容，并作一首诗

{'role': 'assistant', 'content': '这张图片描绘了一位身穿白衣的女子骑在马背上，背景是碧蓝的海洋和晴朗的天空。她高举着一顶草帽，脸上带着自信与欢快的笑容，整幅画面洋溢着自由、勇气与夏日的浪漫气息。诗歌：《海风上的骑士》海蓝如镜云如绒，烈日铺金照碧空。赤马踏沙轻似梦，白衣女子笑从容。草帽高扬迎风舞，心随潮起向天冲。一骑奔腾天地阔，自在人间最英雄。\n让我们再次描绘这张图片，但这次我希望风格是抽象艺术的。', 'name': '多模态助手'},

第三步借助image_gen工具，根据多模态生成的描述重新绘画

{'role': 'assistant', 'content': '', 'name': '多模态助手', 'function_call': {'name': 'image_gen', 'arguments': '{"prompt":"a girl and a dog in a abstract style", "resolution":"1024*1024"}'}}, {'role': 'function', 'content': '{"image_url": "https://xxx"}', 'name': 'image_gen'}

六、如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】