Python Kùzu：高效嵌入式图数据库指南

Kùzu（Kuzu）是一个嵌入式图数据库，专为Python生态中的高性能图查询和分析设计。它支持属性图模型、ACID事务和Cypher查询语法，并具备向量搜索功能。作为嵌入式数据库，Kùzu无需单独部署，可直接集成到应用中。其核心优势包括高性能图分析、混合图与向量查询能力、多语言支持和ACID事务保证。适用于知识图谱、语义检索、推荐系统等场景，但存在内存消耗较大、生态尚不成熟等局限。Python中

言之。

13137人浏览 · 2025-10-11 11:09:40

言之。 · 2025-10-11 11:09:40 发布

“Python Kùzu”（通常简称 Kùzu / Kuzu）是一个嵌入式图数据库（embedded graph database），其设计目标是在 Python 生态中支持高性能的图查询和分析。下面是对其主要特性、使用方式、适用场景及优劣势的一个较为全面的介绍。

https://python.langchain.ac.cn/docs/integrations/providers/kuzu/

在这里插入图片描述

一、什么是 Kùzu / Kuzu

Kùzu 是一个基于属性图（property graph / labelled property graph）模型的数据库，支持节点（node）、关系（relation / edge）以及节点／关系上的属性（properties）。 (GitHub)
它是 嵌入式 的，也就是说，在大多数使用场景中你可以把它像一个库（library）那样内嵌到程序里使用，而不必单独部署服务器。 (PyPI)
它支持 ACID 事务、图查询语言（主要是 Cypher 语法）和向量搜索（vector search / similarity search）等功能。 (cu-dbmi.github.io)
在 Python 生态中，Kùzu 提供官方的 Python 绑定 / API，使得 Python 程序可以直接操作嵌入式图数据库。 (docs.kuzudb.com)

Kùzu 的定位可以理解为：在需要图结构数据（节点/关系/属性）且要在应用内部高效查询与分析时，提供一种比传统关系型数据库或图数据库（如 Neo4j、TigerGraph 等）更轻量、更集成的解决方案。

二、Python 中如何使用 Kùzu

下面是使用 Kùzu 在 Python 中操作的关键步骤与示例：

安装

可以通过 pip 安装：

pip install kuzu

(api-docs.kuzudb.com)

基本用法

以下是一个最基础的示例流程：

import kuzu

def main():
    # 创建或打开一个 on-disk 数据库（文件存储）
    db = kuzu.Database("example.kuzu")
    conn = kuzu.Connection(db)

    # 创建节点表（Node Table）、关系表（Rel Table）
    conn.execute("CREATE NODE TABLE User(name STRING PRIMARY KEY, age INT64)")
    conn.execute("CREATE NODE TABLE City(name STRING PRIMARY KEY, population INT64)")
    conn.execute("CREATE REL TABLE LivesIn(FROM User TO City)")

    # 导入数据
    conn.execute('COPY User FROM "user.csv"')
    conn.execute('COPY City FROM "city.csv"')
    conn.execute('COPY LivesIn FROM "lives-in.csv"')

    # 执行图查询（使用 Cypher 风格语法）
    result = conn.execute("""
        MATCH (u:User)-[r:LivesIn]->(c:City)
        RETURN u.name, c.name
    """)
    for row in result:
        print(row)

if __name__ == "__main__":
    main()

你可以使用 kuzu.Database(...) 创建／打开数据库，并通过 kuzu.Connection 获取连接对象。 (docs.kuzudb.com)
conn.execute(...) 用于执行 DDL、导入、查询语句等。 (docs.kuzudb.com)
查询语句支持类似 Cypher 的语法，比如 MATCH (u)-[r]->(v)。 (docs.kuzudb.com)
除了同步 API（sync），Kùzu 也提供异步 API（async）以支持异步编程场景。 (docs.kuzudb.com)

此外，Kùzu 在 Python 生态中也被用于与图数据科学 / 知识图谱 / 向量检索等任务结合。例如在 LlamaIndex、LangChain 等框架里，可以把 Kùzu 作为后端图存储 / 向量检索组件来使用。(LangChain)

三、Kùzu 的核心特性与优势

下面总结 Kùzu 的一些亮点，以及在使用中可能带来好处：

优势 / 特点

嵌入式与零部署成本
不需要启动单独的数据库服务器，把 Kùzu 当作库来用即可，简化部署流程。
高性能与可扩展性
它被设计用于执行复杂、连接密集型（join-heavy）查询，适合进行图分析与图遍历密集的工作。(PyPI)
混合能力：图 + 向量查询
除了传统的结构化图查询，Kùzu 还支持在图结构中给节点建立向量索引，从而进行相似性检索（vector search）。这使得它在知识图谱 + 文本 / 嵌入检索融合场景下非常有吸引力。(cu-dbmi.github.io)
多语言支持
虽然你关注 Python，但 Kùzu 本身支持多个语言绑定（Python、Rust、C/C++、Java、Go 等）以适应不同的场景。(YouTube)
支持 ACID 事务
具有事务保证，使得在并发或出错时数据的完整性和一致性更有保障。(cu-dbmi.github.io)
可与图数据科学 / 知识图谱框架集成
在 Python 中，你可以把 Kùzu 与 NetworkX、PyTorch Geometric、LlamaIndex、LangChain 等一起用。演讲中也演示了如何将其与这些工具互操作。(YouTube)

局限 / 注意点

为了更客观，你也要注意以下潜在的局限：

内存 / 存储开销
虽然是嵌入式，但在处理非常大规模的图时，硬件资源（内存、磁盘）可能成为瓶颈。
成熟度 / 生态
与一些成熟的图数据库（如 Neo4j, TigerGraph, JanusGraph）相比，Kùzu 的生态（社区、插件、工具）还在成长中。
功能覆盖 vs 专业图数据库
在某些高级图处理功能（如图算法库、复杂模式匹配、分布式部署等）方面可能不如部分专用图系统丰富。
并发 / 分布式场景
由于其嵌入式的设计，Kùzu 并不是天然的分布式数据库。如果你需要跨节点分片、高可用、水平扩展等，仍需仔细考量其支持能力。