跳到主要内容

向量知识库


功能简介

向量知识库是 HAP 平台内置的语义检索基础设施。它通过将工作表记录、附件及讨论消息进行“向量化”处理,使 AI Agent 和工作流能够基于语义理解(而非简单的关键词匹配)精准获取相关知识,实现“意思相近即可搜到”的智能化体验。

应用场景:

  • 员工问"怎么请假",能找到标题为"带薪休假管理办法"的记录——即使两者没有相同的关键词

  • 问"合同金额上限是多少",能直接找到附件合同模板里的对应条款——附件内容同样可以被检索到

  • 问"费用怎么算",能找到"计费规则说明"相关内容——不需要知道原文的准确用词

一、创建与配置流程

1.1 创建入口

应用管理员进入【应用管理】 > 【向量知识库】, 点击【+ 向量知识库】开始创建。

知识库只能使用本应用内的工作表作为知识源,一个应用下可以创建多个知识库,同一张工作表也可以被多个知识库重复引用。

1.2 选择知识源

在弹窗中选择本应用内需要向量化的工作表(支持多选)。

AI 推荐:系统会基于应用结构自动分析,并智能推荐多个知识库构建方案。可直接选择 AI 智能构建的知识源。

1.3 配置向量化字段

为每张工作表定义需要“喂给 AI”的内容:

  • 支持字段: 文本、文本组合、标题字段、富文本字段、级联(单条)、关联(单条)、他表-存储类型(文本、文本组合、富文本、附件)、附件字段(支持 doc、docx、xls、xlsx、ppt、pptx、rtf、pdf、txt、csv、md )

    建议: 仅勾选与业务知识相关的字段。勾选过多无关字段(如:ID、创建时间、自动编号)会增加分块消耗,并可能稀释检索的精准度。

  • 记录讨论: 开启后,记录下的讨论消息及附件也将纳入向量化范围,补充业务上下文。

  • 数据过滤: 设置筛选条件,仅对满足特定要求的记录进行向量化(如“状态=已发布”)。仅筛选字段仅支持使用选项、等级、检查项字段。

  • 附件解析增强: 开启后,对 CSV、XLSX、DOCX、PPTX、PDF 调用视觉模型解析,提升复杂排版和表格的还原准确率。

1.4 确认创建

填写知识库名称和说明后点击【创建】按钮,系统随即开始对所选内容进行解析和分块处理。

知识库名称和说明会被 AI Agent 用于理解这个知识库"存放什么信息",建议填写得具体准确。

1.5 查看分块内容

分块完成后会有系统消息通知。您可以预览各工作表的分块结果,不同内容类型的分块策略如下:

  • 记录块: 将所选字段名+字段内容拼接后切分,每块最多 3500 个字符

  • 附件块: 先按段落切分,最大两层段落深度,段落块超过1000 Token 进一步分块

  • 讨论块: 每条讨论消息作为独立的块存储

1.6 开始向量化

向量化不会自动开始,需要手动点击【开始向量化入库】按钮。

  • 向量化入库中

    使用Qwen3-Embedding-0.6B进行向量化,向量化进行中,此时不可增删工作表。可点击「取消初始化」,已向量化内容将被清空,回退到分块完成状态。

  • 向量化入库完成

    所有表向量化完成,系统通过左下角卡片和系统消息通知,知识库可正常检索。

二、知识库管理

2.1 知识库管理

支持对知识库进行修改名称、复制 ID、重置删除知识库等常规操作外,以下两个操作需要特别说明:

  • 重置知识库: 对完成向量化的知识库进行全量重建。将清空已有向量数据,重新对知识源进行解析、分块,分块完成后需要手动确认继续向量化。

  • 删除知识库: 清空全部已向量化内容,不可恢复。

点击知识库名称的说明图标,可以查看知识库的使用模型、创建时间。

2.2 知识源管理

进入知识库详情后,可对各知识源进行管理:

  • 添加工作表: 增加新的知识源

  • 分块预览: 支持按记录、附件、记录讨论查看工作表下的分块情况。

  • 调整知识源: 修改向量化字段或数据过滤条件。保存时可选择是否对已向量化数据立即生效(重新分块和向量化),默认不生效。

  • 删除知识源: 清空该工作表对应的全部向量化内容

2.3 检索测试

知识库详情页提供检索测试功能,直接模拟检索效果。结果按排名展示,标注内容类型和来源信息,点击来源可直接打开原记录或原附件查看。

支持三种检索模式:

  • 语义检索:基于语义相似度匹配,不依赖关键词完全一致。适合提问方式多样、用词不固定的场景,如问答、知识查询。

  • 关键词检索:基于全文检索,要求词语精确匹配。适合查找特定编号、专有名词、术语等场景。

  • 混合检索:结合语义和关键词两种方式综合排序,兼顾语义理解和精确匹配,适合大多数通用场景。

各模式可调整的检索参数:

  • 召回数量(Top K):返回最相关的前 N 条内容片段,最大 20

  • 最低相关度(语义检索专用):低于该阈值的结果不返回,范围 0~1

2.4 数据自动同步

工作表中的记录新增、修改、删除后,对应的知识库内容会自动更新,无需手动操作。

注意:应用的导出、导入、复制、导入升级、备份还原同步不会同步知识库配置。

三、使用知识库

3.1 知识库检索节点

1.在工作流中添加【知识库检索】节点查询知识库内容。

  • 选择知识库

    可跨应用选择多个知识库,按需选择。

  • 内容类型

    默认检索所有内容(记录、记录讨论、记录附件、讨论附件),可选择限制检索的内容类型。

  • 检索策略与参数

    支持语义检索、关键词检索、混合检索三种模式,各模式的适用场景和可配置参数参见「检索测试」章节。

  • 输出结果

    检索节点执行后,将输出一个对象数组,每条数据包含以下关键信息:

    • 内容片段: 命中分块的具体文本内容。
    • 来源信息: 包含所属知识库、工作表名称、具体记录 ID 或附件名称。
    • 检索得分: 反映内容与查询词的相关性,分数越高匹配度越高。

2.后续节点使用

检索到的结果(数组类型)可灵活用于以下操作:

  • 赋值给字段: 将最相关的知识片段写入工作表字段,用于沉淀或展示。
  • 配合 AI Agent 节点: 将检索结果作为 Agent 的“外部知识”,实现基于私有知识库的精准问答、方案总结或工单处理。
  • 逻辑分支: 根据检索得分或是否命中结果,触发不同的自动化分支流程。

小技巧: 建议先在“检索测试”中调优参数,再将确认后的参数填入工作流节点,以获得最佳的自动化效果。

3.2 在 AI Agent 节点

AI Agent 节点通过【知识库检索】工具,可以在执行任务过程中可查询知识库内容。支持跨应用查询多个知识库

检索工具支持两种配置模式:

AI 智能选择: 在每次检索知识库时,由 Agent 自主判断检索策略和参数

自定义: 手动配置检索策略和参数。

四、授权与计费

4.1 各版本赠送配额

向量知识库功能仅限付费版使用。各版本随订阅周期赠送的基础配额如下:

版本类型赠送分块配额功能说明
免费版不支持-
标准版10 万满足基础业务知识检索
专业版20 万适合中等规模知识库构建
旗舰版50 万支撑大规模、多场景 AI 应用

注:向量分块是知识库的计量单位。工作表中的记录、附件、讨论消息经过解析和切分后,每一个片段算作一个分块。分块数量取决于知识库中的数据量和分块类型。

4.2 用量与增购

  1. 查看用量

    在【组织管理】 - 【首页】 - 【组织额度】中可查看:

    • 已创建知识库个数

    • 向量分块当前用量,并提供【扩容】入口

  2. 增购扩容:

    赠送配额用完后,可在组织管理后台购买分块扩充包。

    • 定价:100 元 / 1 万块 × 年

    • 有效期:与当前订阅周期一致,版本到期时同步失效

  3. 用量超限

    全组织分块用量超出配额后:

    • 已有知识库内容仍可正常检索,不受影响

    • 增量数据停止向量化,不再同步至知识库

    • 创建知识库、新增知识源工作表等操作被限制

    • 用量达到 80%、95%、100% 时,系统会向组织管理员推送系统消息和短信提醒

  4. 订阅到期:

    • 知识库相关功能全部不可用(包括新建知识库、检索、工作流节点等)
    • 已有知识库数据保留 30 天,30 天后自动清空