向量知识库
功能简介
向量知识库是 HAP 平台内置的语义检索基础设施。它通过将工作表记录、附件及讨论消息进行“向量化”处理,使 AI Agent 和工作流能够基于语义理解(而非简单的关键词匹配)精准获取相关知识,实现“意思相近即可搜到”的智能化体验。
应用场景:
-
员工问"怎么请假",能找到标题为"带薪休假管理办法"的记录——即使两者没有相同的关键词
-
问"合同金额上限是多少",能直接找到附件合同模板里的对应条款——附件内容同样可以被检索到
-
问"费用怎么算",能找到"计费规则说明"相关内容——不需要知道原文的准确用词
一、创建与配置流程
1.1 创建入口
应用管理员进入【应用管理】 > 【向量知识库】, 点击【+ 向量知识库】开始创建。
知识库只能使用本应用内的工作表作为知识源,一个应用下可以创建多个知识库,同一张工作表也可以被多个知识库重复引用。

1.2 选择知识源
在弹窗中选择本应用内需要向量化的工作表(支持多选)。
AI 推荐:系统会基于应用结构自动分析,并智能推荐多个知识库构建方案。可直接选择 AI 智能构建的知识源。

1.3 配置向量化字段
为每张工作表定义需要“喂给 AI”的内容:
-
支持字段: 文本、文本组合、标题字段、富文本字段、级联(单条)、关联(单条)、他表-存储类型(文本、文本组合、富文本、附件)、附件字段(支持 doc、docx、xls、xlsx、ppt、pptx、rtf、pdf、txt、csv、md )
建议: 仅勾选与业务知识相关的字段。勾选过多无关字段(如:ID、创建时间、自动编号)会增加分块消耗,并可能稀释检索的精准度。
-
记录讨论: 开启后,记录下的讨论消息及附件也将纳入向量化范围,补充业务上下文。
-
数据过滤: 设置筛选条件,仅对满足特定要求的记录进行向量化(如“状态=已发布”)。仅筛选字段仅支持使用选项、等级、检查项字段。
-
附件解析增强: 开启后,对 CSV、XLSX、DOCX、PPTX、PDF 调用视觉模型解析,提升复杂排版和表格的还原准确率。

1.4 确认创建
填写知识库名称和说明后点击【创建】按钮,系统随即开始对所选内容进行解析和分块处理。
知识库名称和说明会被 AI Agent 用于理解这个知识库"存放什么信息",建议填写得具体准确。

1.5 查看分块内容
分块完成后会有系统消息通知。您可以预览各工作表的分块结果,不同内容类型的分块策略如下:
-
记录块: 将所选字段名+字段内容拼接后切分,每块最多 3500 个字符
-
附件块: 先按段落切分,最大两层段落深度,段落块超过1000 Token 进一步分块
-
讨论块: 每条讨论消息作为独立的块存储

1.6 开始向量化
向量化不会自动开始,需要手动点击【开始向量化入库】按钮。
-
向量化入库中
使用Qwen3-Embedding-0.6B进行向量化,向量化进行中,此时不可增删工作表。可点击「取消初始化」,已向量化内容将被清空,回退到分块完成状态。
-
向量化入库完成
所有表向量化完成,系统通过左下角卡片和系统消息通知,知识库可正常检索。

二、知识库管理
2.1 知识库管理
支持对知识库进行修改名称、复制 ID、重置删除知识库等常规操作外,以下两个操作需要特别说明:
-
重置知识库: 对完成向量化的知识库进行全量重建。将清空已有向量数据,重新对知识源进行解析、分块,分块完成后需要手动确认继续向量化。
-
删除知识库: 清空全部已向量化内容,不可恢复。
点击知识库名称的说明图标,可以查看知识库的使用模型、创建时间。

2.2 知识源管理
进入知识库详情后,可对各知识源进行管理:
-
添加工作表: 增加新的知识源
-
分块预览: 支持按记录、附件、记录讨论查看工作表下的分块情况。
-
调整知识源: 修改向量化字段或数据过滤条件。保存时可选择是否对已向量化数据立即生效(重新分块和向量化),默认不生效。
-
删除知识源: 清空该工作表对应的全部向量化内容

2.3 检索测试
知识库详情页提供检索测试功能,直接模拟检索效果。结果按排名展示,标注内容类型和来源信息,点击来源可直接打开原记录或原附件查看。
支持三种检索模式:
-
语义检索:基于语义相似度匹配,不依赖关键词完全一致。适合提问方式多样、用词不固定的场景,如问答、知识查询。
-
关键词检索 :基于全文检索,要求词语精确匹配。适合查找特定编号、专有名词、术语等场景。
-
混合检索:结合语义和关键词两种方式综合排序,兼顾语义理解和精确匹配,适合大多数通用场景。
各模式可调整的检索参数:
-
召回数量(Top K):返回最相关的前 N 条内容片段,最大 20
-
最低相关度(语义检索专用):低于该阈值的结果不返回,范围 0~1

2.4 数据自动同步
工作表中的记录新增、修改、删除后,对应的知识库内容会自动更新,无需手动操作。
注意:应用的导出、导入、复制、导入升级、备份还原同步不会同步知识库配置。
三、使用知识库
3.1 知识库检索节点
1.在工作流中添加【知识库检索】节点查询知识库内容。

-
选择知识库
可跨应用选择多个知识库,按需选择。
-
内容类型
默认检索所有内容(记录、记录讨论、记录附件、讨论附件),可选择限制检索的内容类型。
-
检索策略与参数
支持语义检索、关键词检索、混合检索三种模式,各模式的适用场景和可配置参数参见「检索测试」章节。
-
输出结果
检索节点执行后,将输出一个对象数组,每条数据包含以下关键信息:
- 内容片段: 命中分块的具体文本内容。
- 来源信息: 包含所属知识库、工作表名称、具体记录 ID 或附件名称。
- 检索得分: 反映内容与查询词的相关性,分数越高匹配度越高。
2.后续节点使用
检索到的结果(数组类型)可灵活用于以下操作:
- 赋值给字段: 将最相关的知识片段写入工作表字段,用于沉淀或展示。
- 配合 AI Agent 节点: 将检索结果作为 Agent 的“外部知识”,实现基于私有知识库的精准问答、方案总结或工单处理。
- 逻辑分支: 根据检索得分或是否命中结果,触发不同的自动化分支流程。
小技巧: 建议先在“检索测试”中调优参数,再将确认后的参数填入工作流节点,以获得最佳的自动化效果。

3.2 在 AI Agent 节点
AI Agent 节点通过【知识库检索】工具,可以在执行任务过程中可查询知识库内容。支持跨应用查询多个知识库。
检索工具支持两种配置模式:
• AI 智能选择: 在每次检索知识库时,由 Agent 自主判断检索策略和参数
• 自定义: 手动配置检索策略和参数。

四、授权与计费
4.1 各版本赠送配额
向量知识库功能仅限付费版使用。各版本随订阅周期赠送的基础配额如下:
| 版本类型 | 赠送分块配额 | 功能说明 |
|---|---|---|
| 免费版 | 不支持 | - |
| 标准版 | 10 万 块 | 满足基础业务知识检索 |
| 专 业版 | 20 万 块 | 适合中等规模知识库构建 |
| 旗舰版 | 50 万 块 | 支撑大规模、多场景 AI 应用 |
注:向量分块是知识库的计量单位。工作表中的记录、附件、讨论消息经过解析和切分后,每一个片段算作一个分块。分块数量取决于知识库中的数据量和分块类型。
4.2 用量与增购
-
查看用量
在【组织管理】 - 【首页】 - 【组织额度】中可查看:
-
已创建知识库个数
-
向量分块当前用量,并提供【扩容】入口

-
-
增购扩容:
赠送配额用完后,可在组织管理后台购买分块扩充包。
-
定价:100 元 / 1 万块 × 年
-
有效期:与当前订阅周期一致,版本到期时同步失效

-
-
用量超限
全组织分块用量超出配额后:
-
已有知识库内容仍可正常检索,不受影响
-
增量数据停止向量化,不再同步至知识库
-
创建知识库、新增知识源工作表等操作被限制
-
用量达到 80%、95%、100% 时,系统会向组织管理员推送系统消息和短信提醒
-
-
订阅到期:
- 知识库相关功能全部不可用(包括新建知识库、检索、工作流节点等)
- 已有知识库数据保留 30 天,30 天后自动清空