功能概述
3Chat Agent 的知识库功能允许您将多种格式的文件上传至系统,并通过指定的检索模式和配置进行智能检索。您可以自定义语言、过滤内容、设置召回条数等,以优化查询结果的精准度和相关性。
通过高效的知识库管理,您能够确保智能体获得准确且更新的知识,提升客户支持效率和响应质量。
快速操作指南
1.进入功能页面
登录到 3Chat Agent 管理后台。
有两个入口:
在导航栏中,选择 3Chat Agent → 知识库,进入知识库管理页面。
在导航栏中,选择 知识库 → 知识内容,进入知识库管理页面。
2. 添加知识库
首次进入知识库页面,无内容。点击知识列表右上角的 “添加” 按钮,来添加您的第一个知识文档。
2.1 上传文件
- 如果您已有本地知识文件,可在知识库页面,点击 “添加” 按钮,弹出文件上传框。
- 点击上传或拖拽您希望上传的文件,支持多种文件格式,包括:
- TXT、Markdown、CSV、JSON、DOCX、XLSX、XLS、PDF、HTML
2.2 爬取在线网站
- 如果您的知识存储在在线网站中,点击“添加”按钮后,选择“在线网站”。
- 输入待爬取网站的链接,并点击“下一步”
- 勾选需要爬取的子页面,点击“下一步”,进入到配置分段策略环节。
2.3 配置分段策略
1. 上传文件后,点击“下一步”,可配置知识库分段策略。
-
分段说明(文件预处理)
- 为保证解析效果,如果您上传扫描件,请提前去除扫描件水印。
- 如果您上传的知识里有表格,请确保表格是xlsx或xls格式。
- 如果您选择按层级分段,请提前明确文档内容的标题层级。
-
解析图片元素
如果上传文件中包含图片,推荐开启按钮,让大模型理解图片内容。 -
解析扫描件
如果上传文件中包含扫描件,推荐开启按钮,后台将把扫描件转换为大模型理解的文字/图片。 -
指定语言
选择文件内容的语言,以确保后续检索时使用正确的语言模型。支持多种语言。 -
替换空格、换行符和制表符
选择是否开启自动替换文件中的空格、换行符与制表符,以便更好地适应搜索引擎。 -
删除 URL 和邮件
开启此功能可自动删除文件中的 URL 和邮箱地址,防止敏感信息泄露。 -
分段方式
- 为了让大模型检索知识库更加准确和精准,需要对上传的知识进行切分,即知识分段。
- 按层级分段,是指根据文件内部的层级结构做切分。
- 分段层级:越多,单个切片内容会越零碎。
- 保留层级信息:推荐勾选,分段完成后,您可看到切片所属的层级,便于检查切片效果。
- 总体配置较为简单,效果更稳定,对于小白友好,因此推荐使用按层级分段。
- 自定义分段中,用户对参数的配置的自由度较高。
- 分段标识符:模型分段的节点,如果是\n\n,模型每识别到双换行便会进行一次分段。
- 分段最大长度:单位是token。
- 分段重叠度:自定义前后两个分段的重叠长度,分段重叠度越高,切片的上下文关联性会越强。
- 总体配置更复杂,为达到良好效果,需要精确控制。
2. 完成设置后:
- 点击 “确定” → 文件成功添加到知识列表
- 点击 “取消” → 返回到知识列表页面
2.4 配置检索策略
- 检索模式
选择检索方式(语义检索、全文检索或混合检索),优化结果匹配。- 语义检索:基于语义理解来进行查询,理解查询背后的意思。
- 全文检索:逐字匹配查询词汇,结果依赖输入的准确性。
- 混合检索:结合语义和全文检索,兼顾理解和精确度。
- 重排序
决定是否在返回结果时对召回条目进行重排序,以保证最相关的答案排在前面。 - 召回条数设置
设置每次查询时召回的最大条目数(范围 5-20)。
- 召回条数说明
- 召回条数越多
- 优点:覆盖面广、灵活性高
- 缺点:信息冗余、排序复杂、系统压力大
- 召回条数越少
- 优点:精准度高、响应速度快
- 缺点:覆盖不足、可能遗漏关键信息
- 总结:召回条数需要在 全面性 和 精确性 之间取得平衡。
- 召回条数越多
3. 列表管理
在知识库页面,您可以管理通过上传文件解析的知识内容列表:
3.1 筛选
- 可按知识名称、文件类型、解析状态、创建时间、更新时间进行筛选。
- 知识名称:上传的文件名,不允许重复。
- 文件类型:支持 DOCX、XLSX、MDX、TXT、Markdown、PDF、CSV、HTML、XLS、unknown
- 解析状态:解析中、排队中、上传中、已完成
- 创建时间:支持区间筛选(最长 1 个月)
- 更新时间:支持区间筛选(最长 1 个月)
3.2 添加视图
- 可根据需求创建不同的视图,通过设置条件精确显示文件。
- 点击列表顶部 “+” 来添加视图。
3.3 下载
- 点击可下载当前文件。
3.4 查看详情
- 点击“更多”里的“详情”,可查看知识分段的详情。
- 在知识详情界面,您可以:
- 查看、编辑分段:
- 鼠标悬浮在分段上,右上角会出现编辑入口
- 从左到右依次为:编辑分段,向上增加空白分段,向下增加空白分段,删除分段
- 查看、编辑分段:
- 调整解析配置
- 如果您对知识分段的结果不满意,点击“调整解析配置”,可以重新配置分段策略,完成后将覆盖当前内容。
- 删除知识
- 点击右上角的“删除”按钮,点击“确定”,即可删除当前知识。
3.5 删除
点击“更多”里的“删除”,弹窗点击“确认”,即可删除当前知识。
常见问题解答(FAQ)
- 支持哪些文件格式上传?
- TXT、Markdown、PDF、HTML、XLSX、DOCX、CSV、JSON 等。
- 如何选择合适的检索模式?
- 语义检索 → 关注内容含义
- 全文检索 → 精确匹配文字
- 混合检索 → 兼顾理解和精确
- 什么是召回条数设置?
- 决定查询返回的结果数量,需在“全面性”与“精准度”间权衡。
- 如何保证上传的文件能被正确理解?
- 上传时选择正确语言
- 配置空格替换、URL/邮箱删除等选项
结语
3Chat Agent 知识库功能为您提供了一个 高效、灵活 的方式来管理和查询企业的知识内容。
通过 文件上传、自定义配置、灵活检索模式,您可以最大化提升查询结果的精准性与效率。
如有任何问题或建议,请随时联系我们,我们将持续为您提供支持与改进!



















