3Chat知识库功能使用手册-操作指南

功能概述

3Chat Agent 的知识库功能允许您将多种格式的文件上传至系统,并通过指定的检索模式和配置进行智能检索。您可以自定义语言、过滤内容、设置召回条数等,以优化查询结果的精准度和相关性。
通过高效的知识库管理,您能够确保智能体获得准确且更新的知识,提升客户支持效率和响应质量。


快速操作指南

1.进入功能页面

登录到 3Chat Agent 管理后台。
有两个入口:
在导航栏中,选择 3Chat Agent → 知识库,进入知识库管理页面。

在导航栏中,选择 知识库 → 知识内容,进入知识库管理页面。


2. 添加知识库

首次进入知识库页面,无内容。点击知识列表右上角的 “添加” 按钮,来添加您的第一个知识文档。

2.1 上传文件

  1. 如果您已有本地知识文件,可在知识库页面,点击 “添加” 按钮,弹出文件上传框。

  1. 点击上传或拖拽您希望上传的文件,支持多种文件格式,包括:
  • TXT、Markdown、CSV、JSON、DOCX、XLSX、XLS、PDF、HTML

2.2 爬取在线网站

  1. 如果您的知识存储在在线网站中,点击“添加”按钮后,选择“在线网站”。

  1. 输入待爬取网站的链接,并点击“下一步”

  1. 勾选需要爬取的子页面,点击“下一步”,进入到配置分段策略环节。

2.3 配置分段策略

1. 上传文件后,点击“下一步”,可配置知识库分段策略。

  • 分段说明(文件预处理)

    • 为保证解析效果,如果您上传扫描件,请提前去除扫描件水印。
    • 如果您上传的知识里有表格,请确保表格是xlsx或xls格式。
    • 如果您选择按层级分段,请提前明确文档内容的标题层级。
  • 解析图片元素
    如果上传文件中包含图片,推荐开启按钮,让大模型理解图片内容。

  • 解析扫描件
    如果上传文件中包含扫描件,推荐开启按钮,后台将把扫描件转换为大模型理解的文字/图片。

  • 指定语言
    选择文件内容的语言,以确保后续检索时使用正确的语言模型。支持多种语言。

  • 替换空格、换行符和制表符
    选择是否开启自动替换文件中的空格、换行符与制表符,以便更好地适应搜索引擎。

  • 删除 URL 和邮件
    开启此功能可自动删除文件中的 URL 和邮箱地址,防止敏感信息泄露。

  • 分段方式

    • 为了让大模型检索知识库更加准确和精准,需要对上传的知识进行切分,即知识分段。
    • 按层级分段,是指根据文件内部的层级结构做切分。
      • 分段层级:越多,单个切片内容会越零碎。
      • 保留层级信息:推荐勾选,分段完成后,您可看到切片所属的层级,便于检查切片效果。
      • 总体配置较为简单,效果更稳定,对于小白友好,因此推荐使用按层级分段。

  • 自定义分段中,用户对参数的配置的自由度较高。
    • 分段标识符:模型分段的节点,如果是\n\n,模型每识别到双换行便会进行一次分段。
    • 分段最大长度:单位是token。
    • 分段重叠度:自定义前后两个分段的重叠长度,分段重叠度越高,切片的上下文关联性会越强。
    • 总体配置更复杂,为达到良好效果,需要精确控制。

2. 完成设置后:

  • 点击 “确定” → 文件成功添加到知识列表
  • 点击 “取消” → 返回到知识列表页面

2.4 配置检索策略

  • 检索模式
    选择检索方式(语义检索、全文检索或混合检索),优化结果匹配。
    • 语义检索:基于语义理解来进行查询,理解查询背后的意思。
    • 全文检索:逐字匹配查询词汇,结果依赖输入的准确性。
    • 混合检索:结合语义和全文检索,兼顾理解和精确度。

  • 重排序
    决定是否在返回结果时对召回条目进行重排序,以保证最相关的答案排在前面。
  • 召回条数设置
    设置每次查询时召回的最大条目数(范围 5-20)。

  • 召回条数说明
    • 召回条数越多
      • 优点:覆盖面广、灵活性高
      • 缺点:信息冗余、排序复杂、系统压力大
    • 召回条数越少
      • 优点:精准度高、响应速度快
      • 缺点:覆盖不足、可能遗漏关键信息
    • 总结:召回条数需要在 全面性 和 精确性 之间取得平衡。

3. 列表管理

在知识库页面,您可以管理通过上传文件解析的知识内容列表:

3.1 筛选

  • 可按知识名称、文件类型、解析状态、创建时间、更新时间进行筛选。

  • 知识名称:上传的文件名,不允许重复。
  • 文件类型:支持 DOCX、XLSX、MDX、TXT、Markdown、PDF、CSV、HTML、XLS、unknown
  • 解析状态:解析中、排队中、上传中、已完成
  • 创建时间:支持区间筛选(最长 1 个月)
  • 更新时间:支持区间筛选(最长 1 个月)

3.2 添加视图

  • 可根据需求创建不同的视图,通过设置条件精确显示文件。
  • 点击列表顶部 “+” 来添加视图。

3.3 下载

  • 点击可下载当前文件。

3.4 查看详情

  • 点击“更多”里的“详情”,可查看知识分段的详情。

  • 在知识详情界面,您可以:
    • 查看、编辑分段:
      • 鼠标悬浮在分段上,右上角会出现编辑入口
      • 从左到右依次为:编辑分段,向上增加空白分段,向下增加空白分段,删除分段

  • 调整解析配置
    • 如果您对知识分段的结果不满意,点击“调整解析配置”,可以重新配置分段策略,完成后将覆盖当前内容。

  • 删除知识
    • 点击右上角的“删除”按钮,点击“确定”,即可删除当前知识。

3.5 删除

点击“更多”里的“删除”,弹窗点击“确认”,即可删除当前知识。


常见问题解答(FAQ)

  1. 支持哪些文件格式上传?
  • TXT、Markdown、PDF、HTML、XLSX、DOCX、CSV、JSON 等。
  1. 如何选择合适的检索模式?
  • 语义检索 → 关注内容含义
  • 全文检索 → 精确匹配文字
  • 混合检索 → 兼顾理解和精确
  1. 什么是召回条数设置?
  • 决定查询返回的结果数量,需在“全面性”与“精准度”间权衡。
  1. 如何保证上传的文件能被正确理解?
  • 上传时选择正确语言
  • 配置空格替换、URL/邮箱删除等选项

结语

3Chat Agent 知识库功能为您提供了一个 高效、灵活 的方式来管理和查询企业的知识内容。
通过 文件上传、自定义配置、灵活检索模式,您可以最大化提升查询结果的精准性与效率。
如有任何问题或建议,请随时联系我们,我们将持续为您提供支持与改进!

1 个赞