测试集测出回答为poor后怎么改进?

如图,利用测试集测出问题(这些FAQ都是用excel上传的,AI未引用正确),应该如何在后台改进?

“测试集”是用于让业务人员评判agent的表现。至于改进措施,需要具体来看。 根据你这个截图,看着像是要在“指导”和“知识库”做优化。 对于POOR的原因,是觉得回复不够全面吗? 可以把相应的知识库和“指导”配置贴进来,我们来给你一些建议。

截图里的内容是使用错误了。比如说,我发的excel约等于是Q1-A1,Q2-A2。

上图的问题就是:我测试Q1的回答,他回答了A2。张冠李戴了…………

还有一个问题是,如下图。我测试Q2的回答,他差不多回答Q2,但是AI自己改写了,但是删去了一些重要内容,没说完整。
想知道这两个问题分别怎么解决?

AI回答的其实没问题,从知识库来看,知识库本身重复的比较多,判断下来当问“MBA项目怎么申请”,正常回复申请流程。不会回复介绍MBA的内容