Skip to content

常见问题

Yvette Han edited this page Jun 18, 2021 · 4 revisions

Q: 为什么服务器无法访问

A: 这有可能是由于服务器磁盘空间被占用太多所导致的,当磁盘空间占用率超过85%时,k8s可能会停止工作。 请适当清理磁盘中的文件,以便获得更高效的处理。 (通过修改kubelet的参数可以设置对应的限制,详见对应文档

Q:为何检索结果会返回多个 docid相同,uid不同的数据呢?

A: 这是由于我们使用了chunk_mode(分块模式),对于长段落,我们需要将该段落分块成多个句子

例如,当我们在 mongodb 中有如下一个数据:

{"_id":1, "context":"sent1 sent2 sent3 sent4", "title":"title1"}

当我们在“content”上使用分块时,我们会得到这样的数据

{"context":"sent1,"title":"title1","_id":1}
{"context":"sent2,"title":"title1","_id":1}
{"context":"sent3,"title":"title1","_id":1}
{"context":"sent4,"title":"title1","_id":1}

这就是为什么您可以在 mongodb 中看到与 _id 相同的 doc_id

您可以找到在这里找到如何根据参数准确划分句子