-
Notifications
You must be signed in to change notification settings - Fork 2
常见问题
Yvette Han edited this page Jun 18, 2021
·
4 revisions
这有可能是由于服务器磁盘空间被占用太多所导致的,当磁盘空间占用率超过85%时,k8s可能会停止工作。 请适当清理磁盘中的文件,以便获得更高效的处理。 (通过修改kubelet的参数可以设置对应的限制,详见对应文档)
这是由于我们使用了chunk_mode(分块模式),对于长段落,我们需要将该段落分块成多个句子
例如,当我们在 mongodb 中有如下一个数据:
{"_id":1, "context":"sent1 sent2 sent3 sent4", "title":"title1"}
当我们在“content”上使用分块时,我们会得到这样的数据
{"context":"sent1,"title":"title1","_id":1}
{"context":"sent2,"title":"title1","_id":1}
{"context":"sent3,"title":"title1","_id":1}
{"context":"sent4,"title":"title1","_id":1}
这就是为什么您可以在 mongodb 中看到与 _id 相同的 doc_id
您可以找到在这里找到如何根据参数准确划分句子