You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
注意结果中'超凡'单词所在的行,它被当做了一个未知词,别名是 x (并且字典那一列是空,没有匹配到可用字典)。
再来看看示例中提供的配置命令 ALTER TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH simple
其中对 只n,v,a,i,e,l 六种词做了映射,使用了simple字典。但并没有包含 x (停用词),这导致了x (停用词) 在处理时匹配不到可用的字典。可以使用select ts_token_type('zhparser') 查看有哪些类型的词
也就是说再ADD MAPPING时加上这个 x (停用词)就解决了这个问题 (不过这不固定,你得使用ts_debug确认那个没有被切分出来的词是什么类型,然后把这个加入到mapping里)。但是这样可能会引入那些不需要的词,我不确定这样做会有什么问题
不知道是因为忽略了停止词还是什么原因,会丢失结果,比如"批量处理"的分词结果只有"处理"这个词,"自动提交"的结果也只有"提交",然而在调试分词结果的网页里测试是正常的。
The text was updated successfully, but these errors were encountered: