Skip to content

Latest commit

 

History

History
50 lines (24 loc) · 1.1 KB

CCIR_2019_基于电子病历的数据查询类问答.md

File metadata and controls

50 lines (24 loc) · 1.1 KB

比赛地址

点击这里

输入和输出

输入:自然语言描述的查询语句

输出:查询答案(两种类型:数值 或者 图谱中的资源标识符)


示例:

样例1:

输入:总共有多少个患者?

输出:304

 

样例2:

输入:同时做了磷和肌酸激酶检验的病人有哪些?

输出:peg-r:1, peg-r:29

数据分析

自然语言描述的查询语句+SPARQL+答案

使用的开源病人图谱:http://www.openkg.cn/dataset/peg,具体内容:使用**三家上海三甲医院**的电子病历数据,构建了包括**3个专科、173395个医疗事件、501335个事件时序关系以及与5313个知识库概念**链接的医疗数据集

特色分析

提供了SPARQL作为中间查询语言,提供了新的建模的可能性。

(1)基于Text2SQL的建模方案

(2)直接建立自然语言查询到图谱的映射关系(KBQA)

两种方案在工业界的问答系统中都有看到。

比赛分析

参赛人数非常少,没有看到量化结果。