新闻公告

首页 / 新闻公告 / 中心新闻 /

新闻公告

“统计大讲堂”系列讲座第七十七讲

2019-04-24

2019年4月23日,中国人民大学统计学院“统计大讲堂”第77次报告在明德主楼1016成功举办。本次报告邀请到清华大学统计学研究中心俞声副教授,主题是“Data-driven Construction of a Medical Knowledge Graph”。统计学院教授易丹辉、张景肖、李扬,副教授尹建鑫、杨翰方、孙怡帆和王菲菲博士到场参与讨论。报告由统计学院副院长李扬主持。

俞声博士首先介绍了自己在美国从事电子病历(EHR)数据研究的经历,总结了目前国内外对电子病历的研究及应用情况,然后系统讲述了他回国后对医学知识图谱构建方面的研究。俞声老师指出,电子病历目前已经被应用到各方各面,而统计学在其中起到了至关重要的作用。电子病历可以提供给统计学家结构化数据,非结构化数据以及影像数据,其中含有自由文本的非结构化数据是最难处理但最有研究价值的。

俞声博士以肺栓塞患者的电子病历文本信息为例,详细讲解了如何进行语义判断以及通过语义判断整合文本信息的方法,并向大家介绍了他参与PheNorm项目的经历。PheNorm是一种从电子病历里直接提取患者信息并从电子病历里鉴定特定患者是否确定性得过某种特定疾病的技术。俞声博士指出在自然语言处理在面对中文医疗文本的关键问题:缺少现成优质的术语数据库、实际中需要处理很多不规范的术语表达、对于医疗文本的分词不够完备。针对上述问题,俞声博士介绍了基于图分割的分词方法,并用解放军总医院影像标注示例展示了该方法的优良效果。

报告的最后,俞声博士就相关热点问题与现场师生进行互动,并围绕报告内容在基因测序、中医文本分析等领域的拓展展开探讨。