[发明专利]支持异构信息集成的乳腺钼靶报告语义树模型建立方法在审
| 申请号: | 201910256713.7 | 申请日: | 2019-04-01 |
| 公开(公告)号: | CN110085290A | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 李继云;孙莉;黄鹏;顾莹莹;李凯华;乐嘉锦 | 申请(专利权)人: | 东华大学 |
| 主分类号: | G16H15/00 | 分类号: | G16H15/00;G06F16/31;G06F16/34;G06F16/36 |
| 代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
| 地址: | 201600 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本描述 语义树 乳腺钼靶 异构信息 钼靶影像 乳腺癌 模型建立 数据库 文本 短语 语义 实时获取 文本信息 语义信息 语义约束 规范化 结构化 构建 表现 医生 | ||
本发明涉及一种支持异构信息集成的乳腺钼靶报告语义树模型建立方法,其特征在于,包括以下步骤:形成乳腺癌钼靶影像表现文本描述的文本规范化数据库;实时获取乳腺癌钼靶影像表现的文本描述,根据语义信息基于文本规范化数据库对文本描述进行短语的划分;获得实体的语义约束;形成文本描述的语义树。本发明通过构建乳腺钼靶语义树的方式实现将来自不同医院的、不同医生的、复杂的乳腺癌钼靶影像的文本信息结构化,实现异构信息的基于语义的集成。
技术领域
本发明涉及一种支持异构信息集成的乳腺钼靶报告语义树模型建立方法,属于医学文本结构化处理领域。
背景技术
随着医疗信息化的高速发展,目前80%的医院已经完成了信息化服务建设。如今电子病历也已经代替了纸质病历,但不变的是患者的诊断报告仍旧是根据医生的知识以及工作经验借助自然语言对相关部位非结构化的描述,可自然语言却是计算机不能直接识别与处理的。
文本结构化处理作为人工智能在医疗领域发展的关键,MedLEE(MedicalLanguage Extraction and Encoding System)、UMLS(The Unified Medical LanguageSystem)等国外的自然语言处理系统已经很完善,但由于中文与英文在语义、语法结构上的巨大差异,对中文医学文本的可移植性较差。国内对医学文本结构化的研究起步较晚,借鉴了国外已有的技术也取得了许多突破性的进展,但对于乳腺钼靶影像诊断报告文本结构化的研究尚少。
发明内容
本发明的目的是:提供一种乳腺钼靶影像诊断报告文本结构化处理方法。
为了达到上述目的,本发明的技术方案是提供了一种支持异构信息集成的乳腺钼靶报告语义树模型建立方法,其特征在于,包括以下步骤:
步骤1、根据专家规则形成乳腺癌钼靶影像表现文本描述的文本规范化数据库,文本规范化数据库中存储有与乳腺癌钼靶影像表现文本描述相关的符合现行医学术语规范的短语;
步骤2、实时获取乳腺癌钼靶影像表现的文本描述,根据语义信息基于文本规范化数据库对文本描述进行短语的划分并且将不需要的冗余信息去除,提取与乳腺癌诊断相关的描述,划分各个实体的范围,其中,利用病灶的分类结果,将每一个病变作为一个实体;
步骤3、获得实体的语义约束;
步骤4、形成步骤2获得的文本描述的语义树,语义树的根节点为实体,语义树的内部节点是实体的每个属性,叶子节点为每个属性对应的属性描述。
优选地,还包括步骤5:对上一步获得的语义树进行可视化展示。
本发明通过构建乳腺钼靶语义树的方式实现将来自不同医院的、不同医生的、复杂的乳腺癌钼靶影像的文本信息结构化,实现异构信息的基于语义的集成。
附图说明
图1为中文乳腺钼靶影像表现文本语义树构建流程图,主要过程如下:输入待处理的乳腺钼靶影像文本;对文本进行分词;根据文本特点找出语义树的主要节点,并且利用其语义约束找到其叶子节点;根据输入顺序将语义树的节点挂上叶子节点,完成对该语义树的扫描。
图2中文乳腺钼靶影像表现的文本分词样例,选取了一条乳腺癌目靶影像文本描述中的一个子句,进行分词的结果,从分词的结果,在不考虑省略的情况下,可以看出中文乳腺钼靶影像表现文本中一个子句的句法结构可以概括为位置+主语+谓词+不同属性描述。利用这样的结构可以快速找到对应于词语的类别。
图3中文乳腺钼靶影像表现的语义树语义约束构造,是在进行了分词的基础上,将对于实体的相关描述根据其特点进行归类的结果。主要是利用词语的词性特点以及利用专家规则所构建的数据库中所存放的词语,对每一关键词语都赋予一个类别。将不需要的冗余词语丢弃。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910256713.7/2.html,转载请声明来源钻瓜专利网。





