[发明专利]用于匹配放射报告中的医学概念的系统和方法在审
申请号: | 201980090257.1 | 申请日: | 2019-11-22 |
公开(公告)号: | CN113348515A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | O·阿尔默 | 申请(专利权)人: | 阿尔戈泰克系统有限公司 |
主分类号: | G16H15/00 | 分类号: | G16H15/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 董莘 |
地址: | 以色列*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 匹配 放射 报告 中的 医学 概念 系统 方法 | ||
一种确定医学概念集合中的哪些概念与输入文本有关的方法,包括:a)为每个概念创建查询集合,每个查询是概念中的两个字的串;b)对于每个查询,确定输入文本是否包括该查询的所有字,并且计算指示查询与输入文本之间的匹配程度的子得分;c)对于有足够多的查询的字在输入文本中足够靠近的每个概念,取决于子得分来计算得分;以及d)取决于概念的得分,确定已经被计算得分的概念中的哪些概念与输入文本有关,而哪些概念与输入文本不相关。
本申请要求以Or Almer的名义于2018年11月26日临时提交的题为“SYSTEM ANDMETHOD FOR MATCHING MEDICAL CONCEPTS IN RADIOLOGICAL REPORTS”、申请号为62/771,308的美国临时申请的权益,该临时申请整体并入本文。
技术领域
本公开总体上涉及自然语言处理领域,并且具体地涉及标识在医学报告中找到预定义医学概念集合中的哪些医学概念。更具体但非排他地,本公开涉及用于针对放射学报告进行这一操作的方法。
背景技术
存在多种搜索算法用于自动确定在给定输入文本中是否找到给定概念。例如,该概念可以是输入到搜索引擎中的搜索项、字串,并且输入文本可以是在搜索引擎正在搜索的大量网页之一上找到的文本。在某些搜索算法中,不需要以完全相同的形式在输入文本中找到搜索项,以便搜索算法返回肯定结果,但搜索项中的某些字可能会从输入文本中遗漏,或者在输入文本中,搜索项的字可能以不同顺序出现,和/或在它们之间有其他字。在这种情况下,搜索算法可以为该搜索项和输入文本计算得分,该得分指示匹配的良好程度,并且当搜索引擎完成搜索它正在搜索的网页时,它可以提供为该搜索项找到正面结果的网页的列表,这些网页按照得分顺序排序。
例如,ElasticSearch是一种在https://www(dot)elastic(dot)co/products/elasticsearch有描述的商用搜索引擎,其中可以在
在ElasticSearch中的“match_phrase(短语匹配)”查询中,如果在文本字段中找到搜索项的所有字,并且搜索项中字的相对位置与文本字段中相同字的相对位置相距不太远,则文本字段被认为与搜索项匹配。字的位置相距多远是指搜索项中字的位置必须进行多少次改变(其中每次将字的位置在任一方向上改变1)以使字与其在文本字段中的位置相比具有相同位置。例如,如果搜索项由两个字组成,并且在文本字段中找到这两个字彼此相邻但顺序相反,则位置改变次数为2,因为这两个字中的每个都必须经历一次位置改变。如果在文本字段中找到这两个字的顺序与搜索项中的顺序相同,但它们之间有n个其他字,则所需要的位置改变次数为n。为了使文本字段被认为是搜索项的匹配,所需要的位置改变次数必须不大于最大数目(称为“slop”的参数)。如果所需要的位置改变次数较小,则“match_phrase”查询可能具有较高相关性得分。可以将“match”相关性得分和“match_phrase”相关性得分相加,以获取文本字段与搜索项的整体相关性得分。
已知搜索算法将文本字段和/或搜索项中的字替换为其词干。例如,ElasticSearch具有英语抽词干特征,其可以对英语文本执行这个操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔戈泰克系统有限公司,未经阿尔戈泰克系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980090257.1/2.html,转载请声明来源钻瓜专利网。