[发明专利]用于将语言项目规范化的功能装置有效
申请号: | 201210418794.4 | 申请日: | 2012-10-26 |
公开(公告)号: | CN103034628A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | 朱莉·梅德罗;米夏埃尔·加蒙;柳克丽霞·范德温德;丹尼尔·莫里斯 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;郑宗玉 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语言 项目 规范化 功能 装置 | ||
本申请要求2011年10月27提交的第61/551,938号美国临时申请(’938号申请)的权益。’938号申请的全部内容通过引用合并于此。
技术领域
背景技术
护理者通常做出有关患者的护理的各种笔记。例如,护理者可记录关于患者状况的由患者标识的主要病症,被称为“首要病症(chief complaint)”。为了提高效率,护理者可以以缩写形式记录首要病症,例如对于“shortness of breath(呼吸急促)”的首要病症,书写“s/o/b”或者“sob”。护理者可使用任何技术或技术的组合来输入该信息,例如通过使用小键盘输入机构、手写捕获机构、语音识别输入机构等。医院或诊所可以以各种方式使用由患者传达的首要病症。例如,医院可使用该信息向患者提供及时的护理,尤其是在紧急情况下。
然而,以上述方式输入的首要病症容易出现模糊性和错误。例如,输入首要病症的护理者可能输入错误的信息,例如拼错单词。例如,护理者可能输入首要病症“chest pain shortness of breth(胸痛呼吸急促)”,而不是正确的拼写文本“chest pain shortness of breath(胸痛呼吸急促)”。附加地或可替代地,护理者可能使用不一致的缩写以缩短首要病症。例如,护理者可能通过输入“cp sob”、“c/p sob”、“sob/cp”、“sob cp”、“chesp pain sob”、“sob/chest pain/”、“cp difficulty breathing”等,来表达上述首要病症(“chest pain shortness of breath(胸痛呼吸急促)”)。更一般地,首要病症中的模糊性可能源于多个因素,包括以下的任意组合:多个不一致的书写缩写方式的使用;拼写错误;以特殊方式将词语重新排序;用于表示标点符号的多个不一致惯例的使用;将多个病症包括在单个条目中;以及任何自然语言中固有的一般模糊性(例如,如通过使用“difficulty breathing(呼吸困难)”和“shortness of breath(呼吸急促)”表示相同的病症所展示的)。在护理者以语音形式和/或以手写形式提供其笔记的那些环境中,这些模糊性可能会加剧;在这种情形下,自动或手动誊写服务可能难以解析和理解护理者已说出的病症或已书写的病症。
由首要病症的模糊性会产生各种负面结果。例如,模糊性可导致对首要病症进行分类的低效率。在极端情况下,模糊性可导致无法以及时的方式向患者提供适当的护理。
上述问题不限于医疗(例如健康相关)环境,而是延伸到如下的任意环境:该环境涉及有关特定主题领域的潜在模糊语言信息的捕获。
发明内容
本文中描述了一种用于将输入语言项目转换为规范化的语言项目的系统。在一个环境中,输入语言项目对应于由接受医疗护理的人传达的病症,并且在本文中被称为输入病症项目。规范化的语言项目对应于输入语言项目的规范化(例如,明确的且无错误的)的对应方,并且在本文中被称为规范化的病症项目。
在一个实现方式中,系统通过接收输入病症项目然后将其划分为一个或更多个分词(token)(例如词语)来进行操作。然后,系统将输入病症项目中的输入分词中的每个扩展为一个或更多个候选分词的列表,以提供扩展的语言项目。为了执行该任务,系统可依靠多个参考源,包括多个拼写校正器。然后,系统根据扩展的语言项目创建图。系统可根据多个考虑因素将权重分配给图中的边。例如,系统可部分地根据由统计语言模型表示的可能性,将权重分配给边。然后,系统识别通过图的最短路径。该最短路径对应于规范化的病症项目。
根据另一个说明性的特征,系统还可以使用语言模型来确定规范化的病症项目(以上述方式识别的)是否包括分割点,该分割点对规范化的病症项目内的两个组成病症项目进行划界。然后,系统可将规范化的病症项目分离为其组成部分。
以上方法可以以各种类型的系统、部件、方法、计算机可读介质、数据结构、产品等来显现。
提供本发明内容,从而以简单的方式介绍构思的节选;以下在具体实施方式中进一步描述了这些构思。该发明内容不是意在标识请求保护的主题的关键特征或必不可少的特征,也不是意在用来限制请求保护的主题的范围。
附图说明
图1示出用于将输入病症项目转换为对应的规范化的病症项目的说明性的病症项目规范化(CIN)系统的概述。
图2和图3示出图1的CIN系统的一个实现方式。
图4示出用于生成语言模型的训练系统;而该训练系统被图1的CIN系统使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210418794.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型泡沫混凝土及其生产工艺
- 下一篇:一种轴承保持架拆套工装