[发明专利]在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统有效
申请号: | 201580038602.9 | 申请日: | 2015-05-13 |
公开(公告)号: | CN106537370B | 公开(公告)日: | 2020-03-03 |
发明(设计)人: | 布兰科维奇·乔治;尼克拉·加百利;隆·希尔普;维贾雅-拉加万·欣德胡;李庸熏 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/242;G06F40/30;G10L15/18;G06F3/16 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;杨莘 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 系统包括存储设备,存储设备配置为存储从多个来源采集的多个命名实体,所述多个命名实体被令牌化并且与标签关联。系统包括标记装置,标记装置配置为:接收文本通信;识别文本通信中的每一个;将文本通信令牌化;将文本令牌与存储设备中所存储的命名实体令牌相匹配,以将文本令牌分配给与命名实体令牌关联的标签;基于文本令牌与命名实体令牌之间的匹配来标记文本通信,以识别文本通信中的每一个的预期含义;以及基于对文本通信应用标记来识别文本通信的预期含义。还公开了能够使用常识推理方法来对命名实体消歧的方法。 | ||
搜索关键词: | 存在 来源 翻译 错误 情况 命名 实体 标记 方法 系统 | ||
【主权项】:
一种鲁棒的命名实体标记系统,所述系统能够不考虑来源错误或翻译错误识别通信源的预期含义,所述系统包括:存储设备,配置为存储从多个来源采集的多个命名实体,其中,所述命名实体中的每一个被令牌化为通用格式的命名实体令牌,所述命名实体中的每一个与标签关联,以及所述命名实体令牌中的每一个是单词或单词音节中的一种;以及标记装置,配置为:接收一个或多个文本通信,识别所述一个或多个文本通信中的每一个,将所述一个或多个文本通信令牌化为通用格式的文本令牌,将所述一个或多个文本令牌与所述存储设备中所存储的所述命名实体令牌中的一个或多个进行匹配,以将所述文本令牌分配给与所述命名实体令牌关联的标签,基于所述文本令牌与所述命名实体令牌之间的匹配对所述一个或多个文本通信进行标记,以识别所述一个或多个文本通信中的每一个的预期含义,以及基于对所述一个或多个文本通信应用标记,识别所述一个或多个文本通信的预期含义。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580038602.9/,转载请声明来源钻瓜专利网。