[发明专利]一种新型实体指代消解的方法及其系统在审
申请号: | 201710255732.9 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107168947A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 林辉 | 申请(专利权)人: | 成都准星云学科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 成都环泰知识产权代理事务所(特殊普通合伙)51242 | 代理人: | 李斌,邹翠 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新型 实体 指代 消解 方法 及其 系统 | ||
1.一种新型实体指代消解的方法,其特征在于,包括以下步骤:
a、确定某一原始文本,并对该原始文本进行文本分词操作;
b、判断分词是否成功,如果是,则进入步骤c;如果否,则重新进入步骤a;
c、对分词成功的文本进行文本标注;
d、判断标注后的文本是否存在实体指代问题,如果是,则进行实体替换操作,进入步骤e;如果否,则进入步骤f;
e、判断实体替换操作是否成功,如果是,则进入步骤f;如果否,则重新进入步骤d;
f、获取属性齐全的实体,将需要替代的实体替换为新的属性齐全的实体。
2.根据权利要求1所述新型实体指代消解的方法,其特征在于,所述步骤d和e中的实体替换操作具体包括以下步骤:
执行实体指代存操作,遍历标注后的文本,找出文本中的实体,并将这些实体及其属性分别存入对应的类中。
3.根据权利要求2所述新型实体指代消解的方法,其特征在于,所述步骤d和e中的实体替换操作还包括以下步骤:
执行实体指代取操作,在实体指代存操作完成后,再次遍历标注后的文本,获取需要进行替代的实体,并从存储的实体中找到与之对应的实体,将存储实体的属性赋值给该需要替代的实体。
4.一种新型实体指代消解的系统,其特征在于,包括文本分词模块、分词判断模块、文本标注模块、指代判断模块、实体替换模块和替换完成模块,其中:
文本分词模块,用于确定某一原始文本,并对该原始文本进行文本分词操作;
分词判断模块,判断分词是否成功,如果是,则跳转到文本标注模块,对文本进行标注;如果否,则重新对原始文本进行文本分词操作;
文本标注模块,用于对分词成功的文本进行文本标注;
指代判断模块,判断标注后的文本是否存在实体指代问题,如果是,则进行实体替换操作;如果否,则结束判断,获得属性齐全的实体;
实体替换模块,判断实体替换操作是否成功,如果是,则获得属性齐全的实体;如果否,则重新进行实体替换操作;
替换完成模块,用于获取属性齐全的实体,将需要替代的实体替换为新的属性齐全的实体。
5.根据权利要求4所述新型实体指代消解的系统,其特征在于,所述实体替换模块包括实体指代存子模块,用于执行实体指代存操作,遍历标注后的文本,找出文本中的实体,并将这些实体及其属性分别存入对应的类中。
6.根据权利要求5所述新型实体指代消解的系统,其特征在于,所述实体替换模块包括实体指代取子模块,用于执行实体指代取操作,在实体指代存操作完成后,再次遍历标注后的文本,获取需要进行替代的实体,并从存储的实体中找到与之对应的实体,将存储实体的属性赋值给该需要替代的实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都准星云学科技有限公司,未经成都准星云学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710255732.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医疗文本数据的命名实体识别方法
- 下一篇:一种语句识别方法与系统