[发明专利]代词消解方法、装置、电子设备及存储介质有效
申请号: | 202110283477.5 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112765958B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 祝大伟;陈立 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代词 消解 方法 装置 电子设备 存储 介质 | ||
本发明涉及语音语义领域,揭露了一种代词消解方法,包括:获取对话数据,划分所述对话数据中的上下文语句;标记所述上下文语句中实体及代词的对应关系,生成标准实体‑代词对应关系;利用所述上下文语句和所述标准实体‑代词对应关系对代词实体消解模型进行训练,得到训练完成的代词实体消解模型;利用所述训练完成的代词实体消解模型对待消解实体‑代词关系的对话数据进行实体‑代词关系消解,得到消解结果。本发明还提出一种代词消解装置、电子设备及计算机可读存储介质。此外,本发明还涉及区块链技术,所述上下文语句可存储于区块链中。本发明可以降低代词消解的复杂度。
技术领域
本发明涉及语音语义领域,尤其涉及一种代词消解方法、装置、电子设备及计算机可读存储介质。
背景技术
在日常生活中,人们对话过程中往往会出现某个语句关系中的实体(Entity)以指称(Mention)的形式出现或省略。为了更准确的理解对话信息,需要进行代词消解。所述指代消解是将代表同一实体(Entity)的不同指称(Mention)划分到一个等价集合(指代链,Coreference Chain)的过程。指代消解能够有效解决文本当中的指代不明问题。
现有的指代消解方法主要基于指代消歧的方法,识别对话中所有的代词和实体,判断其中的代词是否有指向的实体、找到代词最有可能的指代实体,最后将代词用找到的实体替换,从而实现指代消解,但这种方法需要计算对话中每一个指代词和所有实体之间的关系,导致其计算复杂度较高。
发明内容
本发明提供一种代词消解方法、装置、电子设备及计算机可读存储介质,其主要目的在于降低代词消解的复杂度。
为实现上述目的,本发明提供的一种代词消解方法,包括:
获取对话数据,划分所述对话数据中的上下文语句;
标记所述上下文语句中实体及代词的对应关系,生成标准实体-代词对应关系;
利用代词实体消解模型中的编码层对所述上下文语句中字符进行位置向量编码,生成上下文字符向量;
利用所述代词实体消解模型中的前馈注意力机制对所述上下文字符向量进行特征序列提取,得到上下文特征字符向量;
利用所述代词实体消解模型中实体-代词关系消解模块对所述上下文特征字符向量进行实体-代词关系识别,得到预测实体-代词对应关系;
利用所述代词实体消解模型中损失函数计算所述预测实体-代词对应关系与所述标准实体-代词对应关系的损失值;
当所述损失值不满足预设条件时,调整所述代词实体消解模型的参数,并返回利用代词实体消解模型中的编码层对所述上下文语句中字符进行位置向量编码的步骤及后续步骤;
当所述损失值满足预设条件时,得到训练完成的代词实体消解模型;
利用所述训练完成的代词实体消解模型对待消解实体-代词关系的对话数据进行实体-代词关系消解,得到消解结果。
可选地,所述划分所述对话数据中的上下文语句,包括:
获取所述对话数据的语句时间,根据所述语句时间,利用预设的上下文语句划分脚本对所述对话数据进行顺序语句标记,得到上下文语句。
可选地,所述对标记所述上下文语句中实体及代词的对应关系,生成标准实体-代词对应关系,包括:
构建所述上下文语句的数据结构;
根据所述数据结构,利用预设的指针对所述上下文语句进行实体-代词对应关系标记,得到标准实体-代词对应关系。
可选地,所述利用代词实体消解模型中的编码层对所述上下文语句中字符进行位置向量编码,生成上下文字符向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110283477.5/2.html,转载请声明来源钻瓜专利网。