[发明专利]编码方法、装置、设备及存储介质有效
申请号: | 201910069752.6 | 申请日: | 2019-01-24 |
公开(公告)号: | CN110147533B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 谭翊章;孙硕;曹杰;田乐;牛成;周杰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/205;G06N3/0442;G06N3/08;G06F16/332;G06F16/35;G06F40/284 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种编码方法、装置、设备及存储介质,属于自然语言处理领域。方法包括:获取目标段落和目标段落的上下文语句,将目标段落和上下文语句输入至记忆编码模型;在输入层中获取原始向量集合以及记忆向量集合,在记忆层中根据原始向量集合和记忆向量集合,获取原始向量集合的第一目标语句矩阵,在输出层中根据第一目标语句矩阵获取目标段落的段落向量,基于段落向量进行处理。以目标段落为单位对每个语句分别进行编码,提高了编码速度。并且,编码过程中不仅考虑目标段落本身,还考虑了目标段落的上下文语句,能够根据目标段落中的语句与上下文语句之间的关联关系获取到准确描述目标段落的段落向量,提高了编码准确率。 | ||
搜索关键词: | 编码 方法 装置 设备 存储 介质 | ||
【主权项】:
1.一种编码方法,其特征在于,所述方法包括:获取目标段落和所述目标段落的上下文语句,将所述目标段落和所述上下文语句输入至记忆编码模型,所述目标段落包括至少一个语句,所述记忆编码模型至少包括输入层、记忆层和输出层;在所述输入层中,获取所述目标段落的原始向量集合和记忆向量集合,所述原始向量集合包括所述目标段落中每个语句的语句向量,所述记忆向量集合包括所述目标段落的上下文语句中每个词语的词向量;在所述记忆层中,根据所述原始向量集合和所述记忆向量集合,获取所述原始向量集合的第一目标语句矩阵,所述第一目标语句矩阵用于根据所述原始向量集合与所述记忆向量集合之间的关联关系,对所述目标段落进行描述;在所述输出层中,根据所述第一目标语句矩阵,获取所述目标段落的段落向量;基于所述段落向量进行处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910069752.6/,转载请声明来源钻瓜专利网。