[发明专利]自然语言处理方法、训练方法及数据处理设备有效
| 申请号: | 201910108559.9 | 申请日: | 2019-01-18 |
| 公开(公告)号: | CN109902296B | 公开(公告)日: | 2023-06-30 |
| 发明(设计)人: | 李梓超;蒋欣;刘群 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/211;G06F16/33;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自然语言 处理 方法 训练 数据处理 设备 | ||
1.一种自然语言处理方法,其特征在于,包括:
获得待处理的自然语言文本;
利用训练得到的深度神经网络对所述自然语言文本做处理,输出处理所述自然语言文本得到的目标结果;其中,所述深度神经网络包括:粒度标注网络、第一特征网络、第二特征网络、第一处理网络、第二处理网络以及融合网络,所述处理包括:利用所述粒度标注网络确定所述自然语言文本中各词语的粒度;利用所述第一特征网络对所述自然语言文本中第一粒度的词语进行特征提取,将得到的第一特征信息输出至所述第一处理网络;利用所述第二特征网络对所述自然语言文本中第二粒度的词语进行特征提取,将得到的第二特征信息输出至所述第二处理网络;利用所述第一处理网络对所述第一特征信息做处理,将得到的第一处理结果输出至所述融合网络;利用所述第二处理网络对所述第二特征信息做处理,将得到的第二处理结果输出至所述融合网络;利用所述融合网络融合所述第一处理结果和所述第二处理结果得到所述目标结果;所述第一粒度和所述第二粒度不同,所述第一处理结果为包含一个或多个词语的序列,所述第一特征信息为表示第一粒度的词语的向量或矩阵。
2.根据权利要求1所述的方法,其特征在于,所述第一特征网络和所述第二特征网络的架构不同,和/或,所述第一处理网络和所述第二处理网络的架构不同。
3.根据权利要求1或2所述的方法,其特征在于,所述粒度标注网络的输入为所述自然语言文本,所述利用所述粒度标注网络确定所述自然语言文本中各词语的粒度包括:
利用所述粒度标注网络按照N种粒度确定所述自然语言文本中每个词语的粒度以得到所述自然语言文本的标注信息,向所述第一特征网络和所述第二特征网络输出所述标注信息;其中,所述标注信息用于描述所述每个词语的粒度或者所述每个词语分别属于所述N种粒度的概率;N为大于1的整数;
所述利用所述第一特征网络对所述自然语言文本中第一粒度的词语进行特征提取包括:
利用所述第一特征网络处理所述第一粒度的词语以得到所述第一特征信息,所述第一特征信息为表示所述第一粒度的词语的向量或矩阵;
所述利用所述第二特征网络对所述自然语言文本中第二粒度的词语进行特征提取包括:
利用所述第二特征网络处理所述第二粒度的词语以得到所述第二特征信息,所述第二特征信息为表示所述第二粒度的词语的向量或矩阵。
4.根据权利要求3所述的方法,其特征在于,所述第一处理结果为包含一个或多个词语的序列,所述利用所述第一处理网络对所述第一特征信息做处理包括:
利用所述第一处理网络对输入的所述第一特征信息和所述第一处理网络在处理所述第一特征信息的过程中已输出的词语做处理以得到所述第一处理结果。
5.根据权利要求4所述的方法,其特征在于,所述融合网络输出的所述目标结果为包含一个或多个词语的序列,所述利用所述融合网络融合所述第一处理结果和所述第二处理结果得到所述目标结果包括:
利用所述融合网络处理所述第一处理结果、所述第二处理结果以及所述融合网络在处理所述第一处理结果和所述第二处理结果的过程中已输出的词语以确定待输出目标词语,输出所述目标词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910108559.9/1.html,转载请声明来源钻瓜专利网。





