[发明专利]自然语言处理方法、训练方法及数据处理设备有效
| 申请号: | 201910108559.9 | 申请日: | 2019-01-18 |
| 公开(公告)号: | CN109902296B | 公开(公告)日: | 2023-06-30 |
| 发明(设计)人: | 李梓超;蒋欣;刘群 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/211;G06F16/33;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自然语言 处理 方法 训练 数据处理 设备 | ||
本申请公开了人工智能领域中的一种自然语言处理方法、训练方法及数据处理设备,该方法包括:获得待处理的自然语言文本;利用训练得到的深度神经网络对所述自然语言文本做处理,输出处理所述自然语言文本得到的目标结果;其中,所述深度神经网络包括:粒度标注网络、第一特征网络、第二特征网络、第一处理网络、第二处理网络以及融合网络。本申请中,数据处理设备利用相互解耦的网络来处理自然语言文本中不同粒度的词语,可以有效提高处理自然处理任务的性能。
技术领域
本申请涉及自然语言处理领域,特别涉及一种自然语言处理方法、训练方法及数据处理设备。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
随着人工智能技术的不断发展,越来越多的自然语言处理任务可以采用人工智能技术来实现,例如采用人工智能技术来实现翻译任务。自然语言处理任务可以分为不同的粒度,一般分为字符级(character level)、词语级(word level)、短语级(phrase level)、句子级(sentence level)、篇章级(discourse level)等,这些粒度依次变粗。例如词性标注是词语级任务,命名实体识别(named entity recognition)是短语级任务,句法分析通常是句子级的任务。不同粒度上的信息并不是孤立的,而是相互传递的。例如在做句法分析时,通常也要考虑到词语级和短语级的特征。在一些相对更加复杂的任务中,例如句子的分类、句子与句子之间的语义匹配、句子的翻译或改写,通常需要用到多个粒度上的信息,最后再进行综合。
目前主流的基于深度学习的自然语言处理方法是通过神经网络对自然语言文本做处理。在主流的方法中,神经网络在处理过程中对不同粒度的词语的处理是混合在一起的,得到正确的处理结果的概率较低。因此,需要研究新的方案。
发明内容
本申请实施例提供一种自然语言处理方法、训练方法及数据处理设备,可以避免由较细粒度的信息得到较粗粒度的信息的过程,可以有效改善处理自然语言处理任务的性能。
第一方面本申请实施例提供了一种自然语言处理方法,该方法包括:获得待处理的自然语言文本;利用训练得到的深度神经网络对所述自然语言文本做处理,输出处理所述自然语言文本得到的目标结果;其中,所述深度神经网络包括:粒度标注网络、第一特征网络、第二特征网络、第一处理网络、第二处理网络以及融合网络,所述处理包括:利用所述粒度标注网络确定所述自然语言文本中各词语的粒度;利用所述第一特征网络对所述自然语言文本中第一粒度的词语进行特征提取,将得到的第一特征信息输出至所述第一处理网络;利用所述第二特征网络对所述自然语言文本中第二粒度的词语进行特征提取,将得到的第二特征信息输出至所述第二处理网络;利用所述第一处理网络对所述第一特征信息做处理,将得到的第一处理结果输出至所述融合网络;利用所述第二处理网络对所述第二特征信息做所述处理,将得到的第二处理结果输出至所述融合网络;利用所述融合网络融合所述第一处理结果和所述第二处理结果得到所述目标结果;所述第一粒度和所述第二粒度不同。
该深度神经网络可以包括N个特征网络以及N个处理网络,该N个特征网络以及该N个处理网络一一对应,N为大于1的整数。一对相对应的特征网络和处理网络用于处理同一粒度的词语。由于数据处理设备将不同粒度的词语分开进行处理,对各粒度的词语所做的处理操作不依赖于其他粒度的词语的处理结果,这就避免了由较细粒度的信息得到较粗粒度的信息的过程,从而大大降低该数据处理设备得到错误结果的概率。
本申请实施例中,数据处理设备利用深度神经网络独立处理不同粒度的词语,避免了由较细粒度的信息得到较粗粒度的信息的过程,可以有效提高处理自然处理任务的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910108559.9/2.html,转载请声明来源钻瓜专利网。





