[发明专利]自然语言处理系统的构建方法、电子装置及计算机设备在审
申请号: | 201910876792.1 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110765243A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 王健宗;苏雪琦;彭话易;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/289 |
代理公司: | 11015 北京英特普罗知识产权代理有限公司 | 代理人: | 邓应山 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 文本向量 自然语言处理系统 权重参数 输出语句 构建 计算机设备 存储介质 电子装置 反向传播 算法计算 特征转换 预设条件 自动训练 便利性 误差项 维度 语句 文本 网络 | ||
本发明公开了一种自然语言处理系统的构建方法、电子装置、计算机设备及存储介质,能够将接收的语句文本中提取的字词特征转换成D维度的文本向量,将所述文本向量传入神经网络,获取神经网络接收所述文本向量后的输出语句,根据所述输出语句与所述文本向量的误差项通过反向传播算法计算所述神经网络的目标权重参数,根据所述目标权重参数调整所述神经网络各节点的权重参数,直至神经网络的输出语句满足预设条件,得到自然语言处理系统,通过自动训练神经网络并达到较佳的处理效果,提高了构建自然语言处理系统的准确性以及便利性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种自然语言处理系统的构建方法、电子装置、计算机设备及存储介质。
背景技术
利用计算机来处理人类的语言的自然语言处理,体现了人工智能的最高任务与境界,常见的应用方式包括信息提取、机器翻译、智能问答系统等。在智能问答系统的自然语言处理系统中,实现用准确、简洁的自然语言回答人类用户用自然语言提出的问题。
目前常用的方法是利用预先训练好的基于神经网络的分类器提取自然语言语句的结构化特征,然后基于该结构化特征从预先建立的知识库中检索或推理得到相应的答案。在上述基于神经网络的分类器的训练以及知识库的建立过程中,都需要提供大量标注有结构化特征的训练数据供基于神经网络的分类器执行深度学习,这种手动标注费时且昂贵,对于知识库中没有的场景,应用效果较差,缺乏通用性,应用场景严重受限。
发明内容
有鉴于此,本发明提出一种自然语言处理系统的构建方法、电子装置、计算机设备及存储介质,能够自动训练神经网络并达到较佳的处理效果,提高了构建自然语言处理系统的准确性以及便利性。
首先,为实现上述目的,本发明提出一种自然语言处理系统的构建方法,该方法包括步骤:
从接收的语句文本中提取若干字词特征;
将所述字词特征转换成D维度的文本向量,并将所述文本向量传入神经网络;
获取神经网络接收所述文本向量后的输出语句,根据所述输出语句与所述文本向量的误差项通过反向传播算法计算所述神经网络的目标权重参数;及
根据所述目标权重参数调整所述神经网络各节点的权重参数,直至神经网络的输出语句满足预设条件,得到自然语言处理系统。
进一步地,所述从接收的语句文本中提取若干字词特征的步骤还包括:
将语句文本按照语法分割成若干字词,根据词性标记集标注语句文本中字词的词性;及
根据所述词性将所述语句文本分解成字词特征。
进一步地,所述将所述字词特征转换成D维度的文本向量的步骤还包括:
根据相似性度量方式匹配与所述字词特征相关的D-1个词条;
根据所述字词特征与所述词条的相关程度设置D个词条权重;及
根据所述D个词条权重生成D维度的文本向量。
进一步地,所述相似性度量方式包括余弦距离。
进一步地,所述根据所述输出语句与所述文本向量的误差项通过反向传播算法计算所述神经网络的目标权重参数的步骤还包括:
从神经网络的输出层开始,反向依次计算各隐藏层的误差项;及
根据所述误差项计算隐藏层各节点的权重参数。
进一步地,所述预设条件包括:所述神经网络的输出语句中属于自然界中存在的语句的占比达到预设阈值;
所述直至神经网络的输出语句满足预设条件的步骤之前还包括:
判断所述输出语句是否为自然界中存在的语句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910876792.1/2.html,转载请声明来源钻瓜专利网。