[发明专利]自然语言处理系统的构建方法、电子装置及计算机设备在审

申请号：	201910876792.1	申请日：	2019-09-17
公开（公告）号：	CN110765243A	公开（公告）日：	2020-02-07
发明（设计）人：	王健宗;苏雪琦;彭话易;程宁	申请（专利权）人：	平安科技(深圳)有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F40/289
代理公司：	11015 北京英特普罗知识产权代理有限公司	代理人：	邓应山
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络文本向量自然语言处理系统权重参数输出语句构建计算机设备存储介质电子装置反向传播算法计算特征转换预设条件自动训练便利性误差项维度语句文本网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种自然语言处理系统的构建方法、电子装置、计算机设备及存储介质，能够将接收的语句文本中提取的字词特征转换成D维度的文本向量，将所述文本向量传入神经网络，获取神经网络接收所述文本向量后的输出语句，根据所述输出语句与所述文本向量的误差项通过反向传播算法计算所述神经网络的目标权重参数，根据所述目标权重参数调整所述神经网络各节点的权重参数，直至神经网络的输出语句满足预设条件，得到自然语言处理系统，通过自动训练神经网络并达到较佳的处理效果，提高了构建自然语言处理系统的准确性以及便利性。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种自然语言处理系统的构建方法、电子装置、计算机设备及存储介质。

背景技术

利用计算机来处理人类的语言的自然语言处理，体现了人工智能的最高任务与境界，常见的应用方式包括信息提取、机器翻译、智能问答系统等。在智能问答系统的自然语言处理系统中，实现用准确、简洁的自然语言回答人类用户用自然语言提出的问题。

目前常用的方法是利用预先训练好的基于神经网络的分类器提取自然语言语句的结构化特征，然后基于该结构化特征从预先建立的知识库中检索或推理得到相应的答案。在上述基于神经网络的分类器的训练以及知识库的建立过程中，都需要提供大量标注有结构化特征的训练数据供基于神经网络的分类器执行深度学习，这种手动标注费时且昂贵，对于知识库中没有的场景，应用效果较差，缺乏通用性，应用场景严重受限。

发明内容

有鉴于此，本发明提出一种自然语言处理系统的构建方法、电子装置、计算机设备及存储介质，能够自动训练神经网络并达到较佳的处理效果，提高了构建自然语言处理系统的准确性以及便利性。

首先，为实现上述目的，本发明提出一种自然语言处理系统的构建方法，该方法包括步骤：

从接收的语句文本中提取若干字词特征；

将所述字词特征转换成D维度的文本向量，并将所述文本向量传入神经网络；

获取神经网络接收所述文本向量后的输出语句，根据所述输出语句与所述文本向量的误差项通过反向传播算法计算所述神经网络的目标权重参数；及

根据所述目标权重参数调整所述神经网络各节点的权重参数，直至神经网络的输出语句满足预设条件，得到自然语言处理系统。

进一步地，所述从接收的语句文本中提取若干字词特征的步骤还包括：

将语句文本按照语法分割成若干字词，根据词性标记集标注语句文本中字词的词性；及

根据所述词性将所述语句文本分解成字词特征。

进一步地，所述将所述字词特征转换成D维度的文本向量的步骤还包括：

根据相似性度量方式匹配与所述字词特征相关的D-1个词条；