[发明专利]神经网络训练方法及神经网络、问答系统及方法在审
| 申请号: | 202210313514.7 | 申请日: | 2022-03-28 |
| 公开(公告)号: | CN114781595A | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | 曾祥云;朱姬渊 | 申请(专利权)人: | 上海易康源医疗健康科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00;G06F16/332;G06F16/36;G06F40/237;G06F40/295 |
| 代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 刘桂芝 |
| 地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 训练 方法 问答 系统 | ||
本发明公开一种神经网络训练方法及神经网络、问答系统及方法,其神经网络训练方法包括步骤:S1:数据准备;S2:句子特征分析处理;S3:分布初始化;S4:创建回答列表;S5:指令网络单元初始化及处理;S6:关系和实体初始化;S7:推理网络单元初始化及处理;S8:求损失值并训练。本发明能够深层挖掘多级语义关系,大大提高了语义分析的准确率,提高了应用的准确性,如检索、预测、推荐等需求场景。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种神经网络训练方法及神经网络、问答系统及方法。
背景技术
问答(Question Answering)是自然语言处理(Natural Language Processing)的一个重要研究领域,可以针对人类以自然语言形式提出的问题自动地给出答案。
目前的问答系统已经得到了广泛的应用,比如在一些日常搜索、、智能客服、聊天机器人等得到了广泛的应用,早已普及我们每个人的生活。例如,当你清晨起床询问你的智能语音助手“今天天气怎么样?”时,你会得到类似这样的回答:“今天是晴天,温度10-12摄氏度。”
除了简单单轮对话的信息查询之外,如今更为先进的问答系统是聊天机器人,可以和用户进行多轮对话,并根据过去的对话聊天记录,进一步挖掘信息,从而可以更智能、更理解人的方式进行问答和对话。
随着知识图谱技术的发展,借助知识图谱的强大功能,基于知识图谱的问答系统功能更加理解人,信息更加丰富,因而进一步发展基于知识图谱问答的技术,知识图谱问答指的是使用知识图谱作为主要数据源的问答场景。对于给定的问题,我们基于知识图谱进行推理从而得到答案,让问答系统具有一定的推理能力,从而大大增强了智能客服这类的沟通效率。
虽然目前的知识图谱问答虽然具有强大的推理能力,但也面对一些更复杂的挑战,当输入的是多级关系的信息时,难以进行准确的推理,因此2级关系后,就出现答案不准的情况,比如“布鲁斯的老婆的爸爸是谁?”这类语句,其信息构建的知识图谱包括多级关系,目前的技术难以进行准确的推理。
发明内容
本发明为解决现有技术中存在的技术问题,提供一种神经网络的训练方法,包括步骤:
S1:数据准备;
S2:句子特征分析处理;
S3:分布初始化;
S4:创建回答列表;
S5:指令网络单元初始化及处理;
S6:关系和实体初始化;
S7:推理网络单元初始化及处理;
S8:求损失值并训练。
进一步地,S1:数据准备步骤包括:
S10:神经网络的参数设置,包括对指数衰减、激活函数以及优化方法的选择和设置;
S11:加载数据,包括:
加载entity,relation和vocab文件,获取实体,词语和关系对应的id;
加载数据集sample和dep文件,获取问答、子图关系和实体,以及问题的句法分析信息;
S12:id映射:
将sample文件中包含有问题的句子中的实体以及与有问题的问题句子中实体相关联子图的节点,生成g2l元素的字典用以表示全局id以及当前id的转换。并统计所有行中最多的实体数。
进一步地,S2:句子特征分析处理步骤包括:
S20:对包含有问题的句子的句法的依存关系进行分析:抽取出句子中每个词的父节点编号、关系类型和所在层级关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海易康源医疗健康科技有限公司,未经上海易康源医疗健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210313514.7/2.html,转载请声明来源钻瓜专利网。





