[发明专利]问答处理方法及智能设备在审
申请号: | 202210262132.6 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114706963A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 李俊彦;柳志德;芮智琦;范颜岩;许畅 | 申请(专利权)人: | 海信电子科技(武汉)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/951;G06F16/953;G06F40/205;G06F40/30;G06N3/04;G06N3/08;G11C7/16 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 430073 湖北省武汉市东湖新技术开发*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 处理 方法 智能 设备 | ||
本发明公开一种问答处理方法及智能设备,涉及自然语言处理技术领域,其中所述方法包括利用样本数据,预先对问答生成模型和机器阅读理解模型进行联动训练;将待测文本数据输入所述问答生成模型,生成目标问题和基准答案;将所述待测文本数据和所述目标问题输入所述机器阅读理解模型,得到预测答案;对所述预测答案进行校验,若所述预测答案校验成功,则存储所述目标问题和所述预测答案的匹配对。本发明方案能提升智能设备问答交互的准确性。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种问答处理方法及智能设备。
背景技术
在一些人机交互场景中,如智能电视、智能音响等智能设备可支持对话功能,用户可与智能设备进行问答互动,例如用户向智能音响提问“今天天气怎么样?”,智能设备回答“今天晴,温度0℃~15℃”,又例如用户向智能冰箱提问“冷冻室里有什么?”,智能冰箱回答“鱼肉、牛肉和冰淇淋”。
智能设备内可预置有模型架构,通过对模型架构进行问答训练,以生成预测模型,所述预测模型用于输出与用户提出的问题相匹配的答案。预测模型的精度直接影响智能设备问答的准确性,若预测模型精度不够,智能设备在响应用户提问后,可能给出错误答案或不理解的回复等。
发明内容
为解决上述背景技术中的问题,本发明提供一种问答处理方法及智能设备。
第一方面提供一种智能设备,包括:
存储器,被配置为存储问答训练后构建的问题与答案的匹配对;
控制器,被配置为执行:
利用样本数据,预先对问答生成模型和机器阅读理解模型进行联动训练;
将待测文本数据输入所述问答生成模型,生成目标问题和基准答案;
将所述待测文本数据和所述目标问题输入所述机器阅读理解模型,得到预测答案;
对所述预测答案进行校验,若所述预测答案校验成功,将所述目标问题和所述预测答案的匹配对写入与所述机器阅读理解模型关联的所述存储器内。
在一些实施例中,所述控制器被配置按照如下方式执行所述联动训练:
利用所述样本数据对第一预训练模型进行微调,得到初阶的问答生成模型;
利用所述样本数据对第二预训练模型进行微调,得到初阶的机器阅读理解模型;
对初阶的问答生成模型和机器阅读理解模型启动联动训练。
在一些实施例中,所述控制器被配置按照如下方式执行所述联动训练:
先以初阶的机器阅读理解模型为基准,对初阶的问答生成模型进行参数优化,得到进阶的问答生成模型;
然后以所述进阶的问答生成模型为基准,对初阶的机器阅读理解模型进行参数优化,得到进阶的机器阅读理解模型。
在一些实施例中,所述控制器被配置按照如下方式得到进阶的问答生成模型:
利用所述样本数据训练所述初阶的问答生成模型,计算所述初阶的问答生成模型的第一损失值;所述样本数据中包括描述文本、样本问题和样本答案;
将所述描述文本以及所述初阶的问答生成模型输出的第一问题和第一答案输入至所述初阶的机器阅读理解模型,计算所述初阶的机器阅读理解模型的第二损失值;
利用所述第一损失值及其对应的第一权重,所述第二损失值及其对应的第二权重,计算第一加权损失值;
根据所述第一加权损失值对所述初阶的问答生成模型进行参数优化。
在一些实施例中,所述控制器被配置按照如下方式得到进阶的机器阅读理解模型:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信电子科技(武汉)有限公司,未经海信电子科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210262132.6/2.html,转载请声明来源钻瓜专利网。