[发明专利]用于问答处理的方法、装置、设备和介质有效
申请号: | 202010188703.7 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111382255B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 纪登林;徐伟建;罗雨;彭卫华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉;罗利娜 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 问答 处理 方法 装置 设备 介质 | ||
1.一种用于网页应用或移动终端应用的问答处理的方法,包括:
利用预先训练的机器学习模型,确定待解答问题对应的问题文本与知识库中的知识文本之间的相应语义相似度;
基于所述相应语义相似度,从所述知识库中选择多个候选知识文本;
确定所述问题文本所包括的字符与所选择的所述多个候选知识文本各自包括的字符之间的相应编辑距离;
基于所述相应编辑距离,确定所述问题文本所包括的字符与所述多个候选知识文本各自包括的字符之间的相应字符相似度;以及
至少基于所述相应字符相似度来确定所述待解答问题对应的答案。
2.根据权利要求1所述的方法,其中所述知识库中的知识文本由相应关键词索引,所述方法还包括:
从所述问题文本提取目标关键词;以及
基于所述目标关键词和所述知识库中索引到所述知识文本的关键词之间的匹配,从所述知识库中确定一组知识文本,并且
其中确定所述相应语义相似度包括:
确定所述问题文本与所述一组知识文本中的相应知识文本之间的相应语义相似度。
3.根据权利要求1所述的方法,其中确定所述待解答问题对应的答案还包括:
还基于所述问题文本与所述多个候选知识文本之间的所述语义相似度来确定所述待解答问题对应的答案。
4.根据权利要求1所述的方法,其中所述待解答问题包括选择题,所述问题文本包括所述选择题的题干和多个备选项中的给定备选项,并且
其中确定所述待解答问题对应的答案包括:
至少基于所述相应字符相似度来确定指示所述给定备选项的正确性的给定选项得分;
确定所述多个备选项中的其他备选项的选项得分;以及
通过比较所述给定选项得分和所述其他备选项的所述选项得分来确定所述选择题的正确备选项。
5.根据权利要求4所述的方法,其中确定所述给定选项得分还包括:
基于所述相应字符相似度和所述相应语义相似度的加和来确定所述给定选项得分。
6.根据权利要求1至5中任一项所述的方法,其中所述待解答问题包括问答题,所述问题文本包括所述问答题的题干,并且
其中确定所述待解答问题对应的答案包括:
至少基于所述相应字符相似度,从所述多个候选知识文本中选择目标知识文本;以及
从所述知识库中获取与所述目标知识文本相关联的答案文本作为所述待解答问题对应的答案。
7.一种用于网页应用或移动终端应用的问答处理的装置,包括:
语义相似度确定模块,被配置为利用预先训练的机器学习模型来确定待解答问题对应的问题文本与知识库中的知识文本之间的相应语义相似度;
知识文本选择模块,被配置为基于所述相应语义相似度,从所述知识库中选择多个候选知识文本;
编辑距离确定模块,被配置为确定所述问题文本所包括的字符与所选择的所述多个候选知识文本各自包括的字符之间的相应编辑距离;
字符相似度确定模块,被配置为基于所述相应编辑距离来确定所述问题文本所包括的字符与所述多个候选知识文本各自包括的字符之间的相应字符相似度;以及
答案确定模块,被配置为至少基于所述相应字符相似度来确定所述待解答问题对应的答案。
8.根据权利要求7所述的装置,其中所述知识库中的知识文本由相应关键词索引,所述装置还包括:
关键词提取模块,被配置为从所述问题文本提取目标关键词;以及
知识文本确定模块,被配置为基于所述目标关键词和所述知识库中索引到所述知识文本的关键词之间的匹配,从所述知识库中确定一组知识文本,并且
其中所述语义相似度确定模块包括:
第一确定模块,被配置为确定所述问题文本与所述一组知识文本中的相应知识文本之间的相应语义相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010188703.7/1.html,转载请声明来源钻瓜专利网。