[发明专利]模型训练、阅读理解方法、装置、电子设备及存储介质有效
| 申请号: | 202110661685.4 | 申请日: | 2021-06-15 |
| 公开(公告)号: | CN113486174B | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 刘操;马兵;胡书杰;杨帆;蔡勋梁;万广鲁;陈见耸 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06N3/08 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
| 地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 阅读 理解 方法 装置 电子设备 存储 介质 | ||
本公开实施例提供了一种模型训练、阅读理解方法、装置、电子设备及存储介质。模型训练方法包括:获取样本文档、样本问题和样本答案;基于样本答案对样本文档进行标注,得到样本文档中各字符出现在样本答案中的样本标注概率;将样本文档和样本问题作为初始模型的输入,得到所述初始模型输出的所述样本文档中各字符出现在所述样本答案中的样本预测概率;基于所述样本标注概率和所述样本预测概率确定训练完成后,将训练完成的模型作为分类模型。本公开实施例中,在模型训练过程中,引入远程监督的方式,自动构造标签,不需要人工标注样本答案在样本文档中出现的具体位置,从而使得大量的无标注数据集可以被利用,进而使分类模型达到更好的性能。
技术领域
本公开涉及数据处理技术领域,特别是涉及一种模型训练、阅读理解方法、装置、电子设备及存储介质。
背景技术
机器阅读理解(Machine Reading Comprehension,MRC)是一种利用算法使计算机理解文章语义并回答相关问题的技术。近些年来,随着机器学习,特别是深度学习的发展,机器阅读理解研究有了长足的进步,并在实际应用中获得了越来越多的关注。
随着人工智能和深度学习技术的快速发展,机器阅读理解的相关模型已经成为当前研究和应用的热点内容。现有技术中,利用大量的样本数据对机器阅读理解的相关模型进行训练,但是,需要对大规模的样本数据进行人工标注,即在文档中标注出答案的位置,这将耗费大量的人力物力,处理过程较为复杂。
发明内容
鉴于上述问题,本公开实施例提出了克服上述问题或者至少部分地解决上述问题的一种模型训练、阅读理解方法、装置、电子设备及存储介质。
根据本公开的实施例的第一方面,提供了一种模型训练方法,包括:
获取样本文档、样本问题和样本答案;
基于所述样本答案对所述样本文档进行标注,得到所述样本文档中各字符出现在所述样本答案中的样本标注概率;
将所述样本文档和所述样本问题作为初始模型的输入,得到所述初始模型输出的所述样本文档中各字符出现在所述样本答案中的样本预测概率;
基于所述样本标注概率和所述样本预测概率确定训练完成后,将训练完成的模型作为分类模型。
可选地,基于所述样本答案对所述样本文档进行标注,得到所述样本文档中各字符出现在所述样本答案中的样本标注概率,包括:将所述样本文档中,出现在所述样本答案中的字符的样本标注概率标记为第一预设概率;将所述样本文档中,未出现在所述样本答案中的字符的样本标注概率标记为第二预设概率;其中,所述第一预设概率大于所述第二预设概率。
根据本公开的实施例的第二方面,提供了一种阅读理解方法,包括:
获取待识别文档和待识别问题;
将所述待识别文档和所述待识别问题输入预先训练的分类模型,得到所述分类模型输出的所述待识别文档中各字符出现在答案中的预测概率;其中,所述分类模型通过如上任一项所述的模型训练方法得到;
基于所述预测概率确定答案。
可选地,基于所述预测概率确定答案,包括:从所述待识别文档中抽取片段;基于所述片段中各字符对应的预测概率,计算所述片段的密度;选取密度最大的片段作为所述答案。
可选地,从所述待识别文档中抽取片段,包括:以字符为粒度,从所述待识别文档中抽取包含至少一个字符的片段;和/或,对所述待识别文档进行分词,以词为粒度,从所述待识别文档抽取包含至少一个词的片段;和/或,对所述待识别文档进行分句,以句子为粒度,从所述待识别文档抽取包含至少一个句子的片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110661685.4/2.html,转载请声明来源钻瓜专利网。





