[发明专利]文本分析模型的训练方法及装置、文本分析方法及装置有效
申请号: | 201911031207.4 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110781663B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 陈楠;唐剑波;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/35;G06F16/33;G06F16/332 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分析 模型 训练 方法 装置 | ||
本申请提供文本分析模型的训练方法及装置、文本分析方法及装置。其中,所述训练方法包括:获取样本文本、样本问题和答案标签;将样本文本和样本问题输入至文本分析模型中进行处理,生成分类单元输出向量和注意力单元输出向量;基于分类单元输出向量确定样本答案存在信息,并将样本答案存在信息与答案标签中的答案存在信息进行计算,生成第一损失值,基于注意力单元输出向量确定样本答案,并将样本答案与答案标签中的正确答案进行计算,生成第二损失值;基于第一损失值和第二损失值生成第三损失值,并基于第三损失值对文本分析模型进行迭代训练,直至达到训练停止条件。本申请所述的方法可以有效提高文本分析模型的准确率。
技术领域
本申请涉及自然语言处理技术领域,特别涉及文本分析模型的训练方法及装置、文本分析方法及装置、计算设备及计算机可读存储介质。
背景技术
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
对于自然语言处理任务,通常选用双向注意力神经网络模型模型(BidirectionalEncoder Representation from Transformers,BERT)进行处理。现有的BERT模型在进行阅读理解任务时,仅仅通过对答案起点位置和答案终点位置做位置分类,来确定待分析文本中是否存在答案以及答案具体是什么,准确性有待提高。
发明内容
有鉴于此,本申请实施例提供了文本分析模型的训练方法及装置、文本分析方法及装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
本申请实施例公开了一种文本分析模型的训练方法,包括:
获取样本文本、样本问题和答案标签;
将所述样本文本和样本问题输入至文本分析模型中进行处理,生成分类单元输出向量和注意力单元输出向量;
基于所述分类单元输出向量确定样本答案存在信息,并将所述样本答案存在信息与答案标签中的答案存在信息进行计算,生成第一损失值;
基于所述注意力单元输出向量确定样本答案,并将所述样本答案与答案标签中的正确答案进行计算,生成第二损失值;
基于所述第一损失值和第二损失值生成第三损失值,并基于所述第三损失值对所述文本分析模型进行迭代训练,直至达到训练停止条件。
进一步地,在所述获取样本文本、样本问题和答案标签之后,还包括:
将样本文本和样本问题进行分词处理,获得词单元集合;
所述将所述样本文本和样本问题输入至文本分析模型中进行处理,生成分类单元输出向量和注意力单元输出向量,包括:
将所述词单元集合输入至文本分析模型中进行处理,生成首个词单元的分类单元输出向量和每一个词单元的注意力单元输出向量。
进一步地,所述将所述词单元集合输入至文本分析模型中进行处理,包括:
将所述词单元集合输入至文本分析模型的注意力单元中进行处理,生成每一个词单元的注意力单元输出向量;
将首个词单元的注意力单元输出向量输入至分类单元中进行处理,生成首个词单元的分类单元输出向量。
进一步地,所述基于所述分类单元输出向量确定样本答案存在信息,包括:
S11、基于所述首个词单元的分类单元输出向量判断所述样本文本中是否存在所述样本问题的答案,若是,则执行步骤S12,若否,则执行步骤S13;
S12、生成存在答案标签,并将所述存在答案标签作为样本答案存在信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911031207.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种逐点互信息的确定方法和相关设备
- 下一篇:文件修复方法及装置