[发明专利]语病识别方法、装置、电子设备和存储介质在审
申请号: | 202111467935.7 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114154497A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 王宝鑫;孙博;车万翔;伍大勇;陈志刚;刘挺 | 申请(专利权)人: | 科大讯飞河北科技有限公司;河北省讯飞人工智能研究院;科大讯飞股份有限公司;中科讯飞互联(北京)信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/211;G06F40/30;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 065001 河北省廊坊市经济技术*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语病 识别 方法 装置 电子设备 存储 介质 | ||
本发明提供一种语病识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语句;提取待识别语句中各分词的分词表示;基于待识别语句中各分词的分词表示,以及待识别语句的句法结构,对待识别语句进行语病识别;分词表示用于表征对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系。本发明提供的语病识别方法、装置、电子设备和存储介质,能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语病识别方法、装置、电子设备和存储介质。
背景技术
在文本输入过程中经常由于各种原因导致输入的文本存在语病,例如拼写别字、搭配不当、成分残缺等均可能导致文本中存在语法错误、语义不明等问题。
目前,多通过语言表示模型BERT(Bidirectional Encoder Representationsfrom Transformers)对待识别语句进行语病识别,但上述方法对于语义性病句,识别精度降低。
发明内容
本发明提供一种语病识别方法、装置、电子设备和存储介质,用以解决现有技术中对语义性病句识别精度较低的缺陷。
本发明提供一种语病识别方法,包括:
确定待识别语句;
提取所述待识别语句中各分词的分词表示;
基于所述待识别语句中各分词的分词表示,以及所述待识别语句的句法结构,对所述待识别语句进行语病识别;所述分词表示用于表征对应分词的上下文语义和对应分词与所述待识别语句中其余分词间的句法依赖关系。
根据本发明提供的一种语病识别方法,所述提取所述待识别语句中各分词的分词表示,包括:
基于预训练语言模型,提取所述待识别语句中各分词的分词表示;
所述预训练语言模型是基于初始语言模型,应用第一样本语句以及所述第一样本语句中各分词间的句法依赖关系标签,联合句法依赖关系分类模型训练得到的。
根据本发明提供的一种语病识别方法,所述预训练语言模型是基于如下步骤训练得到的:
将所述第一样本语句输入至所述初始语言模型,得到所述初始语言模型输出的所述第一样本语句中各分词的预测分词表示;
将所述第一样本语句中各分词的预测分词表示输入至所述句法依赖关系分类模型,得到所述句法依赖关系分类模型输出的所述第一样本语句中各分词间的预测句法依赖关系;
基于所述第一样本语句中各分词间的预测句法依赖关系以及所述第一样本语句中各分词间的句法依赖关系标签,对所述初始语言模型和所述句法依赖关系分类模型进行联合训练,得到所述预训练语言模型。
根据本发明提供的一种语病识别方法,所述第一样本语句包括样本掩码语句和第一原始样本语句,所述样本掩码语句是对第二原始样本语句进行分词掩码得到的;
所述基于所述第一样本语句中各分词间的预测句法依赖关系以及所述第一样本语句中各分词间的句法依赖关系标签,对所述初始语言模型和所述句法依赖关系分类模型进行联合训练,得到所述预训练语言模型,包括:
基于所述第一原始样本语句中各分词间的预测句法依赖关系以及所述第一原始样本语句中各分词间的句法依赖关系标签,和所述样本掩码语句对应的预测语句以及所述第二原始样本语句,对所述初始语言模型、所述句法依赖关系分类模型和句子预测模型进行联合训练,得到所述预训练语言模型;
所述句子预测模型用于对所述样本掩码语句进行预测,得到所述样本掩码语句对应的预测语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞河北科技有限公司;河北省讯飞人工智能研究院;科大讯飞股份有限公司;中科讯飞互联(北京)信息科技有限公司,未经科大讯飞河北科技有限公司;河北省讯飞人工智能研究院;科大讯飞股份有限公司;中科讯飞互联(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111467935.7/2.html,转载请声明来源钻瓜专利网。