[发明专利]一种基于多元文本特征的中文语法查错方法及系统有效
申请号: | 202011209481.9 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112183094B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 张仰森;黄改娟;王思远;陈若愚;段瑞雪;尤建清 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/253;G06F40/216;G06F40/30;G06N3/049;G06N3/084;G06N3/0464 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多元文本特征的中文语法查错方法及系统,方法包括:(1)分别利用预训练模型和语法先验知识对文本进行向量表示,得到语义特征向量和词性特征向量,词性特征向量和语义特征向量首尾拼接得到文本的向量序列;(2)利用Bi‑LSTM模型抽取文本的特征向量序列;(3)对特征向量序列进行基于语义和词性搭配信息的注意力增强;(4)对注意力增强后的特征向量序列进行线性变换,得到标签预测序列;(5)对标签预测序列进行基于词序关系特征的信息增强;(6)捕获信息增强后的标签预测序列的约束信息,基于约束信息判别语法错误边界位置。经过验证,本发明表现出较好的查错效果,优于其他现有同类方法。 | ||
搜索关键词: | 一种 基于 多元 文本 特征 中文 语法 查错 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011209481.9/,转载请声明来源钻瓜专利网。