[发明专利]一种特定领域文本纠错方法、存储介质和装置在审
申请号: | 202211342299.X | 申请日: | 2022-10-31 |
公开(公告)号: | CN115688703A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 邓华;武侠;崔豪驿;鲍娌娜;李荣生;邓养吾;齐一飞;杨阳;刘伟;苗德雨;刘抗抗 | 申请(专利权)人: | 国网山东省电力公司烟台供电公司;国家电网有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/289;G06F40/211;G06F40/30;G06N20/00 |
代理公司: | 泰和泰律师事务所 51219 | 代理人: | 张芳 |
地址: | 264001 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种特定领域文本的纠错方法、存储介质和装置,其中方法包括:构造特定领域训练用数据集;使用通用领域数据集对文本生成模型进行第一阶段训练;对文本生成模型通过加入词性监督信号进行改造,然后利用特定领域训练用数据集对改造后的文本生成模型进行第二阶段训练;对训练后的文本生成模型进行句子级纠错,并解码生成矫正后的文本。本发明无需人工标注标签,可以根据现有数据自动生成标签;能够继承通用领域常用的语法特点与先验知识;能够针对特定领域特别是电力领域做出适配性纠正,能够识别特定领域内的特有名词与常用术语;能够结合句子的词性组合特征来进行纠错。 | ||
搜索关键词: | 一种 特定 领域 文本 纠错 方法 存储 介质 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司烟台供电公司;国家电网有限公司,未经国网山东省电力公司烟台供电公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211342299.X/,转载请声明来源钻瓜专利网。