[发明专利]中文文本纠错系统、方法、装置及计算机可读存储介质在审
| 申请号: | 202010414064.1 | 申请日: | 2020-05-15 |
| 公开(公告)号: | CN111639489A | 公开(公告)日: | 2020-09-08 |
| 发明(设计)人: | 李振;张刚;鲍东岳;尹正;张雨枫;刘昊霖;陈厚霖;傅佳美 | 申请(专利权)人: | 民生科技有限责任公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G06N20/00 |
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
| 地址: | 101300 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种中文文本纠错系统、方法、装置及计算机可读存储介质,所述中文文本纠错系统及方法通过机器学习的多种方法检查以及修正中文文本中出现的多种错误,将不通顺的文本修正为通顺的、适合阅读的中文文本,有其针对句子中出现的形状相似或者发音相同的文字进行修正;通过困惑度查询到错误字符发生的位置,再利用混淆集以及语言模型的方式选择正确的修改方式对错误字符进行替换,最终通过评分方法选择返回正确的中文语言表述。本发明采用多线程处理,将输入的短文本分成两批,分两个进程一起跑,加快一倍速度,在并发的条件下,现阶段中文拼写检查+中文拼写纠正的处理效率为500QPS。 | ||
| 搜索关键词: | 中文 文本 纠错 系统 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010414064.1/,转载请声明来源钻瓜专利网。
- 上一篇:用于显示视频数据和图像数据的方法和设备
- 下一篇:云溯源系统





