[发明专利]一种改错模型训练方法、装置和文本改错方法、装置有效
申请号: | 201310033697.8 | 申请日: | 2013-01-29 |
公开(公告)号: | CN103970765A | 公开(公告)日: | 2014-08-06 |
发明(设计)人: | 李露;程强;饶丰;卢鲤;张翔;岳帅;陈波;陆读羚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张玉波;宋志强 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种改错模型训练方法、装置和文本改错方法、装置。该方法包括:搜索正确字符串在训练文本集中的上下文信息,以所述上下文信息作为有效上下文信息,存储每个有效上下文信息对应的所有正确字符串;搜索训练文本集中与所述正确字符串的相似性满足预定要求、且具备所述有效上下文信息的待处理字符串;根据所述待处理字符串、与所述待处理字符串的相似性满足预定要求的正确字符串以及所述待处理字符串和所述正确字符串共同的有效上下文信息生成改错规则,根据对改错规则的测试结果建立改错模型。应用本发明能够提供一种利用其进行文本改错时具备较高错误召回率和改错准确性的改错模型,提高文本改错的错误召回率和改错的准确性。 | ||
搜索关键词: | 一种 改错 模型 训练 方法 装置 文本 | ||
【主权项】:
一种改错模型的训练方法,其特征在于,该方法包括:搜索正确字符串在训练文本集中的上下文信息,以所述上下文信息作为有效上下文信息,存储每个有效上下文信息对应的所有正确字符串;搜索训练文本集中与所述正确字符串的相似性满足预定要求、且具备所述有效上下文信息的待处理字符串;根据所述待处理字符串、与所述待处理字符串的相似性满足预定要求的正确字符串以及所述待处理字符串和所述正确字符串共同的有效上下文信息生成改错规则,根据对改错规则的测试结果建立改错模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310033697.8/,转载请声明来源钻瓜专利网。