[发明专利]识别文本纠错方法及装置有效
| 申请号: | 201711167434.0 | 申请日: | 2017-11-21 |
| 公开(公告)号: | CN107977356B | 公开(公告)日: | 2019-10-25 |
| 发明(设计)人: | 赵彬;刘俊华;魏思;胡国平 | 申请(专利权)人: | 新疆科大讯飞信息科技有限责任公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28;G10L15/26;G10L15/00 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
| 地址: | 830002 新疆维吾尔自治区乌鲁木*** | 国省代码: | 新疆;65 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种识别文本纠错方法及装置,属于语言处理技术领域。该方法包括:确定识别文本中每一识别错误的错误分词对应的纠错词;将每一纠错词替换识别文本中对应的错误分词,以得到识别文本对应的纠错候选文本;确定每一纠错候选文本对应的纠错置信度,并将纠错置信度大于第一预设阈值的纠错候选文本作为纠错后的识别文本。本发明通过确定每一纠错候选文本对应的纠错置信度,并将纠错置信度大于第一预设阈值的纠错候选文本作为纠错后的识别文本。由于在通过语音识别得到识别文本后,可选取可信程度较高的纠错候选文本作为纠错后的识别文本,以实现对识别文本进行纠错,从而提高了后续翻译的准确性。 | ||
| 搜索关键词: | 识别 文本 纠错 方法 装置 | ||
【主权项】:
1.一种识别文本纠错方法,其特征在于,包括:确定识别文本中每一识别错误的错误分词对应的纠错词,每一错误分词对应至少一个纠错词;将每一纠错词替换所述识别文本中对应的错误分词,以得到所述识别文本对应的纠错候选文本,所述识别文本对应至少一个纠错候选文本;确定每一纠错候选文本对应的纠错置信度,并将纠错置信度大于第一预设阈值的纠错候选文本作为纠错后的识别文本,每一纠错候选文本对应的纠错置信度用于表示每一纠错候选文本作为纠错后的识别文本的可信程度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆科大讯飞信息科技有限责任公司,未经新疆科大讯飞信息科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711167434.0/,转载请声明来源钻瓜专利网。





