[发明专利]一种文本校正方法及用户设备有效

专利信息
申请号: 201210332263.3 申请日: 2012-09-10
公开(公告)号: CN103678271A 公开(公告)日: 2014-03-26
发明(设计)人: 胡楠;杨锦春 申请(专利权)人: 华为技术有限公司
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 北京中博世达专利商标代理有限公司 11274 代理人: 申健
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 校正 方法 用户 设备
【权利要求书】:

1.一种文本校正方法,其特征在于,包括:

获取待校正文本在预设文本分类标准中的两个以上文本类型;

在校正知识库中获取与所述待校正文本的每一个文本类型对应的待组合子语言模型;

将获取的两个以上待组合子语言模型组合成为混合语言模型;

根据所述混合语言模型对所述待校正文本进行校正得到校正建议文本。

2.根据权利要求1所述的方法,其特征在于,所述预设文本分类标准为:语言环境、主题背景、作者、写作风格和题材中的任意一项。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

获取所述预设文本分类标准;

根据所述预设文本分类标准中的文本类型建立两个以上的子语言模型。

4.根据权利要求3所述的方法,其特征在于,所述将获取的两个以上待组合子语言模型组合成为混合语言模型包括:

获取所述待校正文本中各个文本类型的比重;

根据所述各个文本类型的比重,将所述获取的两个以上待组合子语言模型组合获得所述混合语言模型。

5.根据权利要求1至4任意一项权利要求所述的方法,其特征在于,在根据所述混合语言模型对所述待校正文本进行校正得到校正建议文本之前,所述方法还包括:

获取所述校正知识库中的错误检测模型;

通过所述错误检测模型确定所述待处理文本的错误位置,所述错误位置包括错误字符或错误字符串。

6.根据权利要求5所述的方法,其特征在于,所述错误检测模型包括:字接续模型、词性接续模型、音近字典和形近字典中的任意一种或多种。

7.根据权利要求5或6所述的方法,其特征在于,所述根据所述混合语言模型对所述待校正文本进行校正得到校正建议文本包括:

由所述错误位置生成待校正字符串序列;

对所述待校正字符串序列进行校正操作,得到至少一个校正字符串序列;

在所述待校正文本中获取所述错误位置前m个和后n个字符,与所述校正字符串序列组合得到至少一个筛选序列;

根据所述混合语言模型,通过噪声信道概率模型在所述至少一个筛选序列中获取理想字符串出现概率最大的一个字符串序列作为校正建议文本,或

根据所述混合语言模型,通过噪声信道概率模型在所述至少一个筛选序列中获取理想字符串出现概率较大的前几个字符串序列作为校正建议文本。

8.一种用户设备,其特征在于,包括:

获取单元,用于获取待校正文本在预设文本分类标准中的两个以上文本类型;

所述获取单元还用于在校正知识库中获取与所述待校正文本的每一个文本类型对应的待组合子语言模型,并将获取的两个以上待组合子语言模型的信息发送至生成单元;

生成单元,用于接收所述获取单元发送的所述获取的两个以上待组合子语言模型的信息,并将所述获取的两个以上待组合子语言模型组合成为混合语言模型,将所述混合语言模型的信息发送至校正单元;

校正单元,用于接收所述生成单元发送的所述混合语言模型的信息,并根据所述混合语言模型对所述待校正文本进行校正得到校正建议文本。

9.根据权利要求8所述的用户设备,其特征在于,所述预设文本分类标准为:语言环境、主题背景、作者、写作风格和题材中的任意一项。

10.根据权利要求9所述的用户设备,其特征在于,所述用户设备还包括:

所述获取单元,用于获取所述预设文本分类标准,并将所述预设文本分类标准发送至建立单元;

建立单元,用于接收所述获取单元发送的所述预设文本分类标准,根据所述预设文本分类标准中的文本类型建立两个以上的子语言模型。

11.根据权利要求10所述的用户设备,其特征在于,所述生成单元具体用于:

获取所述待校正文本中各个文本类型的比重;

根据所述各个文本类型的比重,将所述获取的两个以上待组合子语言模型组合获得所述混合语言模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210332263.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top