[发明专利]一种带有容错能力的中文内容拼写校正系统及方法无效
申请号: | 201110339934.4 | 申请日: | 2011-11-01 |
公开(公告)号: | CN102368271A | 公开(公告)日: | 2012-03-07 |
发明(设计)人: | 陈淮琰;陈国强 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/023 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 商宇科 |
地址: | 710075 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 带有 容错 能力 中文 内容 拼写 校正 系统 方法 | ||
技术领域
本发明涉及一种校正中文内容的方法,尤其涉及一种带有容错能力的中文内容拼写校正系统及方法。
背景技术
现在有中文查询或输入的画面的电子辞典、PDA、PC等电子产品非常多,也被很多的用户使用,但是对于查询或输入中文内容时,因为有字念错,例如:想输入“吹毛求疵(chuimaoqiuci)”,却输入成“吹毛球比(chuimaoqiubi)”,但在现有技术中就无法由“吹毛球比”查询或匹配到用户实际想输入的“吹毛求疵”上,具有很大局限性。
发明内容
为了解决背景技术中所存在的技术问题,本发明提出了一种带有容错能力的中文内容拼写校正系统及方法,适用范围广泛,实用性强。
本发明的技术解决方案是:一种带有容错能力的中文内容拼写校正系统,其特殊之处在于:所述系统包括获取拼音或中文内容的获取模块、进行对照查找的查找模块、储存对照表信息的储存模块、判断匹配信息的处理模块以及输出匹配内容的输出模块;所述获取模块与查找模块连接,所述处理模块与查找模块连接,所述输出模块与处理模块连接,所述储存模块与查找模块连接。
上述系统还包括将中文内容进行转换的转换模块,所述转换模块与获取模块连接。
上述储存模块包括缺省的常用字词组合的拼音资料库、常用字词组合的拼音汉字对照表以及相应的汉字与其拼音序列对照的数据库。
一种带有容错能力的中文内容拼写校正方法,其特殊之处在于:所述方法包括以下步骤:
1)建立缺省的常用字词组合的拼音资料库;
2)建立常用字词组合的拼音汉字对照表;
5)获取拼音序列;
6)根据常用字词组合的拼音汉字对照表查询与获取的拼音序列相匹配的字词;
7)判断是否匹配到符合要求的字词,若是,进行步骤6);
8)输出匹配的字词。
上述步骤7)若没有匹配到符合要求的字词,则进行步骤7.1)省略部分字拼音后在缺省的常用字词组合的拼音资料库中查找相匹配的字词。
上述步骤2)之后还包括步骤3)建立相应的汉字与其拼音序列对照的数据库。
上述步骤3)之后还包括步骤4)得到中文内容,根据相应的汉字与其拼音序列对照的数据库得到与中文内容对应的拼音序列。
本发明是一种根据汉字拼音拼写组合及发音规则,结合常用字词组合规则来校正中文内容的方法,用户可以通过此方法来输入或查询更多的中文近音字汇,可以更为快捷和简便需要学习字汇或需要查询更多字汇的用户。本发明可更大范围的满足用户输入或查询字汇的需求,并且字汇的查询和输入具有扩展性和延伸性。
附图说明
图1是本发明的结构示意图;
图2为由输入拼音序列得到拼写校正内容的方法流程图;
图3为由中文内容得到拼写校正内容的方法流程图;
具体实施方式
参见图1,本发明的带有容错能力的中文内容拼写校正系统,包括获取拼音或中文内容的获取模块1、进行对照查找的查找模块2、储存对照表信息的储存模块3、判断匹配信息的处理模块4以及输出匹配内容的输出模块5;获取模块与1查找模块2连接,处理模块4与查找模块2连接,输出模块5与处理模块4连接,储存模块3与查找模块2连接;还包括将中文内容进行转换的转换模块6,转换模块6与获取模块1连接;储存模块3包括缺省的常用字词组合的拼音资料库、常用字词组合的拼音汉字对照表以及相应的汉字与其拼音序列对照的数据库。
参见图2,图3,本发明的带有容错能力的中文内容拼写校正方法,包括以下步骤:
1)建立缺省的常用字词组合的拼音资料库;
2)建立常用字词组合的拼音汉字对照表;
3)建立相应的汉字与其拼音序列对照的数据库;
4)得到中文内容,根据相应的汉字与其拼音序列对照的数据库得到与中文内容对应的拼音序列;
5)获取拼音序列;
6)根据常用字词组合的拼音汉字对照表查询与获取的拼音序列相匹配的字词;
7)判断是否匹配到符合要求的字词,若是,进行步骤6);若没有匹配到符合要求的字词,则进行步骤7.1)省略部分字拼音后在缺省的常用字词组合的拼音资料库中查找相匹配的字词。
8)输出匹配的字词。
本发明的方法灵活性很高,如果用户输入的是拼音,则先直接在对照表中查找对应的字词组合,如果没有再在数据库中查找;
如果是中文内容则先在数据库中找到其中文所对应的拼音序列,再通过拼音替换表对所得到的拼音序列进行替换;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110339934.4/2.html,转载请声明来源钻瓜专利网。