[发明专利]一种自动为汉字添加拼音的方法及装置有效
申请号: | 200810055831.3 | 申请日: | 2008-01-09 |
公开(公告)号: | CN101482867A | 公开(公告)日: | 2009-07-15 |
发明(设计)人: | 王铭宇;王全鹏;杨春 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06F17/21 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 黄志华 |
地址: | 100871北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 汉字 添加 拼音 方法 装置 | ||
技术领域
本发明涉及印刷排版技术领域,尤其涉及一种自动为汉字添加拼音的方法 及装置。
背景技术
由于汉字中存在大量的多音字,怎样确定整篇文档中的多音字的拼音是一 个很困难的问题。因此,在当前各种排版或者文档处理软件中,很少具有可以 直接给整段或整篇文章进行大数据量地添加拼音的功能。现有技术中常见的添 加拼音方式主要有以下两种:
基于字和词级别的添加拼音方式。但是,由于汉字多音字的存在,往往还 需要用户进行选择以确定该字的拼音。
基于段和篇级别的添加拼音方式。但是,由于确定多音字拼音所采用的方 法运算的复杂性,一般添加拼音的效率很低,并且不是完全自动匹配,遇到多 音字的情况需要用户进行选择或校正。
综上所述,现有技术一般都需要基于中文分词后查找词库的方法来完成自 动为汉字添加拼音,这种方法需要有分词字典和拼音库的支持,其复杂的匹配 运算过程对于大量汉字加拼音的情况效率很低,不适于整篇文章等大量数据的 加拼音操作。如果不分词,则准确率太差,需要进行大量的手动校正。因此, 现有技术为汉字添加拼音的排版工作效率低,并且浪费人力。
发明内容
本发明实施例提供了一种自动为汉字添加拼音的方法及装置,用以解决现 有技术中存在的为汉字自动添加拼音的工作效率低,准确性差的问题。
本发明实施例提供的自动为汉字添加拼音的方法包括:
分别将用户选定的需要添加拼音的文字中每两个相邻的非汉字字符之间 的汉字收集到汉字数组中;
将用户选定的需要添加拼音的汉字与预先设置的词库中的词进行词匹配 操作,当所述汉字数组中连续的多个汉字与所述词库中的同一个词完全匹配或 部分匹配时,确认所述词匹配操作成功,将匹配成功的所述词库中的词的拼音 添加给相应的需要添加拼音的汉字;
当所述词匹配操作失败时,将所述词匹配失败的汉字与预先设置的字库中 的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添加给相应的需要 添加拼音的汉字。
本发明实施例提供的自动为汉字添加拼音的装置包括:
第一匹配单元,用于分别将用户选定的需要添加拼音的文字中每两个相邻 的非汉字字符之间的汉字收集到汉字数组中;将用户选定的需要添加拼音的汉 字与预先设置的词库中的词进行词匹配操作,当所述汉字数组中连续的多个汉 字与所述词库中的同一个词完全匹配或部分匹配时,确认所述词匹配操作成 功,将匹配成功的所述词库中的词的拼音添加给相应的需要添加拼音的汉字;
第二匹配单元,用于当所述词匹配操作失败时,将所述词匹配失败的汉字 与预先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼 音添加给相应的需要添加拼音的汉字。
本发明实施例,将用户选定的需要添加拼音的汉字分别与预先设置的词库 中的词进行词匹配操作,将匹配成功的所述词库中的词的拼音添加给相应的需 要添加拼音的汉字;当所述词匹配操作失败时,将所述词匹配失败的汉字与预 先设置的字库中的字进行字匹配操作,将匹配成功的所述字库中的字的拼音添 加给相应的需要添加拼音的汉字。通过该技术方案,实现了自动为用户选定的 文字添加拼音的操作,在保证准确性的前提下,避免了现有技术由于需要进行 分词而带来的复杂运算问题,提高了自动添加拼音的工作效率。
附图说明
图1为本发明实施例提供的自动为汉字添加拼音的总体方法流程示意图;
图2为用户选定的需要添加拼音的文档示意图;
图3为本发明实施例提供的为汉字数组中的汉字添加拼音的具体流程示意 图;
图4为采用本发明实施例提供的方法为用户选定的文字添加拼音后的效果 示意图;
图5为用户选定的若干段落的示意图;
图6为采用本发明实施例提供的方法为用户选定的若干段落添加拼音后的 效果示意图。
具体实施方式
本发明实施例,提供了一种自动为汉字添加拼音的方法及装置。对于选定 的需要添加拼音的文字中每两个相邻的非汉字字符之间的汉字,通过将其分别 与预先设置的词库中的词或字库中的字进行匹配,以得到需要添加的拼音,从 而在不进行分词的情况下达到与分词后再加拼音同样的准确率,提高为汉字添 加拼音的效率。
下面结合附图,说明本发明的具体实施方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810055831.3/2.html,转载请声明来源钻瓜专利网。