[发明专利]中文汉字自动标注拼音的系统及其标注方法在审
申请号: | 201510202397.7 | 申请日: | 2015-04-27 |
公开(公告)号: | CN104765725A | 公开(公告)日: | 2015-07-08 |
发明(设计)人: | 邱行中 | 申请(专利权)人: | 邱行中 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 深圳市万商天勤知识产权事务所(普通合伙) 44279 | 代理人: | 王志明 |
地址: | 518026 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 汉字 自动 标注 拼音 系统 及其 方法 | ||
1.一种中文汉字自动标注拼音的系统,用于对中文汉字自动标注拼音,其特征在于:
该系统包括:一数据库,储存有中文汉字及其对应的拼音,所述数据库中的中文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词组对应的优先级别较高,拼音采用两拼法,一组字符表示声母,另一组字符表示韵母,对于有声母的中文汉字,每个中文汉字仅用一个声母字符和一个韵母字符标注拼音,而对于无声母的中文汉字,仅用一个韵母字符标注拼音;
一提取模块,采用全屏提取的方式,提取当前所显示的中文页面中的中文汉字串,或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比;
一转换模块,根据该数据库,将该中文汉字串转换为对应的拼音;及
一显示模块,将该拼音显示在与该中文汉字串对应的位置。
2.根据权利要求1所述的中文汉字自动标注拼音的系统,其特征在于:该显示模块还包括一位置单元,用以确定该拼音的显示区域。
3.根据权利要求2所述的中文汉字自动标注拼音的系统,其特征在于:所述显示区域为该页面中的中文汉字串的各个汉字的正上方区域。
4.根据权利要求2所述的中文汉字自动标注拼音的系统,其特征在于:所述显示区域为在当前鼠标所在位置开启的一窗口。
5.一种中文汉字自动标注拼音的方法,用于对中文汉字自动标注拼音,其特征在于:
该方法包括如下步骤:建立中文汉字与对应的拼音的数据库,所述数据库中的中文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词组对应的优先级别较高,拼音采用两拼法,一组字符表示声母,另一组字符表示韵母,对于有声母的中文汉字,每个中文汉字仅用一个声母字符和一个韵母字符标注拼音,而对于无声母的中文汉字,仅用一个韵母字符标注拼音;
提取中文页面,采用全屏提取的方式,提取当前显示的中文页面中的中文汉字串,或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比;
根据该数据库将该中文汉字串转换为对应的拼音;及
将该拼音显示在与该中文汉字串对应的位置。
6.根据权利要求5所述的中文汉字自动标注拼音的方法,其特征在于:还包括确定该中文汉字串的各个汉字的正上方作为该拼音的显示区域的步骤。
7.根据权利要求5所述的中文汉字自动标注拼音的方法,其特征在于:还包括确定在当前鼠标的所在位置开启一窗口作为该拼音的显示区域的步骤。
8.根据权利要求5至7中任一项所述的中文汉字自动标注拼音的方法,其特征在于:为建立中文汉字与对应的拼音的数据库,声母采用下列声母表中的一种:
声母表一
注:分别表示zh、ch、sh。
声母表二
声母表三
注:分别表示zh、ch、sh。
9.根据权利要求5至7中任一项所述的中文汉字自动标注拼音的方法,其特征在于:为建立中文汉字与对应的拼音的数据库,韵母采用下列韵母表中的一种:
韵母表一
韵母表二
韵母表三
韵母表四
韵母表五
10.根据权利要求5至7中的任一项所述的中文汉字自动标注拼音的方法,其特征在于:
为建立中文汉字与对应的拼音的数据库,选择韵母的方法是:首先选择13个新的字符分别表示现用的13个韵母a、ai、ao、an、ang、e、ei、er、en、eng、o、ou、ong;
接着选择1个不同的新字符表示现用的韵母i,分别与表示a、ao、an、ang、e、en、eng、ou、ong的上述新字符构成9个单一的字符,表示现用的韵母ia、iao、ian、iang、ie、in、ing、iu、iong;
然后选择另1个不同的新字符表示现用的韵母u,分别与表示a、ai、an、ang、ei、en、eng、o的上述新的字符构成8个单一的字符,表示现用的韵母ua、uai、uan、uang、ui、un、ueng、uo;
最后选择另1个不同的新字符表示现用的韵母ü,分别与表示an、e、en的上述新的字符构成3个单一的字符,表示现用的韵母üan、üe、ün。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邱行中,未经邱行中许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510202397.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在网络论坛中开设坟场的办法
- 下一篇:用于构建会议内容的设备和方法