[发明专利]一种基于新型汉字全息编码规则的明盲文转换系统有效
申请号: | 201710517639.0 | 申请日: | 2017-06-29 |
公开(公告)号: | CN107451105B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 富明慧 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F40/129 | 分类号: | G06F40/129;G06F40/284 |
代理公司: | 广州容大专利代理事务所(普通合伙) 44326 | 代理人: | 刘新年 |
地址: | 510275 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于新型汉字全息编码规则的明盲文转换系统,包括:文本采集模块,用于从外部获取汉字文本;读音数据库,用于存储汉字的读音;分词预处理模块,用于向文本采集模块从外部获取的汉字文本中,自动或手动插入分词标记;汉字全息码预编译模块,用于将所述汉字文本编译成汉字全息码的编码格式,并存储到汉字全息文件存储模块中;汉字全息文件存储模块,用于存储汉字全息码格式的文件。本发明采用新型的汉字全息码作为文件存储格式,在确定汉字字形的同时,也唯一确定了其读音,还明确了是否与后面汉字分词,包含了明盲文转换时所需的全部信息。利用本发明,能从根本上克服目前汉字盲文阅读中普遍存在的“费解”、“误解”等问题。 | ||
搜索关键词: | 一种 基于 新型 汉字 全息 编码 规则 盲文 转换 系统 | ||
【主权项】:
一种基于新型汉字全息编码规则的明盲文转换系统,其特征在于,包括:文本采集模块,用于从外部获取汉字文本;读音数据库,用于存储汉字的读音;其中,每个多音字的多个不同读音被按照一定顺序进行编号,且其中一个读音被设定为默认读音;分词预处理模块,用于向文本采集模块从外部获取的汉字文本中,自动或手动插入分词标记;汉字全息码预编译模块,用于结合读音数据库中设定的默认读音以及分词预处理模块中插入的分词标记,将所述汉字文本编译成汉字全息码的编码格式,并存储到汉字全息文件存储模块中;汉字全息文件存储模块,用于存储汉字全息码格式的文件;其中,所述汉字全息码的编码格式为:一个汉字全息码对应一个汉字;汉字全息码的前2字节为该汉字的内码;汉字全息码第3字节的其中一位定义为分词标识码,以分词标识码的不同数值标识该汉字是否与下一个汉字组成分词;汉字全息码的第4字节定义为读音标识码,以读音标识码的数值大小标识该汉字在上下文中正确读音所对应的编号;所述系统还包括:文本编辑模块,用于从汉字全息文件存储模块中读取汉字全息码格式的文件,对汉字全息码中的汉字信息和分词信息进行解译,显示出对应的汉字文本及分词标记,供用户进行审阅和修改;当用户对汉字文本或分词标记进行修改时,同步修改汉字全息文件存储模块中存储的汉字全息码;注音编辑模块,用于从汉字全息文件存储模块中读取汉字全息码格式的文件,对汉字全息码中的汉字信息和读音信息进行解译,显示出对应的汉字文本和多音字的读音信息,结合读音数据库,供用户审阅并修正多音字的正确读音;当用户对多音字的读音进行更改时,同步修改汉字全息文件存储模块中存储的汉字全息码;盲文转换模块,用于从汉字全息文件存储模块中读取汉字全息码格式的文件,对汉字全息码中的分词信息和读音信息进行解译,并结合读音数据库确定各汉字的读音,以将汉字全息码中的汉字信息转换为盲文供用户审阅及修改;当用户对盲文进行修改时,同步修改汉字全息文件存储模块中存储的汉字全息码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710517639.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种文件版本信息存储方法及其专用装置
- 下一篇:一种协同编辑文档的方法和系统