[发明专利]一种面向语义识别的纸质翻译方法及翻译笔装置在审
申请号: | 201510714094.3 | 申请日: | 2015-10-28 |
公开(公告)号: | CN105335356A | 公开(公告)日: | 2016-02-17 |
发明(设计)人: | 周相兵;段成;马洪江 | 申请(专利权)人: | 阿坝师范学院 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06K9/20 |
代理公司: | 成都赛恩斯知识产权代理事务所(普通合伙) 51212 | 代理人: | 朱月仙 |
地址: | 623002 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 语义 识别 纸质 翻译 方法 译笔 装置 | ||
技术领域
本发明属于语义识别及光学相结合的交叉领域,尤其涉及一种面向语义识别的纸质翻译方法及翻译笔装置。
背景技术
随着“互联网+”时代的到来,信息产业逐步成为支撑产业,人们的生活和思维模式已随之发生了重要变化,获取服务的方式从传统的面对面、电话联络等转向了互联网,实现了网上在线交易和支付;获取知识的方式也从传统的书本、字典、单一数据库等转向了互联网上。这样不仅可以快速在互联网上获取到满足自己需求的服务,而且还尽可能获取到更精确、有效的服务结果。而作为翻译领域,已成为人们同世界进一步融合的重要语言关,但由于不同的国家、地区所使用的语言是不同的,而英语作为国际标准,从而使得英语成为国际语言及文献、文档等交流的主流;作为非英语语言国家、地区的人们来说,仍不能熟悉、熟练使用英语来完成自己工作。因此,近年来基于互联网技术的电子翻译(鼠标取词)软件用来解决人们所遇到词汇量不大的问题,这些软件针对电子文档、文献和文件有很好的翻译结果,也能有效满足人们的工作和生活需求;但因纸质英语文献、文档和文件长期存在于人们的工作和生活中,使得这些电子翻译软件中的鼠标取词功能无法发挥其优势,要快速获取翻译结果就显得力不从心;这时要获取好的取词翻译结果,需要手动将单词输入到相关的翻译软件中,这样既延长了翻译时间,也无法获取好的连贯翻译结果;虽然这些翻译软件在互联网及相关网络支持下,通过移动智能终端也可以手动输入单词进行翻译,但仍存在输入麻烦,操作不方便等问题,就对纸质的英语文献的翻译带来了挑战,即怎样通过一种简捷的方式就可以轻松实现纸质英语文献互译。
现有技术中涉及的一些针对纸本文献的翻译设备,如实用新型专利CN203133843U,涉及一种翻译扫描笔,采用扫描笔端部的摄像头采集字符图像,然后调用识别库对图像识别为字符,虽实现了纸本文献的字符识别和翻译,但无法解决文本识别误识别率高的问题;另外,传统的OCR扫描纸质文献转换为文本,在实现特征提取、识别、向文本转换、对比等操作时,还有相当的误识率,而且在单词间的分辨也不够精确。
发明内容
针对现有技术存在的问题,本发明的主要目的在于提供一种降低纸质文本误识别率、自动进行纸质文本翻译的面向语义识别的纸质翻译方法及翻译笔装置。
本发明涉及一种面向语义识别的纸质翻译方法,该方法包括如下步骤(1)至步骤(6):
步骤(1)对英文字符进行基础性编码,建立字符编码库(CodeL)、规则库(RuleL)和字体库(FontL),将字符编码库、规则库和字体库进行组合及排列形成编码准备库(CodeL,RuleL,FontL);
步骤(2)利用OCR(OpticalCharacterRecognition)对待翻译的纸质英文进行扫描识别;
步骤(3)对完成识别的字符串利用编码准备库进行编码;
步骤(4)对编码后的字符串进行语义化处理,完成编码语义化描述;
步骤(5)利用OCR识别单词认知推理获得精确识别的英语单词;
步骤(6)将OCR精确识别的英语单词与电子词典连接,实现自动翻译。
进一步地,该步骤(4)对编码后的字符串进行语义化处理,完成编码语义化描述,包括如下步骤(4.1)至步骤(4.3):
步骤(4.1)利用字符编码库(CodeL)、规则库(RuleL)和字体库(FontL)完成语义操作OP(So,To,P),生成语义操作矩阵R,其中So表示语义源字符编码库CodeL,To表示语义目标源字体库FontL,P表示源与目标间的语义操作规则库RuleL;
步骤(4.2)利用描述逻辑DL(SOM,I,DLKB(Oi,Oj),Tableau)进行语义推理,其中SOM是语义运算符,I是语义运算的解释,DLKB(Oi,Oj)是语义运算的知识库,Tableau是语义计算的决策算法;
步骤(4.3)在语义推理的基础上完成语义决策。
更进一步地,该步骤(5)利用OCR识别单词认知推理获得精确识别的英语单词,包括如下步骤(5.1)至步骤(5.5):
步骤(5.1)将识别的字符串与语料库中的字符串进行相似度计算,构成相似记录矩阵,并获得最大的相似度值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿坝师范学院,未经阿坝师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510714094.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据升级方法和装置
- 下一篇:一种通过网页远程处理Excel文件的方法及装置