[发明专利]一种音译文字的方法及装置有效
申请号: | 201610937652.7 | 申请日: | 2016-10-24 |
公开(公告)号: | CN106570001B | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 庄正中;刘勇;陈传艺;李祖辉 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种音译文字的方法及装置,属于信息处理领域。所述方法包括:从存储文件包括的至少一个文字中获取待音译文字;根据音译字典,确定所述待音译文字的罗马拼音,所述音译字典对应的语言与所述待音译文字对应的语言相同,所述音译字典包括所述语言的各文字和所述各文字对应的罗马拼音;在所述存储文件中,使用所述待音译文字的罗马拼音标注所述待音译文字。所述装置包括:获取模块、确定模块和标注模块。本发明能够提高音译文字的效率。 | ||
搜索关键词: | 一种 音译 文字 方法 装置 | ||
【主权项】:
1.一种音译文字的方法,其特征在于,所述方法包括:从存储文件包括的至少一个文字中获取待音译文字;根据所述待音译文字,从音译字典中获取对应的M个罗马拼音,所述音译字典对应的语言与所述待音译文字对应的语言相同,所述音译字典包括所述语言的各文字和所述各文字对应的罗马拼音;如果M为大于或等于2的整数,则从所述存储文件中获取所述待音译文字的上下文信息;如果所述上下文信息中包括多音字,且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量,其中,对于任一个罗马拼音的字向量,所述字向量包括在所述上下文信息中所述待音译文字的读音为所述罗马拼音的概率;获取所述上下文信息包括的除所述多音字以外的每个其他文字对应的预设字向量和预设空格符对应的预设字向量;根据所述每个其他文字对应的预设字向量和预设空格符对应的预设字向量,计算所述待音译文字的字向量;从所述M个罗马拼音中选择字向量与所述待音译文字的字向量最相似的罗马拼音,所述选择的罗马拼音为所述待音译文字的罗马拼音;在所述存储文件中,使用所述待音译文字的罗马拼音标注所述待音译文字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610937652.7/,转载请声明来源钻瓜专利网。