[发明专利]一种语音信息转换方法及装置在审

专利信息
申请号: 201210478720.X 申请日: 2012-11-22
公开(公告)号: CN103838714A 公开(公告)日: 2014-06-04
发明(设计)人: 段作杰;赵欣 申请(专利权)人: 北大方正集团有限公司;方正移动传媒技术(北京)有限公司
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 100871 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 信息 转换 方法 装置
【说明书】:

技术领域

发明涉及数据的处理领域,具体涉及一种语音信息转换方法及装置。

背景技术

随着经济的迅猛发展和人民生活水平的提高,国人与外国友人接触和交流的机会越来越多,包括出境旅游和工作原因甚至日常生活中也会接触。但是,要让每一个接触外籍人士的人都精通外籍人士的语音是不现实的,而且外语也有很多种类,这样必然会碰见一些语言不通的情况,对工作、生活、旅游等带来很多不便,当然,外籍人士也会遇到同样的问题。

现在的同声传译设备只应用在重要的会议场所,应用方式如图1所示,需要专业的设备和高水平的翻译人员,将演讲者的语言翻译为不同的语种,花费了大量的人力和物力,而且对不同国家的与会人员需要不同的翻译人员,翻译人员听取演讲人的演讲内容并翻译成相关语言,与会人员通过设备上的开关选择想要听到的语言。

所以,上面的设备不适应于社会交往的实际应用场合中,同样也出游等日常生活中也不可能携带。

综上所述,现有技术缺乏一种适用于大多数场合及普通人群的语言翻译设备及方法。

发明内容

本发明实施例提供了一种语音信息转换方法及装置,用以使交流的双方可进行无障碍交谈,不用担心语言的障碍。

本发明实施例提供一种语音信息转换方法,该方法包括:

接收第一语言类别的语音信息,并动态识别为第一语言类别的文字信息;

根据第一语言类别和需要输出的语音信息所属的第二语言类别,将所述第一语言类别的文字信息动态翻译为第二语言类别的文字信息;

根据所述第二语言类别的文字信息,合成第二语言类别的语音信息并输出。

本发明实施例提供一种语音信息转换装置,该装置包括:

第一音频接口,用于接收第一语言类别的语音信息和输出第二语言类别的语音信息;

语音识别模块,用于将所述第一语言类别的语音信息动态识别为第一语言类别的文字信息;

语言翻译模块,用于根据第一语言类别和需要输出的语音信息所属的第二语言类别,将所述第一语言类别的文字信息动态翻译为第二语言类别的文字信息;

语音合成模块,用于根据所述第二语言类别的文字信息,合成第二语言类别的语音信息并输出。

本发明实施例,由于使用者在操作时只需要选择需要交流的语言就可以进行语言交流,所以操作简单,不需要太多繁琐的操作,便于使用;由于本装置通过语音识别模块、语言翻译模块和语音合成模块即可实现,结构简单,使得本装置小巧易携带,所以只要需要与外籍人士交流的场合都可以使用,特别适用于外语不好的人士,另外学习外语的人士也可以自己说自己听,应用领域广阔;由于本装置操作过程简单,采用嵌入式平台实现,这样本装置制作成本低廉,经济效益高。

附图说明

图1为现有技术提供的同声传译设备的工作示意图;

图2为本发明实施例提供的语音信息转换方法的流程示意图;

图3为本发明实施例提供的语音信息转换装置的结构示意图;

图4为本发明实施例提供的语音信息转换装置的软件结构示意图;

图5为本发明实施例提供的语音信息转换装置的硬件结构示意图。

具体实施方式

本发明实施例提供了一种语音信息转换方法及装置,用以进行不同语言之间的动态转换,使不同语言和国家的人可进行无障碍交谈,不用担心语言的障碍。

首先,如图2所示,本发明实施例提供了一种语音信息转换方法,能够根据语音提供语言的动态翻译,该方法包括:

S101,接收第一语言类别的语音信息,并动态识别为第一语言类别的文字信息;

S102,根据第一语言类别和需要输出的语音信息所属的第二语言类别,将所述第一语言类别的文字信息动态翻译为第二语言类别的文字信息;

S103,根据所述第二语言类别的文字信息,合成第二语言类别的语音信息并输出。

本发明实施例以文字信息之间的转化作为桥梁,实现了不用语言类别的语音信息之间的动态相互转换,这样在交流过程中,完全不用翻译人员,交流双方可以直接进行无障碍对话,沟通更方便,而且本方法适用于绝大多数场合及人群使用。例如,一方为中国人,一方为美国人,使用本发明方法,可进行英文与汉语之间的语言转换,实现双方无障碍交流,非常简单而且易操作。

所述动态识别的规则可以根据需要设定,例如,根据使用者的语音输入的停顿进行区分,在其停顿时间超过阈值的情况下,将这一段的语音信息统一识别为文字信息,所述阈值的长短可以根据需要进行设定。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;方正移动传媒技术(北京)有限公司,未经北大方正集团有限公司;方正移动传媒技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210478720.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top