[发明专利]一种语音信息转换方法及装置在审
申请号: | 201210478720.X | 申请日: | 2012-11-22 |
公开(公告)号: | CN103838714A | 公开(公告)日: | 2014-06-04 |
发明(设计)人: | 段作杰;赵欣 | 申请(专利权)人: | 北大方正集团有限公司;方正移动传媒技术(北京)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信息 转换 方法 装置 | ||
技术领域
本发明涉及数据的处理领域,具体涉及一种语音信息转换方法及装置。
背景技术
随着经济的迅猛发展和人民生活水平的提高,国人与外国友人接触和交流的机会越来越多,包括出境旅游和工作原因甚至日常生活中也会接触。但是,要让每一个接触外籍人士的人都精通外籍人士的语音是不现实的,而且外语也有很多种类,这样必然会碰见一些语言不通的情况,对工作、生活、旅游等带来很多不便,当然,外籍人士也会遇到同样的问题。
现在的同声传译设备只应用在重要的会议场所,应用方式如图1所示,需要专业的设备和高水平的翻译人员,将演讲者的语言翻译为不同的语种,花费了大量的人力和物力,而且对不同国家的与会人员需要不同的翻译人员,翻译人员听取演讲人的演讲内容并翻译成相关语言,与会人员通过设备上的开关选择想要听到的语言。
所以,上面的设备不适应于社会交往的实际应用场合中,同样也出游等日常生活中也不可能携带。
综上所述,现有技术缺乏一种适用于大多数场合及普通人群的语言翻译设备及方法。
发明内容
本发明实施例提供了一种语音信息转换方法及装置,用以使交流的双方可进行无障碍交谈,不用担心语言的障碍。
本发明实施例提供一种语音信息转换方法,该方法包括:
接收第一语言类别的语音信息,并动态识别为第一语言类别的文字信息;
根据第一语言类别和需要输出的语音信息所属的第二语言类别,将所述第一语言类别的文字信息动态翻译为第二语言类别的文字信息;
根据所述第二语言类别的文字信息,合成第二语言类别的语音信息并输出。
本发明实施例提供一种语音信息转换装置,该装置包括:
第一音频接口,用于接收第一语言类别的语音信息和输出第二语言类别的语音信息;
语音识别模块,用于将所述第一语言类别的语音信息动态识别为第一语言类别的文字信息;
语言翻译模块,用于根据第一语言类别和需要输出的语音信息所属的第二语言类别,将所述第一语言类别的文字信息动态翻译为第二语言类别的文字信息;
语音合成模块,用于根据所述第二语言类别的文字信息,合成第二语言类别的语音信息并输出。
本发明实施例,由于使用者在操作时只需要选择需要交流的语言就可以进行语言交流,所以操作简单,不需要太多繁琐的操作,便于使用;由于本装置通过语音识别模块、语言翻译模块和语音合成模块即可实现,结构简单,使得本装置小巧易携带,所以只要需要与外籍人士交流的场合都可以使用,特别适用于外语不好的人士,另外学习外语的人士也可以自己说自己听,应用领域广阔;由于本装置操作过程简单,采用嵌入式平台实现,这样本装置制作成本低廉,经济效益高。
附图说明
图1为现有技术提供的同声传译设备的工作示意图;
图2为本发明实施例提供的语音信息转换方法的流程示意图;
图3为本发明实施例提供的语音信息转换装置的结构示意图;
图4为本发明实施例提供的语音信息转换装置的软件结构示意图;
图5为本发明实施例提供的语音信息转换装置的硬件结构示意图。
具体实施方式
本发明实施例提供了一种语音信息转换方法及装置,用以进行不同语言之间的动态转换,使不同语言和国家的人可进行无障碍交谈,不用担心语言的障碍。
首先,如图2所示,本发明实施例提供了一种语音信息转换方法,能够根据语音提供语言的动态翻译,该方法包括:
S101,接收第一语言类别的语音信息,并动态识别为第一语言类别的文字信息;
S102,根据第一语言类别和需要输出的语音信息所属的第二语言类别,将所述第一语言类别的文字信息动态翻译为第二语言类别的文字信息;
S103,根据所述第二语言类别的文字信息,合成第二语言类别的语音信息并输出。
本发明实施例以文字信息之间的转化作为桥梁,实现了不用语言类别的语音信息之间的动态相互转换,这样在交流过程中,完全不用翻译人员,交流双方可以直接进行无障碍对话,沟通更方便,而且本方法适用于绝大多数场合及人群使用。例如,一方为中国人,一方为美国人,使用本发明方法,可进行英文与汉语之间的语言转换,实现双方无障碍交流,非常简单而且易操作。
所述动态识别的规则可以根据需要设定,例如,根据使用者的语音输入的停顿进行区分,在其停顿时间超过阈值的情况下,将这一段的语音信息统一识别为文字信息,所述阈值的长短可以根据需要进行设定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;方正移动传媒技术(北京)有限公司,未经北大方正集团有限公司;方正移动传媒技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210478720.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置