[发明专利]带有个性化语音的多媒体转换的方法及服务端无效
申请号: | 200810020316.1 | 申请日: | 2008-02-29 |
公开(公告)号: | CN101521853A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 李嘉辉 | 申请(专利权)人: | 丰达软件(苏州)有限公司;李嘉辉 |
主分类号: | H04W4/12 | 分类号: | H04W4/12;H04M1/725 |
代理公司: | 南京苏科专利代理有限责任公司 | 代理人: | 陈忠辉 |
地址: | 215021江苏省苏州市工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 带有 个性化 语音 多媒体 转换 方法 服务端 | ||
技术领域
本发明涉及网络通信技术领域,特别涉及一种带有个性化语音的多媒体转换的方法,以及实施这种方法的服务端。
背景技术
随着手机娱乐业的日益发展,基于无线网络的多媒体传输已经越来越普及,而且人们对多媒体通信内容的要求日益提高,人们不再满足于单一、被动的传统媒体娱乐方式,而是需要更加个性化、互动化的多媒体通信方式。特别是随着移动网络通信技术的进一步发展,以及移动多媒体业务的日益普及,移动多媒体已经越来越显示其广泛和越趋成熟的用户认知以及接受度。
现阶段,由服务提供商所提供的多媒体所发出的语音,其音色特征和韵律特征都是服务端固有的,无法满足用户的个性化需求。
发明内容
本发明要解决的问题是提供一种带有个性化语音的多媒体转换的方法,使得在用户端可以个性化地定制多媒体,有效提高用户体验度。
为达到上述目的,一种带有个性化语音的多媒体转换的方法,发送端向服务端发送文本信息,服务端接收之后将所述文本信息转换成多媒体文件,其特征在于:所述文本信息包括语句信息,服务端接收到该文本信息并且转换成多媒体文件之后,再根据发送端预先上传的语音文件,将所述文本信息中的语句信息转换为与发送端预先上传的语音文件相对应的个性化的语音文件,然后将转换得到的语音文件替换所述多媒体文件中的音频部分。
进一步地,上述的带有个性化语音的多媒体转换的方法,其中,服务端将所述语句信息转换为个性化的语音文件的方法是,服务端利用现已成熟的个性化语音生成技术,通过与发送端相对应的语音文件,将所述语句信息转换为个性化的语音文件。
再进一步地,上述的带有个性化语音的多媒体转换的方法,其中,服务端将所述文本信息转换为多媒体文件的方法是,服务端从多媒体文件库中直接获取与所述文本信息当中的语句信息相匹配的多媒体文件,得到转换后的多媒体文件。
更进一步地,上述的带有个性化语音的多媒体转换的方法,其中,服务端将所述文本信息转换为多媒体文件的方法是,服务端先将所述文本信息当中的语句信息分解为单独的字或词,然后从多媒体文件库中分别获取与每一个单独的字或词相匹配的多媒体文件,继而将获取的与每一个单独的字或词相匹配的多媒体文件进行合并,得到转换后的多媒体文件。
本发明还提供了实施上述方法的服务端,包括:
接收单元,用于接收来自于发送端的文本信息,并将所述文本信息送至处理单元处理;以及用于接收来与所述发送端相对应的语音文件,并将所述语音文件发送至存储单元存储;
存储单元,用于存储来自于接收单元的语音文件;
处理单元,用于将所述来自于接收单元的文本信息转换成多媒体文件;以及用于根据所述存储单元中存储的所述与发送端相对应的语音文件,将所述语句信息转换成个性化的语音文件,并将所述语音文件替换所述多媒体文件中的音频部分。
上述服务端还可以包括发送单元,用于将所述多媒体文件发送出去。
总之,本发明为网络通信技术提供了新体会,通过实施本发明所揭示的技术方案,服务端能更好地个性化定制多媒体,接收端接收到来自于发送端以文本方式发送、并经服务端转换成的多媒体之后,其音频部分与发送方的个性特征相吻合,就像是发送方在对接收方说话,网络通讯技术的用户体验度得到极大提升。
附图说明
图1是本发明提供的带有个性化语音的多媒体转换的方法的流程示意图;
图2是本发明一种具体实施方式的流程示意图;
图3是本发明揭示的服务端的示意图。
具体实施方式
利用个性化语音生成技术,只要给出任意文字和目标人的一段语音文件,就能获得该任意文字所对应的语音文件,且该语音文件听起来就像是目标人说的。这种个性化语音生成技术实现方法,通过对输入的文本进行分析,获得语音合成技术(Text-to-Speech,简称TTS)参数,然后转化为目标人的语音参数,最终合成并获得接近于目标人的语音。
本发明实施例提供一种带有个性化语音的多媒体转换的方法,使得在用户端可以个性化的定制多媒体,有效提高了用户体验度。下面对本发明的具体实施方式作进一步详细描述。
实施例一:
本实施例所揭示的一种带有个性化语音的多媒体转换的方法,如图1所示,包括以下步骤:
步骤101:服务端接收到来自于发送端的文本信息;
文本信息的来源可以包括:发送方终端通过键盘输入的文本信息,或者终端话筒输入的语音通过语音识别软件转化后得到的文本信息。
本实施例所称的文本信息,可以包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丰达软件(苏州)有限公司;李嘉辉,未经丰达软件(苏州)有限公司;李嘉辉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810020316.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带稳压保护的电磁无线供电电源
- 下一篇:喇叭及音箱