[发明专利]提供基于语言的交互式多媒体系统的方法、装置和计算机程序产品无效
| 申请号: | 200780042946.2 | 申请日: | 2007-11-09 |
| 公开(公告)号: | CN101542590A | 公开(公告)日: | 2009-09-23 |
| 发明(设计)人: | S·西瓦达斯 | 申请(专利权)人: | 诺基亚公司 |
| 主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L15/28 |
| 代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;张静美 |
| 地址: | 芬兰*** | 国省代码: | 芬兰;FI |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 提供 基于 语言 交互式 多媒体 系统 方法 装置 计算机 程序 产品 | ||
1.一种方法,其包括:
基于与音素的输入序列相关联的语音处理的类型来选择音素图;
将所述音素的输入序列与所选择的音素图相比较;以及
基于所述比较来处理所述音素的输入序列。
2.根据权利要求1所述的方法,其中选择音素图包括:选择第一音素图或第二音素图中的一个,所述第一音素图与从自动语音识别元件所接收到的音素的输入序列相对应,所述第二音素图与从文本到语音元件所接收到的音素的输入序列相对应。
3.根据权利要求2所述的方法,其中选择音素图进一步包括:选择包括与韵律信息、持续时间和讲话者特征有关的元数据的第二音素图。
4.根据权利要求3所述的方法,其进一步包括:确定与所述音素的输入序列相关联的语言。
5.根据权利要求4所述的方法,其中选择音素图进一步包括:选择与所确定的语言相对应的音素图。
6.根据权利要求1所述的方法,其中选择音素图进一步包括:选择与多个语言相对应的单个音素图。
7.根据权利要求1所述的方法,其中处理所述音素的输入序列包括:基于所选择的音素图来修改所述音素的输入序列,以便改进所修改的音素的输入序列的质量测量。
8.根据权利要求7所述的方法,其中处理所述音素的输入序列进一步包括:基于所选择的音素图来修改所述音素的输入序列,以便增加所修改的音素的输入序列的概率测量。
9.根据权利要求7所述的方法,其中处理所述音素的输入序列进一步包括:基于所选择的音素图来修改所述音素的输入序列,以便降低所修改的音素的输入序列的失真测量。
10.一种计算机程序产品,其包括使计算机可读程序代码部分存储在其中的至少一个计算机可读存储介质,所述计算机可读程序代码部分包括:
第一可执行部分,用于基于与音素的输入序列相关联的语音处理的类型来选择音素图;
第二可执行部分,用于将所述音素的输入序列与所选择的音素图相比较;以及
第三可执行部分,用于基于所述比较来处理所述音素的输入序列。
11.根据权利要求10所述的计算机程序产品,其中所述第一可执行部分包括:用于选择第一音素图或第二音素图中的一个的指令,所述第一音素图与从自动语音识别元件所接收到的音素的输入序列相对应,所述第二音素图与从文本到语音元件所接收到的音素的输入序列相对应。
12.根据权利要求11所述的计算机程序产品,其中所述第一可执行部分包括:用于选择包括与韵律信息、持续时间和讲话者特征有关的元数据的第二音素图的指令。
13.根据权利要求12所述的计算机程序产品,其进一步包括第四可执行部分,用于确定与所述音素的输入序列相关联的语言。
14.根据权利要求13所述的计算机程序产品,其中所述第一可执行部分包括:用于选择与所确定的语言相对应的音素图的指令。
15.根据权利要求10所述的计算机程序产品,其中所述第一可执行部分包括:用于选择与多个语言相对应的单个音素图的指令。
16.根据权利要求10所述的计算机程序产品,其中所述第三可执行部分包括:用于基于所选择的音素图来修改所述音素的输入序列,以便改进所修改的音素的输入序列的质量测量的指令。
17.根据权利要求16所述的计算机程序产品,其中所述第三可执行部分包括:用于基于所选择的音素图来修改所述音素的输入序列,以便增加所修改的音素的输入序列的概率测量的指令。
18.根据权利要求16所述的计算机程序产品,其中所述第三可执行部分包括:用于基于所选择的音素图来修改所述音素的输入序列,以便降低所修改的音素的输入序列的失真测量的指令。
19.一种装置,其包括:
选择元件,所述选择元件被配置以便基于与音素的输入序列相关联的语音处理的类型来选择音素图;
比较元件,所述比较元件被配置以便将所述音素的输入序列与所选择的音素图相比较;以及
处理元件,所述处理元件与所述比较元件进行通信,并且被配置以便基于所述比较来处理所述音素的输入序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780042946.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于编码和解码基于对象的音频信号的方法和装置
- 下一篇:图像的深度图的生成





