[发明专利]并发进行语音识别、说话者分段和分类的方法和装置有效
申请号: | 00118388.5 | 申请日: | 2000-06-14 |
公开(公告)号: | CN1279462A | 公开(公告)日: | 2001-01-10 |
发明(设计)人: | 赫马永·萨德·莫哈马德·贝吉;阿兰·查尔斯·露易斯·特里西勒;马赫西·维斯瓦纳山 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 说明了一种方法和装置,用于从音频-视频源自动转换声音信息及并发地辨识说话者。所说明的声音转换和说话者分类系统包括一个语音识别系统、一个说话者分段系统和一个说话者辨识系统。一个公共前端处理器计算特征矢量,这些特征矢量由语音识别系统、说话者分段系统和说话者分类系统在一个多线程环境中沿平行分支进行处理,例如使用一个共享存储器结构,它以类似于服务器的方式工作,把计算出的特征矢量分配给与每个平行分支对应的通道。 | ||
搜索关键词: | 并发 进行 语音 识别 说话 分段 分类 方法 装置 | ||
【主权项】:
1.从一个或多个声音源转换声音信息的方法,所述方法包含以下步骤:转换所述声音源以建立该声音源的文本版本;与所述转换步骤基本上并发地在所述声音源中辩识可能的段边界;以及对每个识别出的段赋予一个说话者标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/00118388.5/,转载请声明来源钻瓜专利网。