[发明专利]用于从分布式词汇表中识别语音的方法有效
申请号: | 200580039114.6 | 申请日: | 2005-10-04 |
公开(公告)号: | CN101057274A | 公开(公告)日: | 2007-10-17 |
发明(设计)人: | N·孔斯特曼 | 申请(专利权)人: | 西门子公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 刘春元;魏军 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 分布式 词汇表 识别 语音 方法 | ||
1.用于从可预先确定的词汇表中识别口头输入的方法,其中- 将可预先确定的词汇表分成多个具有语音上相似的字的段,
-在第一识别步骤,将口头输入分配给所述段之一,其中口头输 入是至少一个口述字或者各个口述字母,
-在第二识别步骤中,从所分配的段的词汇表中识别所述口头输 入,
-根据所划分的具有语音上相似的字的段将可预先确定的词汇 表存储在存储器介质上,
其特征在于,
为了将可预先确定的词汇表划分成多个具有语音上相似的字的 段而实施以下三个步骤:
在一个第一步骤中,分别针对一个测试表现来确定所识别的字的 具有所属的等级列表值的等级列表,
-在一个第二步骤中,确定两个字之间的间隔尺度,所述确定是通 过为相应的测试表现来对两个字的等级列表值的差求平均而实现的,
-在一个第三步骤中,矢量量化算法根据间隔尺度将可预先确定的 词汇表分成多个具有语音上相似的字的段。
2.按照权利要求1所述的方法,其中将来自可预先确定的词汇表 的字分配给至少一个具有语音上相似的字的段。
3.按照权利要求1或者2所述的方法,其中
-具有语音上相似的字的段分别通过代表条目来标记,
-在所述第一识别步骤中,口头输入被分配给这样的一个段,该 段的代表条目与口头输入最相似。
4.按照权利要求1或者2所述的方法,其中为了确定两个字之间 在语音上的相似性的间隔尺度,
-确定两个字母的相似性的间隔值和针对两个字母序列的间隔 尺度合计间隔值。
5.按照权利要求4的方法,其中分别针对字母序列的不同长度进 行对可预先确定的词汇表的多种划分。
6.按照权利要求1或者2所述的方法,其中Levenshtein间隔被 考虑为间隔尺度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580039114.6/1.html,转载请声明来源钻瓜专利网。