[发明专利]声音检索装置有效
申请号: | 200810091710.4 | 申请日: | 2008-04-09 |
公开(公告)号: | CN101286170A | 公开(公告)日: | 2008-10-15 |
发明(设计)人: | 花沢利行;冈登洋平 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/08;G10L15/14 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 吴丽丽 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 检索 装置 | ||
1.一种声音检索装置,其特征在于包括:
将检索对象的文书等文本数据分割为规定的语言单位并输出的学习数据分割单元;
根据上述分割结果,作成声音识别用的语言模型的语言模型作成单元;
按照比上述学习数据分割单元中的分割单位小的单位,对上述检索对象的文书等文本数据进行分割,作成文本检索辞典的文本辞典作成单元;
使用上述语言模型识别输入声音,并作为文本输出声音识别结果的声音识别单元;
将上述声音识别结果分割为与上述文本辞典作成单元一样的分割单位并输出的对照单位变换单元;
将上述对照单位变换单元的输出作为输入,使用上述文本检索辞典,进行文本检索的文本检索单元。
2.根据权利要求1所述的声音检索装置,其特征在于:
上述语言模型作成单元构成为对各文书的统计量的累积频度附加加权,作成语言模型,使得根据上述语言模型计算的各文书之间的语言似然度的差变小。
3.根据权利要求2所述的声音检索装置,其特征在于:
上述学习数据分割单元的文本数据的分割单位使用长单位和短单位,
上述语言模型作成单元构成为对于上述各文书的统计量的累积频度的加权,针对在分割结果中短单位所占的比例越多的文书,越是附加大的值。
4.根据权利要求2所述的声音检索装置,其特征在于:
上述语言模型作成单元使用上述学习数据分割单元的输出,作成中间语言模型,使用上述中间语言模型,计算出与上述检索对象的各文书对应的语言似然度,对于上述各文书的统计量的累积频度的加权,针对前后语言似然度越低的文书,越是附加大的值。
5.根据权利要求1或2所述的声音检索装置,其特征在于:
上述声音识别单元具备:直到高位L(>1)个为止输出识别结果,与识别结果的第1位的音节数对应地,控制输出到文本检索单元的声音识别结果候选的声音识别候选数控制单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810091710.4/1.html,转载请声明来源钻瓜专利网。