[发明专利]识别语音的方法及其电子装置有效
申请号: | 201310301732.X | 申请日: | 2013-07-15 |
公开(公告)号: | CN103544955B | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 李在原;陆东锡;林贤泽;金兑润 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张云珠;韩明星 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 语音 方法 及其 电子 装置 | ||
1.一种在电子装置中识别语音的方法,所述方法包括:
如果语音信号被输入,则以预设时间间隔将语音信号分段为多个片段;
通过使用第一声学模型来执行针对多个片段中的一个片段的语音信号的音素识别;
通过使用音素识别结果来提取所述一个片段的语音信号的候选词语;
通过使用候选词语来执行针对所述一个片段的语音信号的语音识别,
其中,执行音素识别的步骤还包括:
通过使用分段的维特比算法来删除所述一个片段的语音信号的多个音素中的至少一个最后音素,
其中,删除的至少一个音素被用于执行针对下一片段的语音信号的音素识别。
2.如权利要求1的所述方法,其中,提取的步骤包括:
提取与识别的音素发音相似的相似音素;
通过使用所述相似音素来产生用于提取所述一个片段的候选词语的词语图表。
3.如权利要求2的所述方法,其中,执行语音识别的步骤包括:
通过使用第二声学模型来计算所述一个片段的语音信号的高斯概率;
通过使用第二声学模型和语言模型来输出在词语图表中具有最高概率的词语串。
4.如权利要求3所述的方法,其中,第一声学模型和第二声学模型彼此不同。
5.如权利要求1所述的方法,其中,通过不同的核并行执行所述执行音素识别的步骤、所述提取步骤和所述执行语音识别的步骤。
6.一种电子装置,包括:
语音信号输入部件,接收语音信号;
语音信号分段器,以预设时间间隔将通过语音信号输入部件输入的语音信号分段为多个片段;
音素识别器,通过使用第一声学模型来执行针对多个片段中的一个片段的语音信号的音素识别;
候选词语提取器,通过使用音素识别结果来提取所述一个片段的语音信号的候选词语;
语音识别器,通过使用候选词语来执行针对所述一个片段的语音信号的语音识别,
其中,音素识别器通过使用分段的维特比算法来删除所述一个片段的语音信号的多个音素中的至少一个最后音素,以执行音素识别,
其中,删除的至少一个音素被用于执行针对下一片段的语音信号的音素识别。
7.如权利要求6所述的电子装置,其中,候选词语提取器提取与识别的音素发音相似的相似音素,并通过使用所述相似音素来产生用于提取所述片段的候选词语的词语图表。
8.如权利要求7所述的电子装置,其中,语音识别器通过使用第二声学模型来计算所述一个片段的语音信号的高斯概率,并通过使用第二声学模型和语言模型来输出在词语图表中具有最高概率的词语串,以执行语音识别。
9.如权利要求8所述的电子装置,其中,音素识别器的第一声学模型和语音识别器的第二声学模型彼此不同。
10.如权利要求6所述的电子装置,其中,音素识别器、候选词语提取器和语音识别器被实现为不同的核。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310301732.X/1.html,转载请声明来源钻瓜专利网。