[发明专利]一种语音识别匹配的方法和设备有效
申请号: | 201210171583.5 | 申请日: | 2012-05-29 |
公开(公告)号: | CN103456297A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 翁玮文;黄晓庆;刘琨;焦伟 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 匹配 方法 设备 | ||
1.一种语音识别匹配的方法,其特征在于,所述方法包括:
确定语音信息转化得到的拼音形式的字符信息;
根据模糊拼音匹配策略,从本地数据库中以拼音和汉字形式存储的字符信息中,为转化得到的字符信息根据拼音进行模糊匹配,得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。
2.如权利要求1所述的语音识别匹配的方法,其特征在于,为转化得到的字符信息进行模糊匹配,具体包括:
根据确定的字符信息的字段数量,从本地数据库中查找出相同字段数量的拼音形式的字符信息;
将确定的字符信息分别与查找出的字符信息进行相似度运算,从查找出的字符信息中,确定相似度满足第一阈值条件的字符信息;
将所述相似度满足第一阈值条件的字符信息转换为汉字形式,并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。
3.如权利要求2所述的语音识别匹配的方法,其特征在于,将确定的拼音形式的字符信息分别与查找出的字符信息进行相似度运算,具体包括:
将确定的字符信息中的每个字段与一个查找出的字符信息中的相应字段进行以下操作,直至获得确定的字符信息中每个字段与查找出的字符信息中的相应字段的相似度:
判断确定的字符信息中的一个字段与查找出的字符信息中的相应字段是否在预设的拼音对列表中;
若是,则根据拼音对列表中为预设的拼音对设定的相似度,将该设定的相似度作为该字段与查找出的字符信息中的相应字段之间的相似度;
若否,则分离该字段的声母和韵母,分别确定该字段与查找出的字符信息中的字段的声母相似度和韵母相似度,并得到该字段与查找出的字符信息中的相应字段之间的相似度;
在获得确定的字符信息中每个字段与查找出的字符信息中的相应字段的相似度后,根据各字段间的相似度,确定字符信息间的相似度。
4.如权利要求1或2所述的语音识别匹配的方法,其特征在于,为转化得到的字符信息进行模糊匹配,具体还包括:
根据确定的字符信息的字段数量,从本地数据库中查找出与所述字段数量不同的拼音形式的字符信息;
当查找出的字符信息的字段数量大于确定的字符信息的字段数量时,则对查找出的字符信息进行拆分,其中,同一字符信息拆分后的每个分词内容不相同,且分词中的字段数量与确定的字符信息中的字段数量相同,若查找出的字符信息拆分后的分词与确定的字符信息之间的相似度满足第二阈值条件,则将该查找出的字符信息转换为汉字形式,并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息;
当查找出的字符信息字段数量小于确定的字符信息字段数量时,则对确定的字符信息进行拆分,其中,同一字符信息拆分后的每个分词内容不相同,且分词中的字段数量与查找出的字符信息中的字段数量相同,若确定的字符信息拆分后的分词与查找出的字符信息之间的相似度满足第二阈值条件,则将该查找出的字符信息转换为汉字形式,并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。
5.如权利要求1所述的语音识别匹配的方法,其特征在于,为转化得到的字符信息进行模糊匹配之前,所述方法还包括:
判断是否能够对确定的字符信息进行完全匹配操作;
若否,则进一步判断是否能够对确定的字符信息进行部分完全匹配操作,若否,则执行对确定的字符信息进行模糊匹配操作。
6.如权利要求5所述的语音识别匹配的方法,其特征在于,所述部分完全匹配操作包括:
根据确定的字符信息的字段数量,从本地数据库中查找出与所述字段数量不同的拼音形式的字符信息;
若查找出的字符信息字段数量大于确定的字符信息字段数量,则对查找出的字符信息进行拆分,其中,同一字符信息拆分后的每个分词内容不相同,且分词中的字段数量与确定的字符信息中的字段数量相同,并确定查找出的字符信息拆分后的分词与确定的字符信息之间的相似度;
若查找出的字符信息字段数量小于确定的字符信息字段数量,则对确定的字符信息进行拆分,其中,同一字符信息拆分后的每个分词内容不相同,且分词中的字段数量与查找出的字符信息中的字段数量相同,并确定查找出的字符信息与确定的字符信息拆分后的分词之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210171583.5/1.html,转载请声明来源钻瓜专利网。