[发明专利]语音与文本匹配的方法、装置、设备及计算机可读介质有效
申请号: | 201811495921.4 | 申请日: | 2018-12-07 |
公开(公告)号: | CN109658938B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 陆永帅 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22;G06F16/332 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;江宇 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文本 匹配 方法 装置 设备 计算机 可读 介质 | ||
1.一种语音与文本匹配的方法,其特征在于,包括:
对接收的语音信号进行识别,获取语音识别文本;
将语音识别文本与多项候选文本进行第一匹配;
当第一匹配不成功时,将语音识别文本与多项候选文本进行拼音的第二匹配;
其中,所述将语音识别文本与多项候选文本逐个进行拼音的第二匹配,包括:
将语音识别文本和多项候选文本都转化为拼音;
计算语音识别文本和多项候选文本的拼音的相似度;
获取相似度最大的候选文本,当所述候选文本大于设定阈值时,则作为匹配的候选文本进行输出;
所述计算语音识别文本和候选文本的各个选项的拼音的相似度,采用以下公式进行计算:
其中s表示候选文本的选项的拼音,q代表语音识别文本的拼音,LCS(s,q)表示候选文本的拼音和语音识别文本的拼音之间最长公共序列的长度,len(s)表示候选文本的拼音的长度。
2.根据权利要求1所述的方法,其特征在于,还包括:
当第一匹配或拼音的第二匹配成功时,输出匹配到的候选文本。
3.根据权利要求1所述的方法,其特征在于,还包括:
当拼音的第二匹配不成功时,计算语音识别文本和多项候选文本的句子向量相似度,输出句子向量相似度最大的候选文本选项。
4.根据权利要求3所述的方法,其特征在于,所述计算语音识别文本和多项候选文本的句子向量相似度,输出句子向量相似度最大的候选文本选项,包括:
将语音识别文本和多项候选文本进行分词操作;
获取分词后的每个词语的词向量;
将语音识别文本的词向量进行相加,获得语音识别文本的句子向量,以及将每项候选文本的词向量相加,分别获取各项候选文本的句子向量;
计算语音识别文本的句子向量和各项候选文本的矩形向量的余弦相似度,获取余弦相似度最大的候选文本。
5.一种语音与文本匹配的装置,其特征在于,包括:
识别模块,用于对接收的语音信号进行识别,获取语音识别文本;
第一匹配模块,用于将语音识别文本与多项候选文本进行第一匹配;
第二匹配模块,用于当第一匹配不成功时,将语音识别文本与多项候选文本进行拼音的第二匹配;
其中,所述第二匹配模块包括:
转化子模块,用于将语音识别文本和多项候选文本都转化为拼音;
拼音相似度计算子模块,用于计算语音识别文本和多项候选文本的拼音的相似度;
匹配子模块,用于获取相似度最大的候选文本,当所述候选文本大于设定阈值时,则作为匹配的候选文本进行输出;
所述拼音相似度计算子模块在计算语音识别文本和多项候选文本的拼音相似度时,具体采用以下公式:
其中s表示候选文本的选项的拼音,q代表语音识别文本的拼音,LCS(s,q)表示候选文本的拼音和语音识别文本的拼音之间最长公共序列的长度,len(s)表示候选文本的拼音的长度。
6.根据权利要求5所述的装置,其特征在于,该装置还包括:
输出模块,用于当第一匹配或拼音的第二匹配成功时,输出匹配到的候选文本。
7.根据权利要求5所述的装置,其特征在于,该装置还包括:
向量匹配模块,用于当拼音的第二匹配不成功时,计算语音识别文本和多项候选文本的句子向量相似度,输出句子向量相似度最大的候选文本选项。
8.根据权利要求7所述的装置,其特征在于,所述向量匹配模块包括:
分词子模块,用于将语音识别文本和多项候选文本进行分词操作;
词向量获取子模块,用于获取分词后的每个词语的词向量;
句子向量获取子模块,用于将语音识别文本的词向量进行相加,获得语音识别文本的句子向量,以及将每项候选文本的词向量相加,分别获取各项候选文本的句子向量;
向量相似度计算子模块,用于计算语音识别文本的句子向量和各项候选文本的矩形向量的余弦相似度,获取余弦相似度最大的候选文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811495921.4/1.html,转载请声明来源钻瓜专利网。