[发明专利]语音数据的答案获取方法及装置、存储介质、计算机设备在审
申请号: | 201711259420.1 | 申请日: | 2017-12-04 |
公开(公告)号: | CN109872718A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 韩潼瑜;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F17/27 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音数据 语音标识 文字文本 答案 计算机设备 存储介质 文本 音标 匹配 语音 语音数据转换 语义 语义标识 语义理解 语义识别 知识点 词语 | ||
1.一种语音数据的答案获取方法,其特征在于,包括:
将获取到的语音数据转换为语音标识文本,所述语音标识文本中包括至少一个字语音标识;
利用所述语音标识文本中的字语音标识与包括字语音标识索引的预设词典进行词语匹配,以得到文字文本,所述文字文本中包括与所述字语音标识匹配的语义标识词;
对所述文字文本进行语义理解处理,以得到所述语音数据的语义;
将所述语音数据的语义与知识库中的知识点进行匹配,得到与所述语音数据的语义相匹配的知识点中的答案。
2.根据权利要求1所述的语音数据的答案获取方法,其特征在于,所述利用所述语音标识文本中的字语音标识与包括字语音标识索引的预设词典进行词语匹配包括:
将所述语音标识文本中的字语音标识与所述预设词典中各个预设语义标识词的字语音标识进行匹配,其中,所述预设词典中包括至少一个字语音标识、多个语义标识词,以及每个预设语义标识词与相应字语音标识的对应关系;
将匹配的预设语义标识词作为与所述语音标识文本中的字语音标识匹配的语义标识词。
3.根据权利要求2所述的语音数据的答案获取方法,其特征在于,所述将所述语音标识文本中的字语音标识与所述预设词典中各个预设语义标识词的字语音标识进行匹配包括:
按照在所述预设词典中出现频率递减的方式选取预设语义标识词;
将选取的预设语义标识词的字语音标识与所述语音标识文本中的字语音标识进行匹配,直至所述语音标识文本中的所有字语音标识匹配完成。
4.根据权利要求2所述的语音数据的答案获取方法,其特征在于,所述将所述语音标识文本中的字语音标识与所述预设词典中各个预设语义标识词的字语音标识进行匹配包括:
将所述语音标识文本中的字语音标识或字语音标识组合与所述预设词典中各个预设语义标识词的字语音标识进行匹配,直至所述语音标识文本中的所有字语音标识匹配完成。
5.根据权利要求1所述的语音数据的答案获取方法,其特征在于,所述利用所述语音标识文本进行词语匹配包括:
确定所述语音标识文本中的字语音标识在预设词典中所属的近音词类,其中,所述预设词典中包括至少一个字语音标识、多个语义标识词、每个预设语义标识词与相应字语音标识的对应关系以及至少一个近音词类,每一近音词类包括多个近音字语音标识以及针对每一近音字语音标识的预设权重;
选取所述语音标识文本中的字语音标识所属的近音词类中权重值最大的近音字语音标识,将其与预设词典中的字语音标识进行匹配;
如果匹配结果为一致,则将匹配的字语音标识对应的语义标识词作为与所述语音标识文本中的字语音标识匹配的语义标识词;
如果匹配结果为不一致,则按照权重值递减的方式,在所述语音标识文本中的字语音标识所属的近音词类中依次选取近音字语音标识;
将选取的近音字语音标识与预设词典中的字语音标识进行匹配,直至匹配结果为一致,并将匹配的字语音标识对应的语义标识词作为与所述语音标识文本中的字语音标识匹配的语义标识词;
其中,所述近音字语音标识包括标准字语音标识以及与所述标准字语音标识发音相似的相似字语音标识。
6.根据权利要求1任一项所述的语音数据的答案获取方法,其特征在于,所述预设词典为分词词典,所述分词词典包括针对所有语义标识词的字语音标识。
7.根据权利要求2至6任一项所述的语音数据的答案获取方法,其特征在于,所述字语音标识为汉字的拼音,所述预设语义标识词为汉语词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711259420.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理设备
- 下一篇:一种分级式智能语音系统及其语音处理方法