[发明专利]语音数据的答案获取方法及装置、存储介质、计算机设备在审
申请号: | 201711259420.1 | 申请日: | 2017-12-04 |
公开(公告)号: | CN109872718A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 韩潼瑜;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F17/27 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音数据 语音标识 文字文本 答案 计算机设备 存储介质 文本 音标 匹配 语音 语音数据转换 语义 语义标识 语义理解 语义识别 知识点 词语 | ||
一种语音数据的答案获取方法及装置、存储介质、计算机设备,语音数据的答案获取方法包括:将获取到的语音数据转换为语音标识文本,所述语音标识文本中包括至少一个字语音标识;利用所述语音标识文本中的字语音标识进行词语匹配,以得到文字文本,所述文字文本中包括与所述字语音标识匹配的语义标识词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。通过本发明技术方案可以提高语音和语义识别的准确性进而得到语音输入的准确知识点,提高语音数据答案获取的准确性。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音数据的答案获取方法及装置、存储介质、计算机设备。
背景技术
随着语音识别技术的发展,语音识别在许多领域都得到了应用。通常基于语音交互的语义理解方法和系统是针对输入的语音输出应答,以便用户进行进一步的操作。
在现有技术中,语音识别处理过程与语义理解处理过程串行且相互独立。语音识别负责利用语音识别技术将交互语音识别成为文字文本,语义理解负责利用语义理解技术,根据语音识别的文字文本给出语义理解应答。具体地,在语音识别处理过程中,将语音数据识别为单字,以形成文字文本;然后在语义理解过程中,利用分词词典将文字文本进行词语匹配,再进行语义理解。
但是,在现有的基于语音交互的语义理解方法和系统对语音数据的输出结果中,仍然存在语义理解偏差的问题。
发明内容
本发明解决的技术问题是如何通过提高语音识别的准确性进而得到语音输入的准确答案。
为解决上述技术问题,本发明实施例提供一种语音数据的答案获取方法,语音数据的答案获取方法包括:将获取到的语音数据转换为语音标识文本,所述语音标识文本中包括至少一个字语音标识;利用所述语音标识文本中的字语音标识与包括字语音标识索引的预设词典进行词语匹配,以得到文字文本,所述文字文本中包括与所述字语音标识匹配的语义标识词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义;将所述语音数据的语义与知识库中的知识点进行匹配,得到与所述语音数据的语义相匹配的知识点中的答案。
可选的,所述利用所述语音标识文本中的字语音标识与包括字语音标识索引的预设词典进行词语匹配包括:将所述语音标识文本中的字语音标识与所述预设词典中各个预设语义标识词的字语音标识进行匹配,其中,所述预设词典中包括至少一个字语音标识、多个语义标识词,以及每个预设语义标识词与相应字语音标识的对应关系;将匹配的预设语义标识词作为与所述语音标识文本中的字语音标识匹配的语义标识词。
可选的,所述将所述语音标识文本中的字语音标识与所述预设词典中各个预设语义标识词的字语音标识进行匹配包括:按照在所述预设词典中出现频率递减的方式选取预设语义标识词;将选取的预设语义标识词的字语音标识与所述语音标识文本中的字语音标识进行匹配,直至所述语音标识文本中的所有字语音标识匹配完成。
可选的,所述将所述语音标识文本中的字语音标识与所述预设词典中各个预设语义标识词的字语音标识进行匹配包括:将所述语音标识文本中的字语音标识或字语音标识组合与所述预设词典中各个预设语义标识词的字语音标识进行匹配,直至所述语音标识文本中的所有字语音标识匹配完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711259420.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理设备
- 下一篇:一种分级式智能语音系统及其语音处理方法