[发明专利]语音数据的语义识别方法及装置、存储介质、计算机设备在审
申请号: | 201711259753.4 | 申请日: | 2017-12-04 |
公开(公告)号: | CN109871528A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 韩潼瑜;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L15/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种语音数据的语义识别方法及装置、存储介质、计算机设备,语音数据的语义识别方法包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个字语音标识;优先使用权重值最大的近音字语音标识与预设词典中的字语音标识进行匹配,权重值最大的近音字语音标识与预设词典中的字语音标识不匹配的情况下,再使用所述近音词类中其他权重的近音字语音标识与预设词典中的字语音标识进行匹配,以得到文字文本。对所述文字文本进行语义理解处理,以得到所述语音数据的语义。通过本发明技术方案可以提高语音识别的准确性。本发明实施例采用上述匹配方式可以提高匹配效率。 | ||
搜索关键词: | 语音标识 语音数据 近音 语义识别 预设 匹配 计算机设备 存储介质 文字文本 权重 文本 语音数据转换 匹配方式 匹配效率 语义理解 语音识别 语义 再使用 词类 使用权 | ||
【主权项】:
1.一种语音数据的语义识别方法,其特征在于,包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个字语音标识;确定所述音学文本中的字语音标识在预设词典中所属的近音词类,其中,所述预设词典中包括至少一个字语音标识、多个语义标识词、每个预设语义标识词与相应字语音标识的对应关系以及至少一个近音词类,每一近音词类包括多个近音字语音标识以及针对每一近音字语音标识的预设权重;选取所述音学文本中的字语音标识所属的近音词类中权重值最大的近音字语音标识,将其与预设词典中的字语音标识进行匹配;如果匹配结果为不一致,则按照权重值递减的方式,在所述音学文本中的字语音标识所属的近音词类中依次选取近音字语音标识,将选取的近音字语音标识与预设词典中的字语音标识进行匹配,直至匹配结果为一致,并将匹配的字语音标识对应的语义标识词作为与所述音学文本中的字语音标识匹配的语义标识词,以得到文字文本;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711259753.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于分词的语义识别方法
- 下一篇:语言处理方法和设备