[发明专利]话题检测方法、装置、电子设备及存储介质有效
申请号: | 202210279908.5 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114373448B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 刘磊 | 申请(专利权)人: | 北京沃丰时代数据科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L15/06;G06F40/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 聂俊伟 |
地址: | 100160 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话题 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供一种话题检测方法、装置、电子设备及存储介质,该方法包括:基于待检测的语音数据,获取目标语音块;输入目标语音块至话题检测模型,获得话题检测模型输出的检测结果。本发明提供的话题检测方法、装置、电子设备及存储介质,基于待检测的语音数据生成目标语音块,通过将目标语音块输入至话题检测模型进行优化处理,通过对目标语音块进行自动语音识别后,获得对应的语音离散表征与文本内容,通过对文本内容进行自然语言处理后,融合语音离散表征进行话题检测。能够在进行语音自动识别得到文本内容,并进行自然语言处理的同时,补入语音离散表征信息,避免语音信息丢失,在一定程度上提高话题检测的识别准确率。
技术领域
本发明涉及音频处理技术领域,尤其涉及一种话题检测方法、装置、电子设备及存储介质。
背景技术
随着人工智能技术快速发展,人工智能产品在生活中的渗透率越来越高,语音交互在智能家居、智能汽车、智能客服、电话/视频会议等场景下有着广泛的应用,自然也会造成信息的过剩与知识匮乏的矛盾日益突出。
传统的话题检测绝大多数基于纯文本进行处理,在对于文本话题检测中大多基于关键词,词元等处理对于真实语音通话语义及分布是不足的。所以,现有技术中对于语音进行的话题检测,都是先由独立的自动语音识别系统(Automatic Speech Recognition,ASR)转写成文字序列,再由独立的自然语言处理系统(Natural Language Processing,NLP)接收ASR系统的文字序列进行处理,可见,ASR系统的性能严重影响NLP系统的最终检测结果,特别是在用户口音重,环境噪声大的情况下,导致对于语音的话题检测识别准确率不高。
发明内容
本发明提供一种话题检测方法、装置、电子设备及存储介质,用以解决现有技术中对于语音数据的话题检测信息缺失过多的缺陷,实现在语音自动识别得到文本内容,并进行自然语言处理的同时,补入离散表征的语音内容进行话题检测,提高语音数据的话题检测的识别准确率。
本发明提供一种话题检测方法,包括:
基于待检测的语音数据,获取目标语音块;
输入所述目标语音块至话题检测模型,获得所述话题检测模型输出的检测结果;
其中,所述话题检测模型是基于样本文本数据、所述样本文本数据对应的标注话题、样本语音数据以及所述样本语音数据对应的标注话题训练得到的;所述样本文本数据包括领域语料和通用语料;
所述话题检测模型,用于对所述目标语音块进行语音识别,得到语音离散表征和文本内容,将所述文本内容的自然语言处理结果与所述语音离散表征融合后,进行话题检测,获取所述检测结果。
根据本发明提供的一种话题检测方法,所述话题检测模型包括语音识别层、主题词识别抽取层和话题检测层;
其中,所述语音识别层用于对所述目标语音块进行语音识别;所述主题词识别抽取层用于对识别出的文本内容进行主题词抽取;所述话题检测层用于基于所述语音识别层和所述主题词识别抽取层的输出内容融合后,进行话题检测。
根据本发明提供的一种话题检测方法,所述输入所述目标语音块至话题检测模型,获得所述话题检测模型输出的检测结果,包括:
将所述目标语音块输入至所述语音识别层中,得到语音表征和文本表征;
将所述文本表征输入至所述主题词识别抽取层中,得到主题词集;
将所述语音表征、所述文本表征和所述主题词集输入至所述话题检测层中,得到检测结果。
根据本发明提供的一种话题检测方法,所述将所述目标语音块输入至所述语音识别层中,得到语音表征和文本表征,包括:
分别利用第一语言模型和第二语言模型,结合声学模型对所述目标语音块进行量化操作,获取第一语音表征和第二语音表征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃丰时代数据科技有限公司,未经北京沃丰时代数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210279908.5/2.html,转载请声明来源钻瓜专利网。