[发明专利]语音摘要的智能提取方法、装置、电子设备及存储介质在审
申请号: | 202111098139.0 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113808577A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 陈杭;史文鑫;李骁;黄荣丽;王泽世;赖众程;张茜 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L25/18;G10L25/63;G10L13/08;G06F40/30;G06N3/04 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 摘要 智能 提取 方法 装置 电子设备 存储 介质 | ||
本发明涉及人工智能领域,揭露一种语音摘要的智能提取方法、装置、电子设备以及存储介质,所述方法包括:获取用户语音,对用户语音进行信号提取,得到语音信号,并提取语音信号的频谱特征;利用预设的语音识别模型对频谱特征进行文本转换,得到语音文本;利用预设的情绪识别模型识别语音文本的情绪特征,并从语音文本中提取情绪特征的第一关键语句;从语音文本中选取符合预设业务规则的第二关键语句;将第一关键语句和第二关键语句进行合并后作为用户语音的关键摘要语句。此外,本发明还涉及区块链技术,所述情绪特征可存储区块链中。本发明可以提高语音摘要的提取准确性。
技术领域
本发明涉及人工智能领域,尤其涉及一种语音摘要的智能提取方法、装置、电子设备及计算机可读存储介质。
背景技术
语音摘要的提取是指从一段语音文本中自动提取出用户需求信息的过程,其可以应用客服、金融、证券等领域中,如在坐席客服领域中,语音摘要的提取可以从用户语音中提取关键用户诉求,帮助客服人员快速定位到客户需求。
目前,传统的语音摘要提取通常是采用自然语言处理技术(NLP)训练自动摘要提取模型实现,但是在实际业务场景中,由于用户会带有一定的情绪特征,若是仅仅通过自然语言处理技术训练自动摘要模型,无法准确的识别出用户的情绪等信息特征,从而会遗漏用户语音中一些重要信息,进而导致语音摘要的提取准确性不高。
发明内容
本发明提供一种语音摘要的智能提取方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高语音摘要的提取准确性。
为实现上述目的,本发明提供的一种语音摘要的智能提取方法,包括:
获取用户语音,对所述用户语音进行信号提取,得到语音信号,并提取所述语音信号的频谱特征;
利用预设的语音识别模型对所述频谱特征进行文本转换,得到语音文本;
利用预设的情绪识别模型识别所述语音文本的情绪特征,并从所述语音文本中提取所述情绪特征的第一关键语句;
从所述语音文本中选取符合预设业务规则的第二关键语句;
将所述第一关键语句和所述第二关键语句进行合并后作为所述用户语音的关键摘要语句。
可选地,所述对所述用户语音进行信号提取,得到语音信号,包括:
对所述用户语音进行音频分段,得到多个分段音频;
检测每个所述分段音频的语音能量信息,根据每个所述语音能量信息,从所述多个分段音频中筛选出满足预设条件的分段音频;
对筛选的所述分段音频进行信号增强,得到语音信号。
可选地,所述检测每个所述分段音频的语音能量信息,包括:
利用下述公式测每个所述分段音频的语音能量信息:
其中,En表示语音能量信息,n表示分段音频所处的时刻,m表示分段音频的序列号,x(m)表示分段音频的短时平均能量,w(m)表示分段音频的窗口函数。
可选地,所述提取所述语音信号的频谱特征,包括:
将所述语音信号进行频域转换,得到频域信号;
对所述频域信号进行梅尔谱滤波,并将梅尔谱滤波后的频域信号进行倒谱分析,得到所述语音信号的频谱特征。
可选地,所述利用预设的语音识别模型对所述频谱特征进行文本转换,得到语音文本,包括:
利用所述预设的语音识别模型中的声学网络计算所述频谱特征的音素序列概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111098139.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:水下搜寻爆毁潜航器
- 下一篇:基板载置方法、电子设备的制造方法及基板载置装置