[发明专利]语音切分方法、装置、服务器及存储介质在审
申请号: | 202210717004.6 | 申请日: | 2022-06-23 |
公开(公告)号: | CN115101056A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/16;G10L15/26;G10L21/0272 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 切分 方法 装置 服务器 存储 介质 | ||
本申请适用于人工智能技术领域,提供了一种语音切分方法、装置、服务器及存储介质,该方法包括:获取语音数据,以及确定语音数据中是否包括多种语音频率;若语音数据中包括多种语音频率,则根据预设频率集和语音数据中的各部分的语音频率,对语音数据进行语音分离,得到多个目标语音数据;根据目标语音数据中的语音停顿信息和目标语音数据对应的目标语音文本,确定目标语音数据的目标语音切分点,以及根据目标语音切分点对目标语音数据进行语音切分。本申请可以实现自动针对目标用户的语音数据进行语音切分,有助于提高语音切分的效率和准确率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种语音切分方法、装置、服务器及存储介质。
背景技术
在语音处理领域中,对语音进行切分是一个比较关键的问题,因为较长的语音在语音识别转换过程中会对系统资源产生较大的消耗,且识别准确率不高。在对语音进行切分处理后,能够减少语音识别的计算量并提高语音识别的准确率。
相关技术中,通常是采用人工方式对语音进行手动切分,导致语音切分效率不高。
发明内容
有鉴于此,本申请实施例提供了一种语音切分方法、装置、服务器及存储介质,以解决相关技术中,采用人工方式对语音进行手动切分,导致语音切分效率不高的问题。
本申请实施例的第一方面提供了一种语音切分方法,包括:
获取语音数据,以及确定语音数据中是否包括多种语音频率;
若语音数据中包括多种语音频率,则根据预设频率集和语音数据中的各部分的语音频率,对语音数据进行语音分离,得到多个目标语音数据,其中,预设频率集中的每个预设频率对应一个目标用户,一个目标语音数据来自一个目标用户;
根据目标语音数据中的语音停顿信息和目标语音数据对应的目标语音文本,确定目标语音数据的目标语音切分点,以及根据目标语音切分点对目标语音数据进行语音切分。
进一步地,方法还包括:
若语音数据中包括一种语音频率,且语音数据所包括的语音频率属于预设频率集,则将语音数据确定为目标语音数据。
进一步地,根据目标语音数据中的语音停顿信息和目标语音数据对应的目标语音文本,确定目标语音数据的目标语音切分点,包括:
从目标语音数据中,确定语音停顿时长大于预设时长阈值的语音位置,作为第一语音切分点,以及根据预先确定的针对目标语音数据所属目标用户的、语音停顿时长与切分概率之间的对应关系,确定第一语音切分点对应的切分概率,其中,语音停顿信息包括语音停顿时长;
对目标语音文本进行语句切分,得到多个文本语句及各文本语句的切分概率,将目标语音数据中的、对应文本语句末端位置确定为第二语音切分点,以及将相应文本语句的切分概率确定为第二语音切分点的切分概率;
根据第一语音切分点及第一语音切分点的切分概率、第二语音切分点及第二语音切分点的切分概率,确定目标语音数据的目标语音切分点。
进一步地,对目标语音文本进行语句切分,得到多个文本语句及各文本语句的切分概率,包括以下任一项:
将目标语音文本输入预先训练的语句切分模型,得到多个文本语句及各文本语句的切分概率;
若目标语音文本中存在目标词汇,则以目标词汇为分隔,对目标语音文本进行切分,得到多个文本语句,以及根据预先设定的针对目标词汇与切分概率之间的对应关系,确定各文本语句的切分概率。
进一步地,根据第一语音切分点及第一语音切分点的切分概率、第二语音切分点及第二语音切分点的切分概率,确定目标语音数据的目标语音切分点,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210717004.6/2.html,转载请声明来源钻瓜专利网。