[发明专利]语音文本重构方法、装置、存储介质和计算机设备在审
| 申请号: | 202211526349.X | 申请日: | 2022-11-30 |
| 公开(公告)号: | CN116306583A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 黄永刚;王天祥;宋亮;刘楚雄 | 申请(专利权)人: | 成都赛力斯科技有限公司 |
| 主分类号: | G06F40/216 | 分类号: | G06F40/216;G10L15/22;G06F40/30;G06F40/289;G06F40/211;G06F16/33 |
| 代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 高飞 |
| 地址: | 610000 四川省成都市自由贸易试验区*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 文本 方法 装置 存储 介质 计算机 设备 | ||
本发明实施例提供了一种语音文本重构方法、装置、存储介质和计算机设备。该方法包括:获取标准语音文本;判断标准语音文本是否符合语句数量条件;若判断出标准语音文本不符合语句数量条件,则通过语句重构方式,根据标准语音文本,生成第一重构语音文本;若判断出标准语音文本符合语句数量条件,则通过模型切割方式,根据标准语音文本,生成第二重构语音文本,从而使计算机设备能够对获取的标准语音文本进行重构,降低了语音文本的复杂度。
【技术领域】
本发明实施例涉及文本重构技术领域,具体涉及一种语音文本重构方法、装置、存储介质和计算机设备。
【背景技术】
传统的交互方式具有学习成本高、交互繁琐的缺点,语音控制系统因拥有更自然的交互方式得到越来越多的关注。语音控制系统包括语义理解系统,语音控制系统首先采集音频信号;对音频信号进行语音识别,将音频信号转成语音文本;通过语义理解系统,对语音文本进行语义理解后,解析成指令信息;最后经过自然语言生成后置处理。
语音文本的规范性和复杂性决定了语义理解系统构建的复杂性、稳定性及建设成本的高低。语音控制系统可对语音文本进行长文本分段,但若语音文本具有多意图、多语句及相关组合,则无法降低语音文本的复杂度,会导致语义理解系统对语音文本进行语义理解时,语音文本的复杂度高。
【发明内容】
有鉴于此,本发明实施例提供了一种语音文本重构方法、装置、存储介质和计算机设备,用以解决现有技术中语音文本的复杂度高的问题。
第一方面,本发明实施例提供了一种语音文本重构方法,包括:
获取标准语音文本;
判断所述标准语音文本是否符合语句数量条件;
若判断出所述标准语音文本不符合语句数量条件,则通过语句重构方式,根据所述标准语音文本,生成第一重构语音文本;
若判断出所述标准语音文本符合语句数量条件,则通过模型切割方式,根据所述标准语音文本,生成第二重构语音文本。
在一种可能的实现方式中,所述判断所述标准语音文本是否符合语句数量条件,包括:
根据所述标准语音文本,输出第一语句数量;
判断所述第一语句数量是否大于第一数量阈值;
若判断出所述第一语句数量大于所述第一数量阈值,则确定出所述标准语音文本符合语句数量条件;
若判断出所述第一语句数量小于或等于所述第一数量阈值,则计算所述标准语音文本的第二语句数量;
判断所述第二语句数量是否大于所述第一数量阈值;
若判断出所述第二语句数量小于或等于所述第一数量阈值,则确定出所述标准语音文本不符合语句数量条件;
若判断出所述第二语句数量大于所述第一数量阈值,则确定出所述标准语音文本符合语句数量条件。
在一种可能的实现方式中,所述计算所述标准语音文本的第二语句数量,包括:
通过动词表,统计出所述标准语音文本的动词数量,并将所述动词数量作为所述第二语句数量;或者,
通过机器学习模型,根据所述标准语音文本,输出所述第二语句数量。
在一种可能的实现方式中,所述通过模型切割方式,根据所述标准语音文本,生成第二重构语音文本,包括:
通过神经网络模型,对所述标准语音文本进行切割,生成切割序列文本,所述切割序列文本包括切割序列与标准语音文本;
若确定出所述切割序列的数量大于第二数量阈值,则根据切割序列生成第二重构语音文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都赛力斯科技有限公司,未经成都赛力斯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211526349.X/2.html,转载请声明来源钻瓜专利网。





