[发明专利]语音数据集生成方法、装置、设备和计算机可读介质在审
申请号: | 202210073238.1 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114446295A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王二旭 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L13/02 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 史立状 |
地址: | 101116 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据 生成 方法 装置 设备 计算机 可读 介质 | ||
本公开的实施例公开了语音数据集生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:通过服务端提供的接口获取多个智能设备的属性信息,得到智能设备属性信息集,其中,每个属性信息包括至少一个属性,至少一个属性中包括设备控制属性;对于智能设备属性信息集中的属性信息,根据属性信息所包括的至少一个属性和至少一个属性所包括的设备控制属性对应的属性值,生成属性信息对应的多条控制文本,其中,每个属性值对应至少一条控制文本;将各条控制文本进行语音合成,得到语音数据集。该实施方式实现了语音数据集生成。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及语音数据集生成方法、装置、设备和计算机可读介质。
背景技术
为了对智能电视、智能空调、智能窗帘等智能设备进行的语音控制功能进行测试,需要大量的语音数据。例如,如果需要测试是否能正常开启电视,需要一条内容为“打开电视”的测试语音。在测试时,一般需要测试人员人工说出测试语音,或者提前录制测试语音。
然而,当采用上述方式得到测试语音时,经常会存在如下技术问题:
人工说出或者录制效率低下,缺乏自动生成智能设备测试语音数据的方法。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了语音数据集生成方法、装置、设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种语音数据集生成方法,该方法包括:。
第二方面,本公开的一些实施例提供了一种语音数据集装置,装置包括:。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例具有如下有益效果:实现了语音数据集的自动生成。具体来说,造成人工说出或者录制效率低下的原因在于:缺乏自动生成智能设备测试语音数据的方法。基于此,本公开通过智能设备的属性信息,自动生成控制文本,并根据控制文本自动合成语音数据集。从而提供了自动生成语音数据集的方法。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的一些实施例的语音数据集生成方法的一个应用场景的示意图;
图2是根据本公开的语音数据集生成方法的一些实施例的流程图;
图3示出了生成控制文本的一个示例性场景图;
图4是根据本公开的语音数据集生成方法的另一些实施例的流程图;
图5是根据本公开的语音数据集装置的一些实施例的结构示意图;
图6是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210073238.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中空玻璃自动封胶装置
- 下一篇:一种GPU测试辅助工具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置