[发明专利]音频播放方法、音频转换方法及装置在审
申请号: | 202310256761.2 | 申请日: | 2023-03-08 |
公开(公告)号: | CN116229938A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 田昕弋 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/033 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 播放 方法 转换 装置 | ||
1.一种音频播放方法,其特征在于,应用于第一用户端,包括:
响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;
接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;
基于所述目标音频文件进行音频播放。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括根据以下步骤确定与所述第一用户端关联的第二用户端:
获取所述第一用户端与其他用户端的交互数据;
基于所述交互数据确定与所述第一用户端关联的第二用户端。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括根据以下方法获取所述第二用户端对应的声学特征:
响应针对至少一个第二用户端的标识的触发操作,通过服务器向所述至少一个第二用户端发送语音包录制请求,以指示所述至少一个第二用户端基于所述语音包录制请求进行语音包录制,所述第二用户端对应的声学特征为所述服务器在接收到所述至少一个第二用户端基于所述语音包录制请求上传的第一音频文件后,从所述第一音频文件中提取的。
4.根据权利要求1所述的方法,其特征在于,所述第二用户端对应的声学特征为,所述第二用户端发起针对所述第一用户端的语音包分享请求后,所述服务器基于所述第二用户端上传的第二音频文件进行特征提取后得到的。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在播放所述目标音频文件的同时,对展示的所述目标文本内容中已阅读的文本内容进行标记。
6.根据权利要求1所述的方法,其特征在位于,在响应针对当前展示的目标文本内容的播放触发操作之前,所述方法还包括:
响应检测到当前展示的所述目标文本内容满足语音播放条件,展示语音播放提示信息,所述语音播放提示信息用于指示执行所述播放触发操作;
其中,所述语音播放条件包括以下至少一种:
所述目标文本内容的字数超过预设字数、所述目标文本内容的展示时长超过预设时长、展示所述目标文本内容的时间在目标时间段内。
7.一种音频转换方法,其特征在于,应用于服务器,包括:
接收第一用户端发送的针对当前展示的目标文本内容的音频获取请求;
基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容对应的目标音频文件;
将所述目标音频文件发送至所述第一用户端,以使所述第一用户端基于所述目标音频文件进行音频播放。
8.根据权利要求7所述的方法,其特征在于,所述基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容匹配的目标音频文件,包括:
在与所述第一用户端关联的第二用户端的数量为多个的情况下,基于各第二用户端分别对应的声学特征,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端;
基于所述目标用户端对应的声学特征,生成与所述目标文本内容匹配的目标音频文件。
9.根据权利要求8所述的方法,其特征在于,所述基于各第二用户端分别对应的声学特征,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端,包括:
基于各第二用户端对应的第一文本内容类型与所述目标文本内容所属的第二文本内容类型,确定与所述目标文本内容匹配的目标用户端,其中,所述第二用户端对应的第一文本内容类型为基于预设的声学特征类型与文本内容类型的映射关系,和所述第二用户端的声学特征确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310256761.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种公共安全机房通信运维系统
- 下一篇:一种改性塑料加工系统和方法