[发明专利]音频播放方法、音频转换方法及装置在审
申请号: | 202310256761.2 | 申请日: | 2023-03-08 |
公开(公告)号: | CN116229938A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 田昕弋 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/033 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 播放 方法 转换 装置 | ||
本公开提供了一种音频播放方法、音频转换方法及装置,其中,所述音频播放方法包括:响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;基于所述目标音频文件进行音频播放。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种音频播放方法、音频转换方法及装置。
背景技术
随着互联网技术和移动终端技术的快速发展,用户的信息来源越来越依赖于互联网和手机,传统的文本阅读方式由于信息获取效率较低已经不能满足用户的信息获取需求,因此用户可以借用相关技术,将文本转换成音频,并通过音频来获取信息。
相关技术中,在进行音频转换的过程中,往往只能使用机器合成出的声音对文本内容进行音频转换,转换后得到的音频在播放过程中的播放效果较差。
发明内容
本公开实施例至少提供一种音频播放方法、音频转换方法及装置。
第一方面,本公开实施例提供了一种音频播放方法,应用于第一用户端,包括:
响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;
接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;
基于所述目标音频文件进行音频播放。
一种可能的实施方式中,所述方法还包括根据以下步骤确定与所述第一用户端关联的第二用户端:
获取所述第一用户端与其他用户端的交互数据;
基于所述交互数据确定与所述第一用户端关联的第二用户端。
一种可能的实施方式中,所述方法还包括根据以下方法获取所述第二用户端对应的声学特征:
响应针对至少一个第二用户端的标识的触发操作,通过服务器向所述至少一个第二用户端发送语音包录制请求,以指示所述至少一个第二用户端基于所述语音包录制请求进行语音包录制,所述第二用户端对应的声学特征为所述服务器在接收到所述至少一个第二用户端基于所述语音包录制请求上传的第一音频文件后,从所述第一音频文件中提取的。
一种可能的实施方式中,所述第二用户端对应的声学特征为,所述第二用户端发起针对所述第一用户端的语音包分享请求后,所述服务器基于所述第二用户端上传的第二音频文件进行特征提取后得到的。
一种可能的实施方式中,所述方法还包括:
在播放所述目标音频文件的同时,对展示的所述目标文本内容中已阅读的文本内容进行标记。
一种可能的实施方式中,在响应针对当前展示的目标文本内容的播放触发操作之前,所述方法还包括:
响应检测到当前展示的所述目标文本内容满足语音播放条件,展示语音播放提示信息,所述语音播放提示信息用于指示执行所述播放触发操作;
其中,所述语音播放条件包括以下至少一种:
所述目标文本内容的字数超过预设字数、所述目标文本内容的展示时长超过预设时长、展示所述目标文本内容的时间在目标时间段内。
第二方面,本公开实施例还提供一种音频转换方法,应用于服务器,包括:
接收第一用户端发送的针对当前展示的目标文本内容的音频获取请求;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310256761.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种公共安全机房通信运维系统
- 下一篇:一种改性塑料加工系统和方法