[发明专利]网络直播中的视音频处理方法、计算机设备和介质在审
| 申请号: | 202110067074.7 | 申请日: | 2021-01-19 |
| 公开(公告)号: | CN112839237A | 公开(公告)日: | 2021-05-25 |
| 发明(设计)人: | 崔月鹏 | 申请(专利权)人: | 阿里健康科技(杭州)有限公司 |
| 主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/233;H04N21/2343;H04N21/239;H04N21/488;H04N5/278;G10L15/26;G06F40/284 |
| 代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 李镇江 |
| 地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 直播 中的 音频 处理 方法 计算机 设备 介质 | ||
本公开提供了一种网络直播中的视音频处理方法、计算机设备和介质。该方法包括:接收主播终端直播过程中产生的视频消息和音频消息;将所述音频消息识别成字幕;将所述字幕与所述视频消息、音频消息一起打包发送到用户终端播放。本公开实施例提高了用户对直播内容的理解,使听障用户在听不到直播语音的情况下也能理解直播内容。
技术领域
本发明涉及互联网领域,具体而言,涉及一种网络直播中的视音频处理方法、计算机设备和介质。
背景技术
互联网直播目前蓬勃发展。在互联网直播中,有一类直播是信息输出型直播。这种直播并不产生娱乐内容,而是以知识的讲授、信息的介绍为主,如医生直播问诊。医生主播为连线或留言的用户提供医疗知识,回答病患的问题,成为一种新型问诊模式,解决碎片化时代的医患难题,使医疗更具有实时性、时效性,优化了医患时间,提供医疗透明度。
然而,信息输出型直播的语言有时具有专业型,例如一些医学上的话语,难以快速被用户理解,尤其对于一些听障用户就更加难以理解。另外,这类直播以信息输出为主,缺乏变现渠道。例如,医生在线解答用户问题,但不一定能从用户收到相应的医疗费用。而用户被在线诊断后,可能也有购买药品的需求,却只能线下买药,非常不方便。另外,这类直播经常涉及专业名词。由于用户不懂这些专业名词,要么影响对整个直播内容的理解,要么线下查找,浪费时间。
发明内容
有鉴于此,本发明的一个目的在于提高用户对直播内容的理解,使听障用户在听不到直播语音的情况下也能理解直播内容。
为了达到这个目的,根据本公开的一方面,提供了一种网络直播中的视音频处理方法,包括:
接收主播终端直播过程中产生的视频消息和音频消息;
将所述音频消息识别成字幕;
将所述字幕与所述视频消息、音频消息一起打包发送到用户终端播放。
可选地,所述视频消息和视音频携带有时间戳;所述将所述音频消息识别成字幕,包括:将所述音频消息的时间戳以外的内容识别成字幕,并将所述时间戳添加到所述字幕;所述将所述字幕与所述视频消息、音频消息一起打包发送到用户终端播放,包括:将同一时间戳的字幕与所述视频消息、音频消息一起打包发送到用户终端播放。
可选地,在将所述字幕与所述视频消息、音频消息一起打包发送到用户终端播放之后,所述方法还包括:
接收所述用户终端的取消显示字幕指示;
取消所述字幕的显示。
可选地,在取消所述字幕的显示之后,所述方法还包括:
接收用户的显示字幕指示;
显示所述字幕。
可选地,在将所述字幕与所述视频消息、音频消息一起打包发送到用户终端播放之后,所述方法还包括:
接收用户的移动字幕指示;
将所述字幕移动到所述移动字幕指示所指示的位置。
可选地,在将所述音频消息识别成字幕之后,所述方法还包括:
根据所述字幕,获取物品推荐信息;
将所述物品推荐信息与所述视频消息、音频消息一起打包发送到用户终端播放。
可选地,所述根据所述字幕,获取物品推荐信息,包括:
将所述字幕分词;
根据分成的词与物品库中各物品标签的匹配,获取物品推荐信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里健康科技(杭州)有限公司,未经阿里健康科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110067074.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种糖蜜压片玉米混合饲料和糖蜜制备方法
- 下一篇:一种光刻装置及曝光方法





