[发明专利]一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法有效

专利信息
申请号: 202310430464.5 申请日: 2023-04-21
公开(公告)号: CN116156215B 公开(公告)日: 2023-07-07
发明(设计)人: 樊金礽;王增林;管权;陶涛 申请(专利权)人: 南京数脉动力信息技术有限公司
主分类号: H04N21/233 分类号: H04N21/233;H04N21/234;H04N21/2343;H04N21/2368;H04N21/61
代理公司: 上海复暨知识产权代理事务所(普通合伙) 31449 代理人: 林鹏
地址: 210000 江苏省南京市江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法,涉及图像通信技术领域,从确认的媒体视频文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流,将原始视频流导入视频隐私值计算策略中进行视频隐私值检测,将原始音频流导入音频隐私值计算策略中进行音频隐私值检测,将视频隐私值和音频隐私值分别与设定的对应的隐私阈值对比,判断是否向发布者反馈隐私信息,避免发布视频导致发布人员的隐私泄露。
搜索关键词: 一种 基于 volte 网络 视频 文件 压缩 高效 传输 系统 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京数脉动力信息技术有限公司,未经南京数脉动力信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310430464.5/,转载请声明来源钻瓜专利网。

同类专利
  • 音画同步检测方法、装置、计算机设备和存储介质-202210393914.3
  • 李大龙 - 腾讯科技(深圳)有限公司
  • 2022-04-15 - 2023-10-27 - H04N21/233
  • 本申请涉及一种音画同步检测方法、装置、计算机设备、存储介质和计算机程序产品。本发明实施例可应用于音视频、云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:从目标视频中提取目标图像数据和目标声音数据;基于图像显著性检测模型和声音显著性检测模型对目标图像数据和目标声音数据进行显著性检测,得到目标图像数据中存在显著性特征的图像帧对应的图像显著时间信息和目标声音数据中存在显著性特征的声音帧对应的声音显著时间信息;两个模型的训练样本是成对构造的;基于图像显著时间信息和声音显著时间信息之间的时间差异,确定目标视频对应的音画同步检测结果。采用本方法可提高音画同步检测的准确性和效率。
  • 直播中控方法及其装置、主控设备-202310819088.9
  • 陈威威;侯小林 - 灵感引擎(深圳)科技有限公司
  • 2023-07-05 - 2023-10-20 - H04N21/233
  • 本发明公开一种直播中控方法,包括:接收实时输入信息;根据实时输入信息生成输出信息,输出信息包括音频信息和弹幕信息;将音频信息发送至输出端进行播放;将弹幕信息发送至直播监控端,直播监控端用于将弹幕信息发送至相应的直播间;判断实时输入信息是否符合条件;当实时输入信息不符合条件时,根据实时输入信息生成提示信息;以及将提示信息发送至输出端进行显示。本发明公开的直播中控方法能够解决直播营销效果差的问题。此外,本发明还公开一种直播中控装置及主控设备。
  • 音频审核方法、装置、设备及可读存储介质-202210254907.5
  • 吴文亮;马金龙;徐志坚;谢睿;陈光尧;邓其春;王伟喆;张政统;曾锐鸿;黎子骏 - 广州欢城文化传媒有限公司
  • 2022-03-15 - 2023-10-13 - H04N21/233
  • 本申请公开了音频审核方法、装置、设备及可读存储介质,该方法包括:对音频流进行切片,得到多个音频片段,并对音频片段进行排序;获取每一音频片段对应的文本信息;若文本信息中包含敏感词,将与敏感词对应的音频片段确定为目标音频片段,并获取敏感词对应的敏感词信息、目标音频片段对应的第一音频特征,及排在目标音频片段前后的各个音频片段对应的第二音频特征及第三音频特征;对目标音频片段进行评分,得到审核分值;若审核分值大于拦截阈值,对目标音频片段进行拦截。可见,本申请可以提高音频审核的准确性。此外,确定审核分值时,既考虑目标音频片段,又考虑播放顺序在目标音频片段前后的音频片段,进一步提高了音频审核的准确率。
  • 一种音视频处理方法、装置、设备及介质-202310642722.6
  • 孙忠恒;孙佩;黄敏成 - 广州融生信息技术有限公司
  • 2023-05-31 - 2023-10-13 - H04N21/233
  • 本发明公开了一种音视频处理方法、装置、设备及介质。系统板通过多个第一输入接口接收多个网络音视频流并分别将其分发至各媒体板中;各媒体板通过其自身的第二输入接口接收本地音视频流;并获取其自身的各输出接口的合成配置信息;并针对各输出接口和输入接口标识,从接收到的多个网络音视频流以及本地音视频流中选择与该输入接口标识对应的音视频流,并根据合成规则,将待输出音视频流进行合成,生成合成视频流并将其输出至外部设备中。解决了对多路音视频流不能准确进行接口处理的问题,提高了对不同的音视频流进行处理的效率和准确率,以便工作人员能够进行更加准确的线路切换,实现了多路音视频流的数据隔离,从而保证了不会溢出到本地网络。
  • 一种视频后期剪辑与视频合成优化方法-202310958973.5
  • 余骐楠;潘安;陈思远;李倩;汪琥;张梦晗;孔銮铉;温泉;罗昕美 - 南拳互娱(武汉)文化传媒有限公司
  • 2023-08-01 - 2023-10-03 - H04N21/233
  • 本发明涉及影视传媒技术领域,具体涉及一种视频后期剪辑与视频合成优化方法,通过内容分析和特征提取,自动识别关键场景和特征,并提取视觉特征、语义信息和情感内容,借助语义关联和场景划分,将视频分割为不同场景,并从音频、字幕等提取语义信息,实现更准确的场景划分,智能剪辑和剧情推进自动拆分视频为段落或镜头,并保持视觉流畅性和情感连贯性,动态音视频合成确保音频与视频的节奏、情感和情绪相匹配,提供更具感染力的观看体验。智能特效与过渡根据场景和情感特征自动生成合适的视觉特效,增强视频的视觉吸引力,多模态数据融合将视频中的多模态数据融合起来进行联合优化,提高视频质量。
  • 一种音频分类方法、装置、设备以及存储介质-202310934641.3
  • 尹天舒 - 北京奇艺世纪科技有限公司
  • 2023-07-27 - 2023-09-29 - H04N21/233
  • 本申请实施例提供了一种音频分类方法、装置、设备以及存储介质。其中,一种音频分类方法包括:将目标音频切分为多个音频片段;识别每一音频片段所属的音频类别;从各个属于第一类别的音频片段中,选取所对应音频时间最晚的音频片段,作为基准片段;确定所对应音频时间位于所述基准片段的结束时间之后、且属于第二类别的各个目标音频片段;对各个目标音频片段进行预定聚合处理,得到至少一个合并片段;基于至少一个合并片段,确定目标音频中的片尾曲的起始时间点。可见,本方案可以自动确定片尾曲的起始时间,提升片尾曲的起始时间标注效率,降低人工成本。
  • 内容提示方法、装置、存储介质及计算机设备-202310433832.1
  • 彭子娇;陈东鹏;张伟彬;李亚桐 - 深圳市声扬科技有限公司
  • 2023-04-21 - 2023-09-15 - H04N21/233
  • 本申请实施例公开了一种内容提示方法、装置、存储介质及计算机设备。本申请实施例获取直播间的实时音频数据;将所述实时音频数据输入自动语音识别系统,输出对应的文字内容;对所述文字内容进行句法分析,确定所述实时音频数据中的话术关键词;在直播界面显示所述话术关键词,以对重点内容进行提示。以此,通过对实时音频数据进行语音识别,确定主播对当前产品进行讲解话术中的话术关键词,并在直播界面中播放话术关键词,实现对当前直播界面正在讲解的商品进行重点内容的播放提示,增加了以字幕形式对产品进行了解的渠道,使得用户对产品进行了解的方式多样化,优化用户通过直播方式进行产品购买的体验效果。
  • 音频处理方法、装置、设备及存储介质-202310441284.7
  • 邓鹏 - 深圳市九洲电器有限公司
  • 2023-04-19 - 2023-09-01 - H04N21/233
  • 本发明涉及音频处理技术领域,尤其涉及一种音频处理方法、装置、设备及存储介质,该方法包括:通过接收终端设备发送的待播放音频文件,并根据待播放音频文件获取对应的待播放内容以及播放时间;对待播放内容进行人声提取,并根据提取结果获得对应的文字信息;对文字信息进行语义识别,判断文字信息是否为预设消音信息;若是,则根据文字信息和播放时间生成对应的消音指令,并将消音指令发送至终端设备,以使终端设备根据消音指令对待播放音频文件进行消音后播放。由于本发明可对待直播音频文件进行语义识别,并根据识别到的预设消音信息生成消音指令,以使终端设备在对待直播音频文件进行消音后播放,可自动消除不良音频,提升用户观看体验。
  • 视频合成方法、装置、设备及存储介质-202010611693.3
  • 董霙;刘炳楠 - 腾讯科技(深圳)有限公司
  • 2020-06-30 - 2023-08-18 - H04N21/233
  • 本申请公开了一种视频合成方法、装置、设备及存储介质,涉及视频处理领域。该方法包括:获取文本;获取文本对应的音频,对音频进行处理,得到音频中的音素序列对应的n种口型标识和各个口型标识的口型时间点信息,n为正整数;获取标准化口型序列帧和含有主播形象的视频,标准化口型序列帧包括n种口型标识对应的口型视频帧;按照各个口型标识的口型时间点信息,将n种口型标识对应的口型视频帧与含有主播形象的视频进行合成处理,得到主播视频。无需预先训练用于合成视频的机器学习模型,只需提供文本即可实现合成主播视频,降低了视频的合成难度,同时提高了视频的合成效率。
  • 音视频同步方法、装置、计算设备及存储介质-202210703399.4
  • 李立锋;谢韬 - 咪咕文化科技有限公司;中国移动通信集团有限公司
  • 2022-06-21 - 2023-08-15 - H04N21/233
  • 本发明公开了一种音视频同步方法、装置、计算设备及存储介质。用户终端获取用户终端视频在同步校验时间的第一进度以及从同步校验时间对应的用户终端音频切片中提取音频特征码;服务端在服务端音频中查找与音频特征码匹配的第二进度,并计算第一进度与第二进度的第一进度差;用户终端计算用户终端音频在同步校验时间的第三进度与第二进度的第二进度差,并根据第一进度差以及第二进度差确定用户终端音频与视频的播放时差,以及利用该播放时差进行用户终端音频与用户终端视频的同步处理。本方案并未对音频及视频进行侵入性的信息写入,由此保障音频及视频的源数据的安全;本方案在视频介质发生改变之后,无需重新对视频或音频进行处理。
  • 一种房间违规审核方法、装置、设备、存储介质及产品-202310418081.6
  • 常恒毅;马东鹏;项伟 - 百果园技术(新加坡)有限公司
  • 2023-04-18 - 2023-08-11 - H04N21/233
  • 本申请实施例提供了一种房间违规审核方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过根据黑名单列表确定待审核房间中的在线黑名单用户,根据在线黑名单用户从待审核房间中确定嫌疑房间,并获取嫌疑房间的房间音频信息,从各个嫌疑房间的房间音频信息中确定嫌疑音频,并基于嫌疑音频对嫌疑房间进行违规审核,通过在线黑名单用户对待审核房间进行初步筛选确定嫌疑房间,并根据嫌疑房间的房间音频信息进行二次筛选,确定嫌疑音频,可基于嫌疑音频准确对嫌疑房间进行违规审核,从直播房间的语音信息中确定存在违规可能的嫌疑音频,有效提高对房间的审核准确度,提高房间审核效果。
  • 一种基于WebAssembly的在线音视频处理方法-202310495991.4
  • 陈宇明 - 康键信息技术(深圳)有限公司
  • 2023-05-04 - 2023-08-08 - H04N21/233
  • 本申请涉及音视频处理技术领域及数字医疗领域,更为具体来说,本申请涉及一种基于WebAssembly的在线音视频处理方法。所述方法包括:获取在线音视频处理请求;通过Worker线程拦截与所述在线音视频处理请求对应的wasm文件;解析所述wasm文件,得到目标对象;基于所述目标对象获取WebAssembly实例;接收待处理音视频,利用所述WebAssembly实例对所述待处理音视频进行目标处理。本申请不需要服务端的支持,能够减少音视频传输的带宽成本,降低网络不稳定时造成的时间成本。本申请有效利用用户的计算资源,利用常见的硬件能力,WebAssembly代码在不同平台上能够以接近本地速度运行。另外,本申请所述方法还可以离线运行,在网络不稳定的情况下也能瞬间加载并运行。
  • 媒体内容发布方法、装置、设备及存储介质-202310464604.0
  • 赵嘉仪;孙辉;宋青;黄磊 - 北京字跳网络技术有限公司
  • 2023-04-26 - 2023-07-28 - H04N21/233
  • 本公开实施例公开了媒体内容发布方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:响应于针对媒体内容获取页面的拍摄操作,获取目标拍摄模式下拍摄的目标图像,目标图像包括封面图像、以及拍摄操作的触发时刻之前的第一时刻至触发时刻之后的第二时刻之间的录制视频,确定目标图像对应的目标音频,根据目标图像和目标音频生成目标媒体内容,响应于目标媒体内容的发布操作,将目标媒体内容作为应用程序中的媒体作品进行发布。通过采用上述技术方案,可以实现根据目标图像和音频生成用于发布的媒体内容并进行发布,丰富媒体内容的创作方式,以及丰富媒体作品中的内容形式,有利于增强用户之间基于媒体作品的互动,提升用户体验。
  • 交互方法、装置、设备及存储介质-202210049730.5
  • 万瑞卿;胡晓阳 - 北京达佳互联信息技术有限公司
  • 2022-01-17 - 2023-07-25 - H04N21/233
  • 本公开关于一种交互方法、装置、设备及存储介质,涉及互联网技术领域。该方法包括:获取媒体资源,并显示播放界面,播放界面用于播放媒体资源;媒体资源中包括用于指示目标交互元素的目标语音指令;在检测到播放目标语音指令的情况下,显示目标语音指令对应的目标提示信息,目标提示信息用于提示对象账户操作播放界面上的目标交互元素。
  • 用于从直播视频流剪辑视频的方法、装置、设备和存储介质-202011591386.X
  • 李晨曦;庞磊;王珊;聂卫国 - 百度在线网络技术(北京)有限公司
  • 2020-12-29 - 2023-07-25 - H04N21/233
  • 本公开公开一种用于从直播视频流剪辑视频的方法、装置、设备和存储介质,涉及人工智能领域。用于从直播视频流剪辑视频的方法包括:从视频流获取第一预定时间长度的多个视频片段;确定多个视频片段是否属于预定分类;以及响应于确定多个视频片段中的一个第一视频片段属于预定分类,从第一视频片段中提取第二预定时间长度的视频子片段,作为视频剪辑片段至少一部分,其中第二预定时间长度小于第一预定时间长度。本公开的方案实现了对于例如直播视频流的类别识别以及基于类别的自动视频剪辑。
  • 一种音视频调度方法及系统-202310249976.1
  • 张美炎;陆继松 - 深圳市宏辉智通科技有限公司
  • 2023-03-03 - 2023-07-14 - H04N21/233
  • 本申请涉及一种音视频调度方法及系统,方法包括与终端建立数据通讯关系;收集终端采集的视频流和音频流并在时间长度上对视频流和音频流进行分割;对音频流段进行压缩处理;对视频流段中的图像进行灰度处理,得到基准图像并对基准图像进行区域划分,得到多个子基准图像;对子基准图像进行网格划分,得到多个子基准图像单元,子基准图像单元的面积小于等于设定单位面积;对子基准图像单元进行压缩以及将经过压缩处理的视频流段和音频流段发送至终端。本申请公开的音视频调度方法及系统,通过对音频与视频进行压缩算法优化的处理方式来兼顾压缩率和压缩体积,能够在约束条件不变的情况下提高音频与视频的传输效率,用以满足即时通讯的使用需求。
  • 发送装置和方法、媒体处理装置和方法以及接收装置-202110497015.3
  • 塚越郁夫 - 索尼公司
  • 2016-05-10 - 2023-07-14 - H04N21/233
  • 本公开涉及发送装置和方法、媒体处理装置和方法以及接收装置。本发明使得能够优选地在接收侧执行一系列媒体访问控制。本发明发送包括媒体流的预定格式的容器。与一系列媒体访问控制相关联的预定数量的媒体访问信息组连续地插入媒体流的层或容器的层中。例如,媒体访问信息包括用于区分其他媒体访问信息的标识信息和用于与其他媒体访问信息相关联的标识信息。
  • 一种视频合成方法、装置以及可读存储介质-202111634313.9
  • 程瑞;张金超 - 腾讯科技(深圳)有限公司
  • 2021-12-29 - 2023-07-11 - H04N21/233
  • 本申请公开了一种视频合成方法、装置以及可读存储介质,该方法包括:在获取到原始文本时,获取原始文本中的待处理文本;获取待处理文本的文本语义向量,在候选图片对应的候选图片向量中查找与文本语义向量具有相同语义的候选图片向量,基于查找到的候选图片向量所对应的候选图片确定待处理文本对应的文本映射图片;在获取到与待处理文本相关联的语音转换参数时,将待处理文本转换为与语音转换参数相符的文本映射语音;基于待处理文本、文本映射图片和文本映射语音,生成用于合成目标视频的音频帧和视频帧,将生成的音频帧和视频帧进行视频合成处理,得到原始文本对应的目标视频。采用本申请,可以在文本转视频的过程中,丰富文本的视听展示效果。
  • 音频处理方法、电子设备以及计算机可读存储介质-202111668070.0
  • 廖涛 - 华为云计算技术有限公司
  • 2021-12-31 - 2023-07-11 - H04N21/233
  • 本公开提供了一种音频处理方法、电子设备以及计算机可读存储介质。该音频处理方法包括接收被配置在第一语言频道上的参会设备的至少一个音频流以及与第一语言频道相关联的翻译设备的音频流;基于该至少一个音频流,确定第一语言频道是否处于活跃状态;以及如果第一语言频道被确定为处于活跃状态,通过排除翻译设备的音频流进行混音。利用本公开的实施例,可以去除在会议中由翻译设备导致的重复语音。
  • 音频降噪方法、装置、计算机可读介质和电子设备-202010176391.8
  • 史俊杰 - 北京字节跳动网络技术有限公司
  • 2020-03-13 - 2023-07-07 - H04N21/233
  • 本公开涉及一种音频降噪方法、装置、计算机可读介质和电子设备。该方法包括:对待降噪媒体文件进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息;至少根据所述时段信息,将所述待降噪媒体文件划分出待降噪的第一媒体片段;根据所述第一媒体片段对应的所述场景标签,确定所述第一媒体片段对应的目标降噪信息;根据所述目标降噪信息对所述第一媒体片段进行音频降噪处理。如此,可以对待降噪媒体文件进行更细粒度的音频降噪处理,使其与具体媒体片段内容对应的场景相适应。这样,可以满足用户在不同场景下的感官需求,提升了用户体验。
  • 一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法-202310430464.5
  • 樊金礽;王增林;管权;陶涛 - 南京数脉动力信息技术有限公司
  • 2023-04-21 - 2023-07-07 - H04N21/233
  • 本发明公开了一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法,涉及图像通信技术领域,从确认的媒体视频文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流,将原始视频流导入视频隐私值计算策略中进行视频隐私值检测,将原始音频流导入音频隐私值计算策略中进行音频隐私值检测,将视频隐私值和音频隐私值分别与设定的对应的隐私阈值对比,判断是否向发布者反馈隐私信息,避免发布视频导致发布人员的隐私泄露。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top