[发明专利]一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法有效

申请号：	202310430464.5	申请日：	2023-04-21
公开（公告）号：	CN116156215B	公开（公告）日：	2023-07-07
发明（设计）人：	樊金礽;王增林;管权;陶涛	申请（专利权）人：	南京数脉动力信息技术有限公司
主分类号：	H04N21/233	分类号：	H04N21/233;H04N21/234;H04N21/2343;H04N21/2368;H04N21/61
代理公司：	上海复暨知识产权代理事务所(普通合伙) 31449	代理人：	林鹏
地址：	210000 江苏省南京市江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法，涉及图像通信技术领域，从确认的媒体视频文件中提取编码参数，并对输入的媒体文件进行音、视频流分离和解码，提取出原始音频流和原始视频流，将原始视频流导入视频隐私值计算策略中进行视频隐私值检测，将原始音频流导入音频隐私值计算策略中进行音频隐私值检测，将视频隐私值和音频隐私值分别与设定的对应的隐私阈值对比，判断是否向发布者反馈隐私信息，避免发布视频导致发布人员的隐私泄露。
搜索关键词：	一种基于 volte 网络视频文件压缩高效传输系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京数脉动力信息技术有限公司，未经南京数脉动力信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202310430464.5/，转载请声明来源钻瓜专利网。

上一篇：一种高速缓存电路
下一篇：一种生理信号绘制方法、装置、电子设备及存储介质

同类专利

音画同步检测方法、装置、计算机设备和存储介质-202210393914.3
发明人：李大龙 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-04-15 - 公布日： 2023-10-27 - 主分类号： H04N21/233
摘要：本申请涉及一种音画同步检测方法、装置、计算机设备、存储介质和计算机程序产品。本发明实施例可应用于音视频、云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括：从目标视频中提取目标图像数据和目标声音数据；基于图像显著性检测模型和声音显著性检测模型对目标图像数据和目标声音数据进行显著性检测，得到目标图像数据中存在显著性特征的图像帧对应的图像显著时间信息和目标声音数据中存在显著性特征的声音帧对应的声音显著时间信息；两个模型的训练样本是成对构造的；基于图像显著时间信息和声音显著时间信息之间的时间差异，确定目标视频对应的音画同步检测结果。采用本方法可提高音画同步检测的准确性和效率。

视频图像的处理方法、装置、电子设备及存储介质-202310900219.6
发明人：李文宇;陈丽莉;苗京花;李治富;郑超;马思研;李言 -专利权人：京东方科技集团股份有限公司;北京京东方技术开发有限公司
申请日： 2023-07-20 - 公布日： 2023-10-24 - 主分类号： H04N21/233
摘要：本申请提供了一种视频图像的处理方法、装置、电子设备及存储介质，其中方法可以包括：在多个候选用户中确定出正在发言的目标用户。采集目标用户的视频图像。将视频图像与采集到的目标用户的音频数据进行编码后进行网络传输。依据本申请实施例，采集的视频图像中是针对目标用户的，由此在视频通话时可以对正在发言的用户进行突出显示。最终，可以实现去除通话过程中的冗余信息。对应的，在视频显示端所播放的画面便会是正在发言的目标用户。由此，可以使显示端的观者的焦点可以对准正在发言的目标用户而不会看到目标用户周围的其他候选用户，从而避免错过重要信息，提升视频通话的效率。

视频处理方法、装置及存储介质-202310919506.1
发明人：吴怡;潘兴浩;谢于贵;马晓;王宇佳 -专利权人：咪咕视讯科技有限公司;咪咕文化科技有限公司;中国移动通信集团有限公司
申请日： 2023-07-25 - 公布日： 2023-10-24 - 主分类号： H04N21/233
摘要：本发明提供一种视频处理方法、装置及存储介质，本发明的方法包括：根据目标用户的地址信息，确定与所述地址信息对应的地域语音特征；根据所述目标用户的语音信息，确定所述目标用户的个人语音特征；根据所述地域语音特征和所述个人语音特征，对源视频的音频进行语音特征融合，得到目标音频。如此，解决了现有技术无法满足用户需求，降低了视频播放质量的问题。

直播中控方法及其装置、主控设备-202310819088.9
发明人：陈威威;侯小林 -专利权人：灵感引擎（深圳）科技有限公司
申请日： 2023-07-05 - 公布日： 2023-10-20 - 主分类号： H04N21/233
摘要：本发明公开一种直播中控方法，包括：接收实时输入信息；根据实时输入信息生成输出信息，输出信息包括音频信息和弹幕信息；将音频信息发送至输出端进行播放；将弹幕信息发送至直播监控端，直播监控端用于将弹幕信息发送至相应的直播间；判断实时输入信息是否符合条件；当实时输入信息不符合条件时，根据实时输入信息生成提示信息；以及将提示信息发送至输出端进行显示。本发明公开的直播中控方法能够解决直播营销效果差的问题。此外，本发明还公开一种直播中控装置及主控设备。

音频审核方法、装置、设备及可读存储介质-202210254907.5
发明人：吴文亮;马金龙;徐志坚;谢睿;陈光尧;邓其春;王伟喆;张政统;曾锐鸿;黎子骏 -专利权人：广州欢城文化传媒有限公司
申请日： 2022-03-15 - 公布日： 2023-10-13 - 主分类号： H04N21/233
摘要：本申请公开了音频审核方法、装置、设备及可读存储介质，该方法包括：对音频流进行切片，得到多个音频片段，并对音频片段进行排序；获取每一音频片段对应的文本信息；若文本信息中包含敏感词，将与敏感词对应的音频片段确定为目标音频片段，并获取敏感词对应的敏感词信息、目标音频片段对应的第一音频特征，及排在目标音频片段前后的各个音频片段对应的第二音频特征及第三音频特征；对目标音频片段进行评分，得到审核分值；若审核分值大于拦截阈值，对目标音频片段进行拦截。可见，本申请可以提高音频审核的准确性。此外，确定审核分值时，既考虑目标音频片段，又考虑播放顺序在目标音频片段前后的音频片段，进一步提高了音频审核的准确率。

一种音视频处理方法、装置、设备及介质-202310642722.6
发明人：孙忠恒;孙佩;黄敏成 -专利权人：广州融生信息技术有限公司
申请日： 2023-05-31 - 公布日： 2023-10-13 - 主分类号： H04N21/233
摘要：本发明公开了一种音视频处理方法、装置、设备及介质。系统板通过多个第一输入接口接收多个网络音视频流并分别将其分发至各媒体板中；各媒体板通过其自身的第二输入接口接收本地音视频流；并获取其自身的各输出接口的合成配置信息；并针对各输出接口和输入接口标识，从接收到的多个网络音视频流以及本地音视频流中选择与该输入接口标识对应的音视频流，并根据合成规则，将待输出音视频流进行合成，生成合成视频流并将其输出至外部设备中。解决了对多路音视频流不能准确进行接口处理的问题，提高了对不同的音视频流进行处理的效率和准确率，以便工作人员能够进行更加准确的线路切换，实现了多路音视频流的数据隔离，从而保证了不会溢出到本地网络。

一种视频后期剪辑与视频合成优化方法-202310958973.5
发明人：余骐楠;潘安;陈思远;李倩;汪琥;张梦晗;孔銮铉;温泉;罗昕美 -专利权人：南拳互娱（武汉）文化传媒有限公司
申请日： 2023-08-01 - 公布日： 2023-10-03 - 主分类号： H04N21/233
摘要：本发明涉及影视传媒技术领域，具体涉及一种视频后期剪辑与视频合成优化方法，通过内容分析和特征提取，自动识别关键场景和特征，并提取视觉特征、语义信息和情感内容，借助语义关联和场景划分，将视频分割为不同场景，并从音频、字幕等提取语义信息，实现更准确的场景划分，智能剪辑和剧情推进自动拆分视频为段落或镜头，并保持视觉流畅性和情感连贯性，动态音视频合成确保音频与视频的节奏、情感和情绪相匹配，提供更具感染力的观看体验。智能特效与过渡根据场景和情感特征自动生成合适的视觉特效，增强视频的视觉吸引力，多模态数据融合将视频中的多模态数据融合起来进行联合优化，提高视频质量。

一种音频分类方法、装置、设备以及存储介质-202310934641.3
发明人：尹天舒 -专利权人：北京奇艺世纪科技有限公司
申请日： 2023-07-27 - 公布日： 2023-09-29 - 主分类号： H04N21/233
摘要：本申请实施例提供了一种音频分类方法、装置、设备以及存储介质。其中，一种音频分类方法包括：将目标音频切分为多个音频片段；识别每一音频片段所属的音频类别；从各个属于第一类别的音频片段中，选取所对应音频时间最晚的音频片段，作为基准片段；确定所对应音频时间位于所述基准片段的结束时间之后、且属于第二类别的各个目标音频片段；对各个目标音频片段进行预定聚合处理，得到至少一个合并片段；基于至少一个合并片段，确定目标音频中的片尾曲的起始时间点。可见，本方案可以自动确定片尾曲的起始时间，提升片尾曲的起始时间标注效率，降低人工成本。

音乐处理方法、视频生成方法、装置、计算机设备和介质-202310771199.7
发明人：符峥 -专利权人：影石创新科技股份有限公司
申请日： 2023-06-27 - 公布日： 2023-09-22 - 主分类号： H04N21/233
摘要：本申请涉及一种音乐处理方法、视频生成方法、装置、计算机设备和介质。上述方法包括：获取各音频帧的音频特征值；根据各音频帧的音频特征值获取目标音频片段。采用本方法提高截取的音乐的高潮片段的精度及通用性，且能够提高视频生成方法的适用性及通用性。

音频数据流拼接以及播出方法、音频解码器和音频解码方法-202110114803.X
发明人：赫伯特·托马;罗伯特·布雷特;斯特芬·卡拉格鲁;马克斯·诺伊恩多夫;亚琴·昆兹;安德鲁斯·尼德梅尔;麦克尔·卡特斯莫 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2015-09-08 - 公布日： 2023-09-22 - 主分类号： H04N21/233
摘要：通过使用一个或多个截断单元分组，使得音频拼接更有效，其中一个或多个截断单元分组被插入到音频数据流中以针对预定访问单元向音频解码器指示与预定访问单元相关联的音频帧的端部要在播出时被丢弃。

内容提示方法、装置、存储介质及计算机设备-202310433832.1
发明人：彭子娇;陈东鹏;张伟彬;李亚桐 -专利权人：深圳市声扬科技有限公司
申请日： 2023-04-21 - 公布日： 2023-09-15 - 主分类号： H04N21/233
摘要：本申请实施例公开了一种内容提示方法、装置、存储介质及计算机设备。本申请实施例获取直播间的实时音频数据；将所述实时音频数据输入自动语音识别系统，输出对应的文字内容；对所述文字内容进行句法分析，确定所述实时音频数据中的话术关键词；在直播界面显示所述话术关键词，以对重点内容进行提示。以此，通过对实时音频数据进行语音识别，确定主播对当前产品进行讲解话术中的话术关键词，并在直播界面中播放话术关键词，实现对当前直播界面正在讲解的商品进行重点内容的播放提示，增加了以字幕形式对产品进行了解的渠道，使得用户对产品进行了解的方式多样化，优化用户通过直播方式进行产品购买的体验效果。

音频处理方法、装置、设备及存储介质-202310441284.7
发明人：邓鹏 -专利权人：深圳市九洲电器有限公司
申请日： 2023-04-19 - 公布日： 2023-09-01 - 主分类号： H04N21/233
摘要：本发明涉及音频处理技术领域，尤其涉及一种音频处理方法、装置、设备及存储介质，该方法包括：通过接收终端设备发送的待播放音频文件，并根据待播放音频文件获取对应的待播放内容以及播放时间；对待播放内容进行人声提取，并根据提取结果获得对应的文字信息；对文字信息进行语义识别，判断文字信息是否为预设消音信息；若是，则根据文字信息和播放时间生成对应的消音指令，并将消音指令发送至终端设备，以使终端设备根据消音指令对待播放音频文件进行消音后播放。由于本发明可对待直播音频文件进行语义识别，并根据识别到的预设消音信息生成消音指令，以使终端设备在对待直播音频文件进行消音后播放，可自动消除不良音频，提升用户观看体验。

视频合成方法、装置、设备及存储介质-202010611693.3
发明人：董霙;刘炳楠 -专利权人：腾讯科技（深圳）有限公司
申请日： 2020-06-30 - 公布日： 2023-08-18 - 主分类号： H04N21/233
摘要：本申请公开了一种视频合成方法、装置、设备及存储介质，涉及视频处理领域。该方法包括：获取文本；获取文本对应的音频，对音频进行处理，得到音频中的音素序列对应的n种口型标识和各个口型标识的口型时间点信息，n为正整数；获取标准化口型序列帧和含有主播形象的视频，标准化口型序列帧包括n种口型标识对应的口型视频帧；按照各个口型标识的口型时间点信息，将n种口型标识对应的口型视频帧与含有主播形象的视频进行合成处理，得到主播视频。无需预先训练用于合成视频的机器学习模型，只需提供文本即可实现合成主播视频，降低了视频的合成难度，同时提高了视频的合成效率。

音视频同步方法、装置、计算设备及存储介质-202210703399.4
发明人：李立锋;谢韬 -专利权人：咪咕文化科技有限公司;中国移动通信集团有限公司
申请日： 2022-06-21 - 公布日： 2023-08-15 - 主分类号： H04N21/233
摘要：本发明公开了一种音视频同步方法、装置、计算设备及存储介质。用户终端获取用户终端视频在同步校验时间的第一进度以及从同步校验时间对应的用户终端音频切片中提取音频特征码；服务端在服务端音频中查找与音频特征码匹配的第二进度，并计算第一进度与第二进度的第一进度差；用户终端计算用户终端音频在同步校验时间的第三进度与第二进度的第二进度差，并根据第一进度差以及第二进度差确定用户终端音频与视频的播放时差，以及利用该播放时差进行用户终端音频与用户终端视频的同步处理。本方案并未对音频及视频进行侵入性的信息写入，由此保障音频及视频的源数据的安全；本方案在视频介质发生改变之后，无需重新对视频或音频进行处理。

一种房间违规审核方法、装置、设备、存储介质及产品-202310418081.6
发明人：常恒毅;马东鹏;项伟 -专利权人：百果园技术（新加坡）有限公司
申请日： 2023-04-18 - 公布日： 2023-08-11 - 主分类号： H04N21/233
摘要：本申请实施例提供了一种房间违规审核方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过根据黑名单列表确定待审核房间中的在线黑名单用户，根据在线黑名单用户从待审核房间中确定嫌疑房间，并获取嫌疑房间的房间音频信息，从各个嫌疑房间的房间音频信息中确定嫌疑音频，并基于嫌疑音频对嫌疑房间进行违规审核，通过在线黑名单用户对待审核房间进行初步筛选确定嫌疑房间，并根据嫌疑房间的房间音频信息进行二次筛选，确定嫌疑音频，可基于嫌疑音频准确对嫌疑房间进行违规审核，从直播房间的语音信息中确定存在违规可能的嫌疑音频，有效提高对房间的审核准确度，提高房间审核效果。

音频传输方法、装置、终端、存储介质及程序产品-202310404715.2
发明人：梁衍鹏;何思远;谢导 -专利权人：广州繁星互娱信息科技有限公司;广州世音联软件科技有限公司
申请日： 2023-04-14 - 公布日： 2023-08-11 - 主分类号： H04N21/233
摘要：本申请实施例公开了一种音频传输方法、装置、终端、存储介质及程序产品，属于音频技术领域，该方法包括：采集至少两路音频流，其中，不同音频流对应不同音轨，且不同音频流具有不同音频内容；对所述至少两路音频流进行音频编码，得到编码音频流，其中，不同音频流对应所述编码音频流中的不同声道；向服务器传输所述编码音频流，以便所述服务器将所述编码音频流传输至拉流端。采用本申请实施例所提供的方案，能够在播放端实现仅播放多路音轨中的一路音轨，并能够基于用户需求进行播放音轨的切换。

一种基于WebAssembly的在线音视频处理方法-202310495991.4
发明人：陈宇明 -专利权人：康键信息技术（深圳）有限公司
申请日： 2023-05-04 - 公布日： 2023-08-08 - 主分类号： H04N21/233
摘要：本申请涉及音视频处理技术领域及数字医疗领域，更为具体来说，本申请涉及一种基于WebAssembly的在线音视频处理方法。所述方法包括：获取在线音视频处理请求；通过Worker线程拦截与所述在线音视频处理请求对应的wasm文件；解析所述wasm文件，得到目标对象；基于所述目标对象获取WebAssembly实例；接收待处理音视频，利用所述WebAssembly实例对所述待处理音视频进行目标处理。本申请不需要服务端的支持，能够减少音视频传输的带宽成本，降低网络不稳定时造成的时间成本。本申请有效利用用户的计算资源，利用常见的硬件能力，WebAssembly代码在不同平台上能够以接近本地速度运行。另外，本申请所述方法还可以离线运行，在网络不稳定的情况下也能瞬间加载并运行。

数据处理方法、装置、头戴显示设备及介质-202310420902.X
发明人：杨明明;邱绪东;李昱锋;李佳明 -专利权人：歌尔股份有限公司
申请日： 2023-04-14 - 公布日： 2023-08-08 - 主分类号： H04N21/233
摘要：本公开提供了一种数据处理方法、装置、头戴显示设备及介质，该方法包括：在第一模块通过串流连接向第二模块传输数据帧的情况下，获取所述数据帧的时延参数信息；其中，所述时延参数信息至少包括所述数据帧对应的编码时长、传输时长、解码时长中任意一项或者多项；根据所述时延参数信息，获得串流性能分析结果。

媒体内容发布方法、装置、设备及存储介质-202310464604.0
发明人：赵嘉仪;孙辉;宋青;黄磊 -专利权人：北京字跳网络技术有限公司
申请日： 2023-04-26 - 公布日： 2023-07-28 - 主分类号： H04N21/233
摘要：本公开实施例公开了媒体内容发布方法、装置、设备及存储介质，涉及计算机技术领域。该方法包括：响应于针对媒体内容获取页面的拍摄操作，获取目标拍摄模式下拍摄的目标图像，目标图像包括封面图像、以及拍摄操作的触发时刻之前的第一时刻至触发时刻之后的第二时刻之间的录制视频，确定目标图像对应的目标音频，根据目标图像和目标音频生成目标媒体内容，响应于目标媒体内容的发布操作，将目标媒体内容作为应用程序中的媒体作品进行发布。通过采用上述技术方案，可以实现根据目标图像和音频生成用于发布的媒体内容并进行发布，丰富媒体内容的创作方式，以及丰富媒体作品中的内容形式，有利于增强用户之间基于媒体作品的互动，提升用户体验。

交互方法、装置、设备及存储介质-202210049730.5
发明人：万瑞卿;胡晓阳 -专利权人：北京达佳互联信息技术有限公司
申请日： 2022-01-17 - 公布日： 2023-07-25 - 主分类号： H04N21/233
摘要：本公开关于一种交互方法、装置、设备及存储介质，涉及互联网技术领域。该方法包括：获取媒体资源，并显示播放界面，播放界面用于播放媒体资源；媒体资源中包括用于指示目标交互元素的目标语音指令；在检测到播放目标语音指令的情况下，显示目标语音指令对应的目标提示信息，目标提示信息用于提示对象账户操作播放界面上的目标交互元素。

一种基于文件切片的视频AI智能检测方法及系统-202310510849.2
发明人：方正;朱皓峰;苏勇;方林;刘琛良;欧阳霁;龚如林;臧干军;王伟;邢圆庆 -专利权人：湖南芒果无际科技有限公司
申请日： 2023-05-08 - 公布日： 2023-07-25 - 主分类号： H04N21/233
摘要：本发明公开了一种基于文件切片的视频AI智能检测方法及系统，本方法通过接收直播节目流；将直播节目流转换为视音频文件；对视音频文件延时预设时间后，转换为延时后节目流，并播送延时后节目流；对视音频文件进行切片化拆分，获得多个视音频切片；分别对每个视音频切片进行合规性检测，获得检测结果；若检测结果为不合规，则生成终止指令，并根据终止指令停止播送延时后节目流。本发明能在保证播放质量的情况下，减少违规内容漏报的情况。

用于从直播视频流剪辑视频的方法、装置、设备和存储介质-202011591386.X
发明人：李晨曦;庞磊;王珊;聂卫国 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2020-12-29 - 公布日： 2023-07-25 - 主分类号： H04N21/233
摘要：本公开公开一种用于从直播视频流剪辑视频的方法、装置、设备和存储介质，涉及人工智能领域。用于从直播视频流剪辑视频的方法包括：从视频流获取第一预定时间长度的多个视频片段；确定多个视频片段是否属于预定分类；以及响应于确定多个视频片段中的一个第一视频片段属于预定分类，从第一视频片段中提取第二预定时间长度的视频子片段，作为视频剪辑片段至少一部分，其中第二预定时间长度小于第一预定时间长度。本公开的方案实现了对于例如直播视频流的类别识别以及基于类别的自动视频剪辑。

录制音视频的在线播放方法、装置、设备和介质-202310097409.9
发明人：徐素;李珂 -专利权人：深圳市海洋王照明工程有限公司;海洋王照明科技股份有限公司;海洋王（东莞）照明科技有限公司;深圳市海洋王绿色照明技术有限公司;深圳市海洋王电网照明技术有限公司;深圳市海洋王船舶场馆照明技术有限公司;深圳市海洋王铁路照明技术有限公司;深圳市海洋王石油照明技术有限公司;深圳市海洋王冶金照明技术有限公司;深圳市海洋王公消照明技术有限公司;深圳市海洋王石化照明技术有限公司
申请日： 2023-01-15 - 公布日： 2023-07-18 - 主分类号： H04N21/233
摘要：本发明公开了一种录制音视频的在线播放方法、装置、设备和介质，包括：在接收到录制终端上传的录制音视频后，服务器端先将录制音视频拆分为录制音频文件和录制视频文件，以便分别进行转码。再通过转码器对录制音频文件进行第一转码，以转码得到音频流文件；并通过转码器对音频流文件和录制视频文件进行第二转码，以合并转码得到视频流文件，该视频流文件中的音频部分和视频部分均是属于可在线播放的格式。最后通过通信插件将所述视频流文件发送至客户端，以使得客户端基于转换插件将视频流文件转换为所述客户端预设的视频格式后在线播放，这样客户端用户就可以在线查看自己的录制终端的录制音视频。

音视频在线播放方法、系统和计算机可读存储介质-202310091835.1
发明人：徐素;李珂 -专利权人：深圳市海洋王照明工程有限公司;海洋王照明科技股份有限公司;海洋王（东莞）照明科技有限公司;深圳市海洋王绿色照明技术有限公司;深圳市海洋王电网照明技术有限公司;深圳市海洋王船舶场馆照明技术有限公司;深圳市海洋王铁路照明技术有限公司;深圳市海洋王石油照明技术有限公司;深圳市海洋王冶金照明技术有限公司;深圳市海洋王公消照明技术有限公司;深圳市海洋王石化照明技术有限公司
申请日： 2023-01-15 - 公布日： 2023-07-18 - 主分类号： H04N21/233
摘要：本申请实施例公开了一种音视频在线播放方法、音视频在线播放系统和计算机可读存储介质。其中，应用于后端的方法，包括如下步骤：获取录制视频文件和录制音频文件；与前端连接，并确定前端能够播放音视频文件的可在线播放格式；将录制视频文件和录制音频文件合并为音视频文件，音视频文件的格式与可在线播放格式对应；将音视频文件发送至前端，以使前端在线播放音视频文件。因此，本申请能够先行确定前端所能够支持在线播放的可在线播放格式，再在后端实现音频和视频合并为对应格式的音视频文件以发送至前端播放，确保用户能够实时在线播放、查看自己拍摄的视频或其他设备采集的视频。

一种音视频调度方法及系统-202310249976.1
发明人：张美炎;陆继松 -专利权人：深圳市宏辉智通科技有限公司
申请日： 2023-03-03 - 公布日： 2023-07-14 - 主分类号： H04N21/233
摘要：本申请涉及一种音视频调度方法及系统，方法包括与终端建立数据通讯关系；收集终端采集的视频流和音频流并在时间长度上对视频流和音频流进行分割；对音频流段进行压缩处理；对视频流段中的图像进行灰度处理，得到基准图像并对基准图像进行区域划分，得到多个子基准图像；对子基准图像进行网格划分，得到多个子基准图像单元，子基准图像单元的面积小于等于设定单位面积；对子基准图像单元进行压缩以及将经过压缩处理的视频流段和音频流段发送至终端。本申请公开的音视频调度方法及系统，通过对音频与视频进行压缩算法优化的处理方式来兼顾压缩率和压缩体积，能够在约束条件不变的情况下提高音频与视频的传输效率，用以满足即时通讯的使用需求。

发送装置和方法、媒体处理装置和方法以及接收装置-202110497015.3
发明人：塚越郁夫 -专利权人：索尼公司
申请日： 2016-05-10 - 公布日： 2023-07-14 - 主分类号： H04N21/233
摘要：本公开涉及发送装置和方法、媒体处理装置和方法以及接收装置。本发明使得能够优选地在接收侧执行一系列媒体访问控制。本发明发送包括媒体流的预定格式的容器。与一系列媒体访问控制相关联的预定数量的媒体访问信息组连续地插入媒体流的层或容器的层中。例如，媒体访问信息包括用于区分其他媒体访问信息的标识信息和用于与其他媒体访问信息相关联的标识信息。

一种视频合成方法、装置以及可读存储介质-202111634313.9
发明人：程瑞;张金超 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-12-29 - 公布日： 2023-07-11 - 主分类号： H04N21/233
摘要：本申请公开了一种视频合成方法、装置以及可读存储介质，该方法包括：在获取到原始文本时，获取原始文本中的待处理文本；获取待处理文本的文本语义向量，在候选图片对应的候选图片向量中查找与文本语义向量具有相同语义的候选图片向量，基于查找到的候选图片向量所对应的候选图片确定待处理文本对应的文本映射图片；在获取到与待处理文本相关联的语音转换参数时，将待处理文本转换为与语音转换参数相符的文本映射语音；基于待处理文本、文本映射图片和文本映射语音，生成用于合成目标视频的音频帧和视频帧，将生成的音频帧和视频帧进行视频合成处理，得到原始文本对应的目标视频。采用本申请，可以在文本转视频的过程中，丰富文本的视听展示效果。

音频处理方法、电子设备以及计算机可读存储介质-202111668070.0
发明人：廖涛 -专利权人：华为云计算技术有限公司
申请日： 2021-12-31 - 公布日： 2023-07-11 - 主分类号： H04N21/233
摘要：本公开提供了一种音频处理方法、电子设备以及计算机可读存储介质。该音频处理方法包括接收被配置在第一语言频道上的参会设备的至少一个音频流以及与第一语言频道相关联的翻译设备的音频流；基于该至少一个音频流，确定第一语言频道是否处于活跃状态；以及如果第一语言频道被确定为处于活跃状态，通过排除翻译设备的音频流进行混音。利用本公开的实施例，可以去除在会议中由翻译设备导致的重复语音。

音频降噪方法、装置、计算机可读介质和电子设备-202010176391.8
发明人：史俊杰 -专利权人：北京字节跳动网络技术有限公司
申请日： 2020-03-13 - 公布日： 2023-07-07 - 主分类号： H04N21/233
摘要：本公开涉及一种音频降噪方法、装置、计算机可读介质和电子设备。该方法包括：对待降噪媒体文件进行内容解析，获得至少一个场景标签以及所述场景标签对应的时段信息；至少根据所述时段信息，将所述待降噪媒体文件划分出待降噪的第一媒体片段；根据所述第一媒体片段对应的所述场景标签，确定所述第一媒体片段对应的目标降噪信息；根据所述目标降噪信息对所述第一媒体片段进行音频降噪处理。如此，可以对待降噪媒体文件进行更细粒度的音频降噪处理，使其与具体媒体片段内容对应的场景相适应。这样，可以满足用户在不同场景下的感官需求，提升了用户体验。

一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法-202310430464.5
发明人：樊金礽;王增林;管权;陶涛 -专利权人：南京数脉动力信息技术有限公司
申请日： 2023-04-21 - 公布日： 2023-07-07 - 主分类号： H04N21/233
摘要：本发明公开了一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法，涉及图像通信技术领域，从确认的媒体视频文件中提取编码参数，并对输入的媒体文件进行音、视频流分离和解码，提取出原始音频流和原始视频流，将原始视频流导入视频隐私值计算策略中进行视频隐私值检测，将原始音频流导入音频隐私值计算策略中进行音频隐私值检测，将视频隐私值和音频隐私值分别与设定的对应的隐私阈值对比，判断是否向发布者反馈隐私信息，避免发布视频导致发布人员的隐私泄露。

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N21-00 可选的内容分发，例如交互式电视，VOD〔视频点播〕
H04N21-20 .专门适用于内容分发的专用服务器，例如：VOD服务器；其操作
H04N21-40 .专门适用于接收内容或者与内容交互的客户端设备，如STB[机顶盒]；相关操作
H04N21-60 .用于在服务器和客户端之间或者在远程客户端之间的视频分配的网络结构或者处理
H04N21-80 .通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身
H04N21-81 ..其单媒体部件

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于VOLTE网络的视频流文件压缩和高效传输系统和方法有效

专利文献下载