[发明专利]用于创建伴随视觉影像的音频轨的方法有效

专利信息
申请号: 201880010311.2 申请日: 2018-02-05
公开(公告)号: CN110249387B 公开(公告)日: 2021-06-08
发明(设计)人: 马克·D·伍德三世;彼得·D·伍德 申请(专利权)人: 柯达阿拉里斯股份有限公司
主分类号: G11B27/031 分类号: G11B27/031;G11B27/10;G11B27/28
代理公司: 成都超凡明远知识产权代理有限公司 51258 代理人: 魏彦;洪玉姬
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 公开了创建用以伴随多媒体对象序列的一个或多个音频对象的方法。根据一个实施方式,该方法包括使用处理器来分析多媒体对象和对应的记录元数据以生成衍生元数据。该方法还接收对被配置为分析所记录元数据和衍生元数据的一个或多个分析工具的选择。接下来,识别多媒体对象的选定子集并且对其进行排序,该多媒体对象的选定子集最终将与一个或多个音频对象耦合并且由该一个或多个音频对象伴随。最后,本发明的实施方式生成用以伴随多媒体对象的选定子集的音频轨。
搜索关键词: 用于 创建 伴随 视觉 影像 音频 方法
【主权项】:
1.一种创建用以伴随多媒体对象序列的一个或多个音频对象的方法,包括:(a)使用处理器分析所述多媒体对象和对应的所记录元数据,以生成衍生元数据;(b)应用选定的方法来分析所述所记录元数据和所述衍生元数据;(c)识别所述多媒体对象的选定子集并对所述多媒体对象的选定子集进行排序;以及(d)生成用以伴随所述多媒体对象的选定子集的音频轨。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柯达阿拉里斯股份有限公司,未经柯达阿拉里斯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201880010311.2/,转载请声明来源钻瓜专利网。

同类专利
  • 手语生成方法和系统-202110935678.9
  • 赵洲;程诗卓;沈子栋;黄文璨;潘文雯 - 浙江大学
  • 2021-08-16 - 2023-08-18 - G11B27/031
  • 本发明公开了一种手语生成方法和系统,属于手语生成领域。获取手语注解序列与目标手势姿态序列;将手续注解序列通过一个非自回归模型生成预测的手势姿态序列;在非自回归模型中,手语注解序列经过嵌入及位置编码后,由第一Transformer网络转换为注解同步特征序列,由持续时间预测器预测与每个注解对齐的手势姿态序列的对数持续时间,通过长度调节器将注解同步特征序列扩展到姿态同步特征序列,然后依次由另一个Transformer网络和时空图卷积姿态生成器变换为手势姿态序列;根据预测得到的手势姿态序列合成手语视频;在对非自回归模型进行训练时,引入一个外部对齐器以获得每个注解的目标对数持续时间。
  • 用于音频和视频合成的文本驱动编辑器-202180074457.5
  • 沙米尔·阿里拜;罗德里克·尼尔·霍奇森 - 元平台技术有限公司
  • 2021-10-27 - 2023-07-18 - G11B27/031
  • 所公开的技术是一种用于从口语单词或声音片段中合成和编辑视频节目的系统和计算机实现的方法。所公开的技术导入源音频/视频短片和多种格式中的任何一种格式。口语音频被转写成可搜索的文本。文本转写本通过时间码标记与视频轨道同步。每个口语单词与一时间码标记相对应,该时间码标记继而与一个或多个视频帧相对应。通过使用单词处理操作和文本编辑功能,用户通过选择对应的所转写的文本段来选择视频片段。通过选择文本并排列该文本来合成对应的视频节目。所选择的视频片段由用户以任意选择的顺序在时间线显示上合成。视频片段的序列可以根据需要被重新排序和编辑,以产生用于导出的最终视频节目。
  • 对话小说的音频生成方法、电子设备及存储介质-202111424100.3
  • 李铭瀚;刘龙 - 掌阅科技股份有限公司
  • 2021-11-26 - 2023-07-18 - G11B27/031
  • 本公开涉及一种对话小说的音频生成方法、电子设备及存储介质。其中,对话小说的音频生成方法包括:获取对话小说对应的多个音频文件,对话小说包括多个角色文本,每个音频文件对应一个角色文本;根据每个音频文件所属小说角色,确定音频文件对应的目标声像位置;针对每个音频文件,将音频文件由初始声像位置调整至目标声像位置,得到调整后的音频文件。根据本公开实施例,能够提高用户的阅读体验。
  • 音频资源的分发方法及相关产品-202310265913.5
  • 顾红清;王丹丹 - 网易有道信息技术(杭州)有限公司
  • 2023-03-14 - 2023-06-23 - G11B27/031
  • 本发明的实施方式提供了一种音频资源的分发方法及相关产品。其中,所述方法包括:响应于对所述音频资源的分发需求,确定所述音频资源的分发渠道及附加资源;获取关于所述音频资源的结构信息;根据所述音频资源的结构信息将所述附加资源添加至所述音频资源中,以得到待分发资源;以及将所述待分发资源通过所述分发渠道进行分发。通过本发明的技术方案,可以使音频资源结构化,并利用音频资源的结构信息来支持在音频资源中任意位置处添加附加资源,而无需重新编辑源文件。由此,可大大缩减音频资源分发周期,有效提高分发效率。
  • 一种图书生成方法、图书生成设备及存储介质-202010670728.0
  • 王鹏 - TCL科技集团股份有限公司
  • 2020-07-13 - 2023-05-16 - G11B27/031
  • 本发明提出了一种图书生成方法,图书生成设备及存储介质,通过目标文件中含有的文字信息确定其文字信息中含有的故事片段集和角色信息集;根据所述角色信息集中所述角色特征的描述文字信息和所述故事片段集中含有的所述故事片段,确定所述故事片段中与所述角色对应的情绪标签集;其中,所述情绪标签集包括各个角色在各个故事片段中的情绪标签;根据故事片段集、角色信息集和所述情绪标签集得到与所述目标文件对应的图书文件。通过从现有故事文件中提取故事片段和角色信息,并将故事片段和角色信息相融合生成图书作品,本发明利用语言处理技术和图像生成技术实现将现有故事文件转化成图书文件,克服了含有绘图的图书文件匮乏的问题。
  • 内容编辑方法、装置、存储介质及电子设备-202111337742.X
  • 王健强;陈哲 - 北京有竹居网络技术有限公司
  • 2021-11-09 - 2023-05-12 - G11B27/031
  • 本公开涉及一种内容编辑方法、装置、存储介质及电子设备,可以对录播课程中的同一知识点配置多个版本的课程讲解内容,从而对不同的学生推送对应版本的课程讲解内容,提升录播课程的教学效果。该方法包括:显示内容编辑界面,该内容编辑界面用于供用户以思维导图的形式对课程内容进行编辑;基于内容编辑界面显示的讲解容器组件,获取用户输入的课程内容信息,并基于课程内容信息在内容编辑界面显示多个版本的课程讲解路径;获取用户对每一版本课程讲解路径配置的知识标签,以便课程推送模型基于知识标签和多版本的课程讲解路径进行个性化课程推送。
  • 一种音频剪辑方法、电子设备及存储介质-202011630797.5
  • 马丹;周丹 - 咪咕文化科技有限公司;中国移动通信集团有限公司
  • 2020-12-31 - 2023-04-28 - G11B27/031
  • 本发明实施例提供一种音频剪辑方法、电子设备及存储介质,涉及音频处理技术领域,以解决人工剪辑成本大的问题。该方法包括:获取待处理音频;获取所述音频数据目标时间段中第m个第一时间单元的第一音频数据,所述目标时间段的第m个第一时间单元的第一文本数据,以及所述目标时间段中第n个第二时间单元的第二音频数据;根据所述第一音频数据、所述第一文本数据以及所述第二音频数据,获得目标得分;若所述目标得分大于预设阈值,则根据所述目标时间段对应的音频数据和文本数据,获得目标音频。整个过程无需人工参与,降低了人工成本,提高了剪辑效率。
  • 数据匹配方法、装置、介质及电子设备-202110968950.3
  • 高永强 - 北京字节跳动网络技术有限公司
  • 2021-08-23 - 2023-03-21 - G11B27/031
  • 本公开涉及一种数据匹配方法、装置、介质及电子设备。方法包括:获取第一多媒体数据的第一特征序列和第二多媒体数据的第二特征序列;若两个序列长度不相等,则根据该两个序列,确定帧匹配距离矩阵;根据帧匹配距离矩阵中的元素,确定匹配路径的起点和终点;根据起点、终点及帧匹配距离矩阵,确定最佳匹配路径;基于最佳匹配路径,将第一多媒体数据与第二多媒体数据进行匹配。这样,可实现第一多媒体数据和第二多媒体数据的自动匹配,并保证最佳匹配路径的准确度,提升第一多媒体数据和第二多媒体数据的匹配度。由此,本公开提供的数据匹配方法,可将视频画面特征和音频节奏特征有效结合,提高用户的观看沉浸感,有身临其境的感受。
  • 一种歌曲串接过渡方法、终端及存储介质-202211399331.8
  • 江涛;林伟鹏;祖可峰;林鎏娟 - 福建星网视易信息系统有限公司
  • 2022-11-09 - 2023-03-07 - G11B27/031
  • 本发明提供了一种歌曲串接过渡方法、终端及存储介质,识别曲库中歌曲副歌的起止时间,制作对应歌曲的标识文件,所述标识文件包括所述起止时间;获取两首以上待串接歌曲,及所述待串接歌曲的标识文件;根据所述待串接歌曲的标识文件依次播放所述待串接歌曲的歌曲副歌,并在相邻两首所述待串接歌曲之间播放过渡动画,同时,对相邻两首所述待串接歌曲切换过程进行音频过渡处理;本发明能够在歌曲文件完整的情况下完成串接,降低了歌曲串接自定义的上手难度,同时,通过在相邻两首待串接歌曲的切换过程中设置转场动画以及音频过渡处理进行转场,在实现过渡的同时中和了两段旋律直接连接的突兀感,综合实现了易操作的歌曲串接和自然过渡。
  • 计算用于编辑HDR内容的动态元数据-202180040121.7
  • R·阿特金斯 - 杜比实验室特许公司
  • 2021-06-02 - 2023-02-03 - G11B27/031
  • 对视频内容进行编辑的系统和方法包括:接收输入视频数据;将输入视频数据转换成预定格式;为经转换的视频数据的帧生成多个初始元数据值,多个初始元数据值包括:第一元数据值,第一元数据值与并非根据包括帧的内容计算的第一固定值相对应;第二元数据值,第二元数据值与帧的平均光亮度值相对应;以及第三元数据值,第三元数据值与并非根据内容计算的第二固定值相对应,其中,第一元数据值、第二元数据值和第三元数据值包括由解码器用于在显示器上呈现经解码图像的信息。
  • 数据流中无中断且连续切换工作流或更新工作流的方法-202280003940.9
  • 伊拉吉·索达加 - 腾讯美国有限责任公司
  • 2022-03-28 - 2023-01-31 - G11B27/031
  • 提供了用于管理基于网络的媒体处理(NBMP)工作流的方法和系统。方法包括:获取第一基于网络的媒体处理(NBMP)工作流描述文档(WDD);创建对应于第一NBMP WDD的第一工作流;根据第一工作流来管理至少一个媒体处理实体(MPE);获取对第一NBMP WDD的更新,该更新包括第二NBMP WDD,其中,第二NBMP WDD包括连续性标志,该连续性标志指示对应于第二NBMP WDD的第二工作流是第一工作流的延续;基于第二NBMP WDD创建第二工作流;以及响应于创建了第二工作流,根据第二工作流来管理至少一个MPE。
  • 用于在回放音频数据期间提高对话可理解性的方法和设备-202180035484.1
  • C·辛德勒;M·施密特 - 杜比国际公司
  • 2021-05-12 - 2023-01-31 - G11B27/031
  • 本文描述了一种用于在回放设备上回放音频数据期间提高对话可理解性的方法,其中,所述音频数据包括对话音频数据、以及音乐和效果音频数据中的至少一个,所述方法包括以下步骤:基于回放音量值确定音量混合比;基于所述音量混合比将所述对话音频数据与所述音乐和效果音频数据中的至少一个进行混合;以及输出混合后的音频数据以进行回放。进一步描述了一种相应的回放设备和一种相应的计算机程序产品。
  • 使用节拍匹配检测的自动视频编辑-201980087781.3
  • 克里斯多夫·沃谢 - 索可立谱公司
  • 2019-11-04 - 2023-01-13 - G11B27/031
  • 本公开涉及用于自动编辑多媒体内容的技术,具体地说,涉及制作使得音乐过渡与视觉过渡和效果匹配的专家质量的多媒体作品。在一些方面中,本公开技术的方法包括用于接收图像内容项目、接收至少包括第一剪辑时间和第二剪辑时间的剪辑矢量和自动混合所述图像内容项目以产生经过编辑的多媒体序列的步骤,其中,所述经过编辑的多媒体序列的起始时间对应于所述第一剪辑时间,所述经过编辑的多媒体序列的终止时间对应于所述第二剪辑时间。还提供系统和机器可读介质。
  • 音乐与健身指导的整合-202180033113.X
  • M·伊克巴尔;M·温特 - MYX健身有限责任公司
  • 2021-05-19 - 2022-12-30 - G11B27/031
  • 实施例结合许可音乐提供健身指导程序,例如视频和/或音频。一个此类实施例首先接收包含一个或多个元数据标签的音乐播放列表。所述元数据标签对应于健身指导程序的时间范围。进而基于所述一个或多个元数据标签标识所述健身指导程序的每个时间范围的音乐站点。接着发送来自每个标识的音乐站点的随机化音乐以在所述健身指导程序的所述时间范围中的每一者期间播放。
  • 用于处理音频信号的方法和非暂时性计算机可读介质-201980051455.7
  • 亚伊尔·莫夫肖维茨-阿蒂亚斯;艾尔德·埃德温·茨维·埃班 - 谷歌有限责任公司
  • 2019-06-20 - 2022-12-23 - G11B27/031
  • 由于便携式记录设备的局限性,由蜂窝电话或其他便携式记录设备记录的音频(例如,作为演奏或其他事件的视频记录的一部分记录的音频)通常具有低质量。在同一时段期间并且在同一位置附近进行的多个音频记录可以被组合以生成事件的改进质量的音频记录。音频记录可由选择音频记录并执行组合的服务器访问。为了保护使用其音频的人的隐私,多于最小数目的记录可以被组合和/或任何记录的不多于阈值量可以被使用来生成组合记录。此外,提供的‘干净’记录可能包括请求此类‘干净’记录的用户或设备提供的音频的多于阈值量。
  • 一种二维方形约束的编译码方法及装置-201980096304.3
  • 刘继斌;魏明 - 武汉烽火技术服务有限公司
  • 2019-09-11 - 2022-12-13 - G11B27/031
  • 一种二维方形约束的编译码方法及装置,涉及数据存储和数据通信领域。编码方法包括:缓存一维数据流,将一维数据流划分为若干组一维2比特数据;按照所述编码表,编码器逐一将每组2比特数据编码成3×2的二维码字,之后将所有二维码字按照指定次序级联成二维约束阵列;译码方法包括:译码器读取二维约束阵列,并划分为若干个3×2的二维码字,通过译码表,逐一将每一个二维码字译码为一维2比特数据,然后将产生的一维2比特数据依次组装为一维数据流并输出。本发明所述的二维方形约束是指在数据“0”和“1”组成的二进制数据阵列中,沿着水平方向、垂直方向、东北方向和东南方向四个方向上,数据“1”两两之间不能直接相邻。
  • 视频编辑方法、视频编辑装置、终端和可读存储介质-201911298854.1
  • 陈佳雨 - OPPO广东移动通信有限公司
  • 2019-12-17 - 2022-12-09 - G11B27/031
  • 本申请提供了一种视频编辑方法、视频编辑装置、终端和非易失性计算机可读存储介质。视频编辑方法包括在初始视频中标记一个或多个视频片段;根据预设音乐片段的相邻两个节奏点之间的间隔时长,从一个或多个视频片段中确定待剪辑视频片段,待剪辑视频片段的时长大于或者等于所述间隔时长;及剪辑待剪辑视频片段得到已剪辑视频片段,以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。终端可根据背景音乐的相邻节奏点之间的间隔时长选取匹配的视频片段,使得每个视频片段能够和节奏点配合,被剪辑掉的视频内容较少,保证了每个视频片段的完整性。且无需人为进行视频片段和背景音乐的节奏点的匹配,节省了用户的时间和精力,剪辑效率也较高。
  • 微视频系统、格式和生成方法-201880044253.5
  • W.洪;R.R.庄;S.萨法尔;M.雷恩 - 谷歌有限责任公司
  • 2018-07-12 - 2022-11-15 - G11B27/031
  • 本公开提供了根据新颖的微视频图像格式使用和/或生成图像文件的系统和方法。例如,微视频可以是包含静止图像和简短视频两者的文件。微视频可以包括多个轨道,诸如,例如单独的视频轨道、音频轨道和/或一个或多个元数据轨道。作为一个示例轨道,微视频可以包括运动数据轨道,其存储可用于(例如,在文件运行时)稳定视频帧的运动数据。图像捕获设备中包括的微视频生成系统可以在图像捕获设备捕获微视频时即时地确定对视频的修剪。
  • 视频合成方法、装置、电子设备及存储介质-202010595765.X
  • 苏达;张韵叠 - 华为技术有限公司
  • 2020-06-24 - 2022-11-11 - G11B27/031
  • 本发明实施例提供一种视频合成方法、装置、电子设备及存储介质,视频合成方法包括:获取用户给定的素材、视频合成策略选择信息、视频模板及视频模板的配置信息,视频模板包括至少一个片段,视频模板的配置信息包括每个片段的场景匹配信息;对用户给定的素材进行场景分析,得到素材中每个素材的场景特征信息;根据视频合成策略选择信息确定用户的视频合成策略,如果视频合成策略为定长合成策略,则根据素材中每个素材的场景特征信息和视频模板中每个片段的场景匹配信息,将每个素材与视频模板中每个片段进行场景匹配,选取每个素材中场景匹配的内容填入视频模板对应的片段中,以合成视频。上述方法不依赖于用户手动编辑且兼顾灵活性。
  • 音频转写文件生成方法、相关设备及可读存储介质-202010744772.1
  • 田志强;曹亚;苏文畅;王玮 - 安徽听见科技有限公司
  • 2020-07-29 - 2022-09-23 - G11B27/031
  • 本申请公开了一种音频转写文件生成方法、相关设备及可读存储介质。基于上述方案,可以将音频数据,以及,与该音频数据对应的转写结果数据,存储至一个音频转写文件中,该音频转写文件中包括至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各文件单元中的音频数据片段组成该音频数据;各文件单元中的转写结果数据片段组成该转写结果数据。当用户需要时,将该音频转写文件提供给用户,用户对该音频转写文件进行解析即可得到音频数据,以及,与音频数据对应的转写结果数据。
  • 消息弹窗语音编辑方法、装置、计算机设备及存储介质-201811512414.7
  • 黄燕霞;杨晟;胡燕 - 平安科技(深圳)有限公司
  • 2018-12-11 - 2022-09-20 - G11B27/031
  • 本发明公开一种消息弹窗语音编辑方法、装置、计算机设备及存储介质,包括:获取通过消息弹窗上的语音采集通道采集的语音信息;识别所述语音信息是否符合预设规则;当符合预设规则,弹出与所述预设规则相映射的编辑框,编辑框用于对所述语音信息进行手动编辑。本申请通过多种方式进行语音识别,对语音进行编辑,编辑的方式有很多种,通过语意识别,自动弹出可能用到的编辑框,方便用户进行修改编辑,操作过程自动化程度高,且编辑的方式有很多种,不仅可以删除语音中断的位置,对重复的语句进行删除,对不文明用语进行修改以及屏蔽,还可以通过识别音色和音量进行自动加工处理,使语音聊天更人性化,智能化,趣味性也更强,提高用户体验。
  • 用于共享内容的系统和方法-202080010554.3
  • 楚库埃梅卡·奥卡福尔;金俊植 - 元平台公司
  • 2020-01-21 - 2022-09-20 - G11B27/031
  • 系统、方法和非暂时性计算机可读介质可以提供用于将所选择的音乐内容与要通过社交网络系统共享的视觉内容相关联的界面。可以在界面中提供用于导航到所选择的音乐内容的不同部分的主回放搓擦条。可以在界面中提供精确回放搓擦条,该精确回放搓擦条用于比主回放搓擦条更精确地识别要与被共享的视觉内容相关联的所选择的音乐内容的一部分。
  • 视频拆条方法和装置-202010315890.0
  • 陈大友;金鑫;涂丹丹 - 华为云计算技术有限公司
  • 2020-04-21 - 2022-09-16 - G11B27/031
  • 本申请提供了一种视频拆条方法和装置,根据多个模态的信息来决定视频拆分点,从而提高视频拆条的准确性。第一方面,提供了一种视频拆条方法,该方法包括:根据视频的镜头切换点和视频的语音停顿点获取视频的多个细粒度拆条片段;提取多个细粒度拆条片段中每个细粒度拆条片段的特征,特征包括图片特征、音频特征;根据第一神经网络模型对多个细粒度拆条片段的特征进行处理,以得到视频的拆分点预测序列,拆分点预测序列包括多个拆分点和多个拆分点对应的概率。
  • 一种双耳节拍低频音波脉冲的制作方法-202010693852.9
  • 侯鹏伟;宋焕敏;曹全全;董颖帅;云丙涛 - 河北财文科技有限公司
  • 2020-07-17 - 2022-09-09 - G11B27/031
  • 本发明提供了一种双耳节拍低频音波脉冲的制作方法,包括以下步骤:S1:通过脑电地形图仪确定对于大脑脑电波干预较有效的三个频率分别为a、c、e及音波差值x;S2:基于双耳节拍原理制作低频音波;S3:根据音波差值x,制作正弦值大于音波a和音波b的音波c和音波d;S4:将ab‑xHz、cd‑xHz和ef‑xHz三个合成音波按1:1:4时长比例剪辑到一起,形成了以x差值为基础音幅逐渐增高的音波h,随着单轨音波强度的逐渐增强,音波h对大脑的听觉神经产生冲击效应。通过将双耳节拍波频进行脉冲式波频剪辑形成音波冲击效果,可以更好的实现脑电波的干预,而且往复的冲击效应可以有效的平衡脑电波的较大波动,并且进行较深度的刺激。
  • 播放清单编辑方法、装置及系统和计算机可读存储介质-201911006255.8
  • 郭梦婷;韩丹 - 西安诺瓦星云科技股份有限公司
  • 2019-10-22 - 2022-08-16 - G11B27/031
  • 本发明实施例提供一种播放清单编辑方法、一种播放清单编辑装置、一种播放清单编辑系统和一种计算机可读存储介质。所述播放清单编辑方法例如包括步骤:获取播放备片中的每个所述媒体项的播放时长,所述播放备片包括至少一个媒体项;获取所述播放清单的总时长和当前持续时长;根据所述播放清单的所述总时长和所述当前持续时长得到第一播放清单剩余时长;根据所述第一播放清单剩余时长和所述备片中的每个所述媒体项的所述播放时长确定每个所述媒体项的候补播放次数。本实施例解决了用户手动计算媒体项的播放次数复杂性高、准确率低的问题,实现了自动计算备片播放次数,从而大大提高了播放清单编辑的效率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top