[发明专利]一种语音编辑方法以及装置有效

专利信息
申请号: 201711236599.9 申请日: 2017-11-30
公开(公告)号: CN109859776B 公开(公告)日: 2021-07-13
发明(设计)人: 谭啸 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G11B27/02 分类号: G11B27/02;H04L29/06
代理公司: 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 代理人: 冯德魁;窦晓慧
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开了一种语音编辑方法、装置以及计算机可读存储介质,所述语音编辑方法包括:在语音交互接口中接收针对初始语音数据的编辑触发指令;基于所述编辑触发指令生成对应的语音编辑接口;通过所述语音编辑接口接收编辑指令;根据所述编辑指令对所述初始语音数据进行处理,获得目标语音数据;其中,所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。通过本申请所提供的方法,可使所述初始语音数据在发送前首先进行编辑,增加了语音交互过程中的全面性和便利性。
搜索关键词: 一种 语音 编辑 方法 以及 装置
【主权项】:
1.一种语音编辑方法,其特征在于,包括:在语音交互接口中接收针对初始语音数据的编辑触发指令;基于所述编辑触发指令生成对应的语音编辑接口;通过所述语音编辑接口接收编辑指令;根据所述编辑指令对所述初始语音数据进行处理,获得目标语音数据;其中,所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711236599.9/,转载请声明来源钻瓜专利网。

同类专利
  • 一种音频全局独占播放方法及终端设备-202211681791.X
  • 毛勇强;蒙在明;李道龙 - 深圳市深智电科技有限公司
  • 2022-12-21 - 2023-03-28 - G11B27/02
  • 本发明的一种音频全局独占播放方法,包括:当终端设备正在通过当前应用播放音频时,第一管理模块接收第一应用发送的播放请求,第一管理模块对第一应用设置直通标识,第一管理模块向第二管理模块发送直通播放请求;第二管理模块接收直通播放请求后发送停止通知给第三管理模块;第三管理模块接收停止通知关闭当前应用,第二管理模块关闭当前应用的直通播放通道;第二管理模块获取第一应用的直通标识,第一应用通过第二管理模块使用音频播放硬件播放声音。还包括终端设备。本方法能够让所用音频播放应用都能以自己所输出的音频格式,直接传输到音频播放硬件,实现音频数据得以原汁原味地传输,达到真正的无损播放。
  • 音视频编辑方法、装置、电子设备及存储介质-202211358778.0
  • 徐志勇;李健 - 抖音视界有限公司
  • 2022-11-01 - 2023-02-03 - G11B27/02
  • 本公开实施例提供了一种音视频编辑方法、装置、电子设备及存储介质。其中,该方法包括:当检测到触发播放待编辑音视频数据时,获取每个待使用音视频编辑插件;根据预先接收到的音视频状态管理数据以及每个待使用音视频编辑插件,确定目标音视频编辑插件;基于目标音视频编辑插件中所集成的功能模块对待编辑音视频数据进行编辑处理,以得到目标音视频数据;基于目标音频路由播放目标音视频数据。本公开实施例的技术方案,实现了基于浏览器对待编辑音视频数据进行插件化编辑的效果,简化了音视频编辑处理流程,并且,引入音视频编辑插件可以使目标音频路由实现可扩展化,进一步提升了用户体验。
  • 音视频的编辑方法、装置、计算机设备及存储介质-202110731896.0
  • 王小艳;程亮;章健权;许东学;白霜雪 - 深圳万兴软件有限公司
  • 2021-06-30 - 2022-07-01 - G11B27/02
  • 本申请涉及音视频处理技术领域,揭露一种音视频的编辑方法、装置、计算机设备及存储介质,其中方法包括通过多个界面设计层接口获取音视频配置请求,并调用基础服务库以及非线编适配器对音视频配置请求进行基础配置处理,得到音视频配置请求对应的操作对象和操作信息,再通过调用Undo/Redo管理器对操作信息进行压栈/出栈处理,以调用操作对象进行压栈/出栈处理,得到目标数据,然后将目标数据通过消息队列发送到界面设计层中,接着在界面设计层中,基于目标数据,对界面设计层中的音视频控件进行更新。本申请实现音视频能够在不同的界面设计层和非线编版本中进行非线性编辑,有利于提高音视频的编辑效率。
  • 医疗运动图像处理系统-201980024304.2
  • 菅野修也;权珉秀 - 株式会社创佳医疗
  • 2019-03-11 - 2021-11-26 - G11B27/02
  • 提供一种能够减轻医疗用的运动图像文件的编辑作业中的用户的作业负担的医疗运动图像处理系统。从存储单元读出与所设定的片段的至少一部分对应的一个或多个运动图像文件,计算所读出的运动图像文件所录像的一个或多个时间段中的与该片段重复的时间段即片段重复部分的时间长度,部分地切取与成为计算对象的片段重复部分中包括的时间码相对应的运动图像文件并使其保存到规定的存储区域,在该情况下如果片段重复部分的时间长度(例如32分10秒)超过规定时间(例如30分钟),则能够进行将保存在规定的存储区域的运动图像文件的时间长度缩短为规定时间以下的缩短处理。
  • 一种语音编辑方法以及装置-201711236599.9
  • 谭啸 - 阿里巴巴集团控股有限公司
  • 2017-11-30 - 2021-07-13 - G11B27/02
  • 本申请公开了一种语音编辑方法、装置以及计算机可读存储介质,所述语音编辑方法包括:在语音交互接口中接收针对初始语音数据的编辑触发指令;基于所述编辑触发指令生成对应的语音编辑接口;通过所述语音编辑接口接收编辑指令;根据所述编辑指令对所述初始语音数据进行处理,获得目标语音数据;其中,所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。通过本申请所提供的方法,可使所述初始语音数据在发送前首先进行编辑,增加了语音交互过程中的全面性和便利性。
  • 关联音频片段与视频片段的方法、装置及存储介质-202010052610.1
  • 李文涛;罗超 - 广州酷狗计算机科技有限公司
  • 2020-01-17 - 2020-06-16 - G11B27/02
  • 本申请是关于一种关联音频片段与视频片段的方法、装置及存储介质,属于多媒体领域。所述方法包括:显示多个第一多媒体片段以及多个第二多媒体片段,第一多媒体片段为音频片段且第二多媒体片段为视频片段,或者,所述第一多媒体片段为视频片段且所述第二多媒体片段为音频片段;针对任一个第一多媒体片段,在检测到所述任一个第一多媒体片段被移动至一个第二多媒体片段对应的区域时,关联所述任一个第一多媒体片段和所述一个第二多媒体片段。本申请能够提高制作音乐短片的效率。
  • 基于物联网的智能场景多媒体信息化管理控制设备-201810893116.0
  • 周宝宁;侯春海;胡启星;黄湘南 - 深圳市宝业恒实业股份有限公司
  • 2018-08-07 - 2020-03-03 - G11B27/02
  • 本发明公开了一种基于物联网的智能场景多媒体信息化管理控制设备,包括,场景定制终端,与场景定制终端连接的电脑系统服务器,电脑系统服务器连接有设备信号处理模块,设备信号处理模块通过网络数据交换模块与外围多媒体设备无线/有线连接;场景定制终端包括节目录播单元、智能场景切换单元;节目录播单元用于将不同场景的多媒体特效进行录制并存储,得到工程文件;智能场景切换单元根据不同工程文件设置对应的快捷键,用于实现不同场景模式的一键切换。本发明通过软硬件结合,利用物联网的网络数据交互技术,简化了多媒体设备控制过程和节目编排过程,实现智能场景切换的同时保证了作业的安全性。
  • 音乐编辑方法、装置、终端设备及计算机可读存储介质-201810910260.0
  • 韩旭 - 北京微播视界科技有限公司
  • 2018-08-10 - 2019-01-08 - G11B27/02
  • 本公开的实施例提供了一种音乐编辑方法、装置、终端设备及计算机可读存储介质,该方法包括:接收用户的音乐编辑指令,依据音乐编辑指令,将待编辑音乐的音轨图显示到音轨图编辑界面;通过音轨图编辑界面接收用户针对音轨图的编辑信息,编辑信息为用于标识待编辑音乐中的至少一段音乐的信息;依据编辑信息所对应的待编辑音乐中的至少一段音乐,得到编辑完成的音乐。通过本实施例的方案,用户能够参与到待编辑音乐的编辑中,使用户可依据自己的意愿编辑得到最终编辑完成的音乐,能够更好的满足用户的个性化需求,提升了用户的交互体验。
  • 剪辑点判断系统及剪辑点判断方法-201810866674.8
  • 曹一清 - 曹一清
  • 2018-08-01 - 2018-12-18 - G11B27/02
  • 本发明公开了一种剪辑点判断系统及剪辑点判断方法,该剪辑点判断系统包括:获取模块,用于获取视频中的相邻两帧图像;检测模块,用于对所述相邻两帧图像进行相似性检测;判断模块,用于根据所述检测模块检测的结果判断所述相邻两帧图像之间是否为剪辑点。本发明提供的剪辑点判断系统,可以实现视频中剪辑点的自动判断,相比现有技术采用的人工判断方式,不但可以减少所需的人力物力,还可以提高工作效率。
  • 一种扩展点歌曲库的方法及其系统-201410147686.7
  • 陈节省;林剑宇 - 福建凯米网络科技有限公司
  • 2014-04-14 - 2018-10-02 - G11B27/02
  • 本发明提供了一种拓展点歌曲库的方法,包括步骤:从移动终端或互联网获取歌曲文件;从歌曲文件中提取伴奏音频;将伴奏音频与视频或幻灯文件合成为视听文件;从移动终端或互联网获取与音频同步的歌词字幕,并将歌词字幕嵌入所述视听文件;将视听文件存储于本地点歌曲库;通过无线传输方式同步移动终端和视听终端;播放视听文件;从移动终端或视听终端接收声音;处理并播放所述声音。本发明还提供了一种相应的拓展点歌曲库的系统。本发明的有益效果为:充分利用通过互联网和移动终端所能获取的庞大歌曲数量扩充本地点歌曲目库,并制作出能充分满足用户需求的伴奏视听文件。
  • 音频数据的处理方法及系统-201310435293.1
  • 王文永;孙奥;金骏 - 南京中兴软件有限责任公司
  • 2013-09-23 - 2018-08-28 - G11B27/02
  • 本发明公开了一种音频数据的处理方法及系统,在上述方法中,应用处理器在将从音频数据存储设备中读取的预设时长的音频数据发送至音频解码器之后,确定进入空闲模式;应用处理器在从空闲模式被唤醒之后,继续从音频数据存储设备中读取与前一次读取到的音频数据接续的下一段音频数据并发送至音频解码器。根据本发明提供的技术方案,进而当移动终端运行音频播放任务时,通过使移动终端间歇性地进入低功耗音乐播放状态,能够显著降低移动终端在播放音频任务时的总功耗,提高移动终端的电池续航能力,提升产品竞争力。
  • 外挂字幕加载的方法、装置及蓝光播放机-201510056901.7
  • 龙俊卫 - 广东欧珀移动通信有限公司
  • 2015-02-03 - 2018-01-16 - G11B27/02
  • 本发明适用于蓝光播放技术领域,提供了一种外挂字幕加载的方法、装置及蓝光播放机,所述方法包括播放选定的视频文件;获取所述视频文件的名称中的关键字;获取字幕类文件的名称;将所述关键字与获取到的字幕类文件的名称进行匹配,如果匹配成功,则加载所述字幕类文件。本发明,当查找与关键字相匹配的字幕类文件的名称时,自动加载该字幕类文件,使得字幕文本同当前播放的视频帧一起进行显示,不用用户更改视频文件或者字幕类文件的名称,即可加载相应的字幕类文件,简单、快捷,且不易出错,省去了用户手动将磁盘中的视频文件或者字幕类文件的名称一一进行更改的繁琐操作。
  • 一种音乐循环播放的方法-201610199665.9
  • 不公告发明人 - 魏贞民
  • 2016-04-05 - 2017-10-24 - G11B27/02
  • 本发明是关于一种音乐循环播放的方法,可应用于可携带式电子装置。而此播放的方法包括以下步骤(A)输入设定循环播放的次数或者循环播放的时限;(B)设定在一个媒体库中全部或者部分文件的有序或者随机播放。因此,可以达到既让每一个媒体文件符合要求的循环一定次数或者时限的播放,又可以让媒体库中的媒体资源都有机会播放。
  • 视频编辑方法及其数字装置-201280073818.5
  • 赵殷亨 - LG电子株式会社
  • 2012-08-16 - 2017-02-22 - G11B27/02
  • 公开了一种用于编辑视频的一局部序列的回放速度的方法及其数字装置。提供了一种视频编辑方法,该视频编辑方法包括以下步骤提供与视频序列相对应的时间线界面;接收用于指定所述时间线界面上的第一位置的第一用户输入和用于指定所述时间线界面上的第二位置的第二用户输入;设置所述时间线界面的所述第一位置与所述第二位置之间的编辑间隔;接收针对所述编辑间隔的第三用户输入;响应于所述第三用户输入,调节所述编辑间隔的厚度和长度中的至少一个;以及基于所述编辑间隔的所调节的厚度和长度来编辑所述局部序列的回放属性。
  • 一种基于电子新闻采集ENG素材上载的草编方法-201110456092.0
  • 张峰 - 新奥特(北京)视频技术有限公司
  • 2011-12-30 - 2017-02-01 - G11B27/02
  • 本发明公开了一种基于电子新闻采集ENG素材上载的草编方法,包括接收数据接口扫描读取命令;根据所述扫描接口类型对所述本地硬件数据读取接口进行扫描,获得与其对应的本地硬件数据读取接口为第一读取接口;根据第一读取接口接收数据获得第一接口数据文件;接收图标文件,所述图标可用于区分数据类型;判断第一接口数据文件中是否具有图标;根据第一接口数据文件图标和/或添加图标读取第一接口数据,并对第一接口数据进行草编。本发明解决了现有非线性编辑系统中同时针对多种类型采集装置及其采集素材,进行素材草编的问题,实现了针对不同类型的素材输入设备及输入接口实现多种介质格式全面上载支持,大大降低了上载工作站的成本。
  • 用于动态调整视频回放速度的技术-201380079385.9
  • D.阿夫拉哈米;E.伊拉马 - 英特尔公司
  • 2013-10-04 - 2016-04-13 - G11B27/02
  • 描述了用于增强视频回放的技术。在一些实施例中,该技术将记录的事件数据解析成多个段。每个段内的数据然后可在标识潜在感兴趣的事件的发生的尝试中被分析。基于该分析,可向每个段指配重要性值或对于每个段调整重要性值。基于段的重要性值与一个或多个重要性阈值的比较,可向该段指配回放速度。将每个段与指配的回放速度相关的回放索引然后可被产生,并用于在视频查看期间控制回放速度。这可允许视频的相对不感兴趣的部分以高回放速度自动绕过,而感兴趣的部分以相对低的速度播放。
  • 二重唱模式的媒体内容物制作方法及用于其的媒体内容物制作装置-201380078020.4
  • 石哲;崔虎光 - 石哲;因科尔普有限责任公司
  • 2013-05-03 - 2016-02-24 - G11B27/02
  • 本发明公开二重唱模式的媒体内容物制作方法及用于其的媒体内容物制作装置,本发明的二重唱模式的媒体内容物制作方法包括如下步骤包括:媒体文件编辑装置再生多声道音频文件的步骤,上述多声道音频文件通过对伴奏轨道和与上述伴奏轨道相对应的人声轨道进行合成而成;上述媒体文件编辑装置接收由使用人员所输入的对上述人声轨道的音量调节指令的步骤;以及上述媒体文件编辑装置生成基于上述音量调节指令的音量调节值的步骤。根据本发明,可直接制作以二重唱形式使自己的声音和自己喜欢的歌曲的原唱歌手的声音一同被录音的媒体内容物。
  • 一种重组残余MOV视频的方法-201410693999.2
  • 梁效宁 - 四川效率源信息安全技术有限责任公司
  • 2015-08-04 - 2015-07-29 - G11B27/02
  • 本发明公开了一种重组残余MOV视频的方法,其特征在于包括以下步骤:S1:生成镜像文件;S2:区分出正常MOV视频;S3:找到残余MOV视频数据区,记录关键信息;S4:提取MOV数据和关键信息;S5:提取正常MOV视频的索引表信息;S6:修改索引表信息;S7:重组MOV视频;S8:判断是否完成任务,若是则结束,若否则执行S3。本发明能准确的区分的正常MOV视频,缩小扫描范围提高工作效率;通过多重判断能准确找到MOV视频数据区的数据,降低错误率;能够将残余的不能播放的MOV视频重组为可正常播放的视频。
  • 律动图像化方法及系统-201310669183.1
  • 周世俊;刘柏甫;林玉凡;谢宜君;魏士尧 - 财团法人资讯工业策进会
  • 2013-12-10 - 2015-06-10 - G11B27/02
  • 一种律动图像化方法及系统,可根据音频特征和个人的图像特征产生可视化的律动图像。该律动图像化方法为先取得个人图像,从其中取得图像以建构一个人化图像,由音频中取得音频特征,取得对应此音频特征的个人化律动设定数据,之后可依据音频、个人化图像以及个人化律动设定数据产生一个人化律动图像。经整合多个产生的个人化律动图像可进而产生一群体化律动图像。
  • 一种视频合成方法及装置-201410150722.5
  • 蒋金峰 - 北京奇艺世纪科技有限公司
  • 2014-04-15 - 2014-07-16 - G11B27/02
  • 本发明实施例公开了一种视频合成方法及装置,一种视频合成方法,包括:接收用户的视频合成请求;根据视频合成请求,确定视频合成所需的媒体素材、各媒体素材在期望合成结果中所对应的展现时段、各媒体素材所对应的渲染特效、各渲染特效所对应的渲染时段;根据确定结果,生成用于视频合成的时域分布信息,该分布信息中记录有:各媒体素材在期望合成结果中的时域分布情况、与各媒体素材对应的渲染特效在期望合成结果中的时域分布情况;分别对各个媒体素材进行解码,并根据所述时域分布信息对各个媒体素材的解码结果进行合成。由此可见,在对视频、图片和音频进行合成的过程中,能够同时添加相应的特效,缩短了视频合成所需的时间,提高了用户体验。
  • 一种LTC时间解码系统-201410108721.4
  • 蒋佳成 - 蒋佳成
  • 2014-03-21 - 2014-06-04 - G11B27/02
  • 本发明涉及一种LTC时间解码系统,该LTC时间解码系统可保持电影机服务器与动感座椅之间的精确同步。该系统包括:电源电路10、信号输入电路20、滤波电路30、主控芯片电路40、RS232串行转换芯片电路50和网络转换芯片电路60。
  • 一种视频创作系统-201410099412.5
  • 不公告发明人 - 杨雅
  • 2014-03-17 - 2014-06-04 - G11B27/02
  • 本发明提供一种视频创作系统,属于影像技术领域,用于解决现有的视频制作方案创作效率低和直观性低的问题。本发明提供的视频创作系统包括:创建分镜脚本中一定顺序的若干个镜头并为各镜头添加描述信息的分镜脚本编辑及显示模块;控制视频拍摄设备拍摄用户在当前分镜脚本中选定的镜头对应的视频素材的视频素材获取模块;存储分镜脚本编辑及显示模块提供的分镜脚本的镜头信息和视频素材获取模块发来的视频素材及其与镜头之间的对应关系的存储模块。该系统将分镜脚本的创建和编辑与视频素材的拍摄、存储、剪辑融合在一起,能显著提高视频创作过程的效率和直观性。
  • 新媒体快速编辑系统-201310282008.7
  • 陶敬伟;吴晓涛;褚艳云 - 上海帕科软件科技有限公司
  • 2013-07-05 - 2014-05-21 - G11B27/02
  • 本发明涉及计算机领域,具体涉及视频处理领域。新媒体快速编辑系统的媒体快速编辑软件包括一媒体播放软件、一置顶播放软件,以及一录制软件;存储器中存储有播出内容资料和画面修饰资料;媒体播放软件播放媒体影像;置顶播放软件播放修饰影像;置顶播放软件所播放的修饰影像,位于媒体影像的前方,并形成覆盖;媒体影像与修饰影像组合后形成组合影像;录制软件,对组合影像进行录制,并存储进存储器。进而快速实现,对原始的媒体播出内容资料的修饰处理。媒体播放软件和置顶播放软件,共同使用一视窗窗口,录制软件对视窗窗口内的影像内容进行录制。以便于保证工作质量。
  • 视频编辑的方法及其移动终端-201310737845.4
  • 范俊君;卢武;林雄财 - 宇龙计算机通信科技(深圳)有限公司
  • 2013-12-27 - 2014-04-23 - G11B27/02
  • 本发明适用于视频编辑技术领域,提供一种视频编辑的方法及其移动终端,所示方法包括:添加步骤:在视频编辑界面添加需要编辑的第一视频文件和/或多个第二视频文件;分段步骤:通过在所述视频编辑界面的时间轴上滑动游标设定所述第一视频文件和/或多个所述第二视频文件分割的时间点,将所述第一视频文件分割为包括多级别的多个第一子视频文件;和/或将所述第二视频文件分割为包括多级别的多个第二子视频文件;合成步骤:选择需要保留的所述第一子视频文件和/或第二子视频文件,并根据先序遍历顺序将选择需要保留的所述第一子视频文件和/或第二子视频文件合并成新的视频文件。借此,本发明的实现对多视频的间断视频剪辑。
  • 信息处理装置和信息处理方法-201310460263.6
  • 真壁铁弥;会田卓;古川贵士;豊田茂树 - 索尼公司
  • 2013-09-30 - 2014-04-16 - G11B27/02
  • 本发明涉及信息处理装置和信息处理方法。该信息处理装置包括记录单元和控制单元。记录单元能够通过与预定的再现时间段对应的数据块执行对记录介质的随机存取。控制单元被配置成:当在记录介质中的被记录为第一文件的多个数据块中的部分数据块被编辑时,使记录单元将被编辑的数据块作为第二文件记录在记录介质的空闲空间中。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top