[发明专利]模型生成方法、音频处理方法、装置、终端及存储介质在审

专利信息
申请号: 201910134036.1 申请日: 2019-02-22
公开(公告)号: CN110008372A 公开(公告)日: 2019-07-12
发明(设计)人: 贾少勇 申请(专利权)人: 北京奇艺世纪科技有限公司
主分类号: G06F16/68 分类号: G06F16/68;G06F16/958;G06K9/62
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供了一种模型生成方法、音频处理方法、装置、终端及计算机可读存储介质,所述模型生成方法包括:标注样本音频数据的音乐情感,得到标注音频样本;将所述标注音频样本切割为预设长度的多个标注音频数据段;将各所述标注音频数据段处理为多个预设维度的标注样本音频段特征向量,以作为标注样本集;将所述标注样本集中各所述标注样本音频段特征向量的所述音乐情感标签进行更新,得到标注样本音频训练集;利用深度学习方法对所述标注样本音频训练集进行训练,得到第一音乐情感标注模型。实现了将目标音频数据输入第一音乐情感标注模型,得到音乐情感标签的目的。
搜索关键词: 标注 样本音频 音乐情感 模型生成 音频数据段 特征向量 音频处理 音频样本 训练集 预设 计算机可读存储介质 标签 终端 目标音频数据 存储介质 样本集 维度 切割 样本 更新 学习
【主权项】:
1.一种模型生成方法,其特征在于,包括:标注样本音频数据的音乐情感,得到标注音频样本;将所述标注音频样本切割为预设长度的多个标注音频数据段;将各所述标注音频数据段处理为多个预设维度的标注样本音频段特征向量,以作为标注样本集;将所述标注样本集中各所述标注样本音频段特征向量的所述音乐情感标签进行更新,得到标注样本音频训练集;利用深度学习方法对所述标注样本音频训练集进行训练,得到第一音乐情感标注模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910134036.1/,转载请声明来源钻瓜专利网。

同类专利
  • 采用聚类分析的乐曲分类方法-201810397604.2
  • 李婷 - 李婷
  • 2018-04-28 - 2019-11-08 - G06F16/68
  • 本发明公开了采用聚类分析的乐曲分类方法,包括以下步骤:S1:在同一个向量空间中建立所有音乐的特征向量;S2:选取任意不为核心音乐的音乐特征向量作为核心音乐;S3:选取聚类半径,所述聚类半径为角度;S4:将所有的与核心音乐特征向量的夹角小于聚类半径的音乐同该核心音乐聚为同一类;S5:将所有的聚类后的音乐视为核心音乐并执行S4。本发明采用聚类分析的乐曲分类方法,通过上述步骤,可以将音乐按照其各自相似度形成聚类,当用户进行搜索时,可以快速的根据音乐形成的聚类找到所需音乐。
  • 标签分配方法及装置-201610194484.7
  • 林锡雄;赵忠;陈胜凯;李祖辉 - 广州酷狗计算机科技有限公司
  • 2016-03-31 - 2019-11-05 - G06F16/68
  • 本公开揭示了一种标签分配方法及装置,属于歌曲分类领域。该方法包括:获取样本歌曲,样本歌曲包含预先标注的歌曲标签;获取用户评分矩阵,用户评分矩阵中包含至少一个用户对样本歌曲的评分,评分根据用户对样本歌曲的操作行为计算得到;根据用户评分矩阵以及样本歌曲的歌曲标签生成歌曲分类器;通过歌曲分类器为歌曲库中各个歌曲分配歌曲标签。本公开实施例达到了从用户收听歌曲过程中产生的用户行为数据中提取行为特征,利用该行为特征构建歌曲分类器,并进一步根据该歌曲分类器对歌曲进行分类,从而提高歌曲分类准确率。
  • 文档数据的延续处理方法、装置、设备及介质-201910526148.1
  • 卢显锋 - 中国平安财产保险股份有限公司
  • 2019-06-18 - 2019-10-22 - G06F16/68
  • 本发明公开了一种文档数据的延续处理方法、装置、设备及介质。所述方法包括:定时自数据库中获取待延续处理文档,根据其中的用户信息生成用户名单;按照历史选择类型和预留电话对用户名单中的用户信息进行分类,将同一用户类别的用户信息存储在同一电话文件中;自电话文件中的所有预留电话中筛选出有效预留电话,生成包含有效预留电话的目标电话文件;根据每个目标电话文件对应的用户类别,自数据库查询对应的语音文件和拨号参数;在接收拨号指令时,通过语音文件和拨号参数启动电话中间插件向用户进行自动拨号,并根据用户回复数据获取延续处理结果。本发明优化了数据延续处理过程,节约了人工成本,并达到灵活高效地延续处理数据的目的。
  • 歌曲数据的存储方法及终端-201611036576.9
  • 任超 - OPPO广东移动通信有限公司
  • 2016-11-18 - 2019-10-18 - G06F16/68
  • 本发明适用于通信领域,提供了一种歌曲数据的存储方法及终端。所述方法包括:在第一终端与播放设备首次连接时,第一终端获取并存储与所述播放设备存储的歌曲数据相同的歌曲数据以及与所述歌曲数据对应的时间标签;在第一终端与播放设备非首次连接时,第一终端获取已存储的最新歌曲数据对应的第一时间标签;第一终端根据获取的已存储的最新歌曲数据对应的第一时间标签判断是否需要更新存储的歌曲数据;在需要更新时,第一终端更新存储的歌曲数据以及对应的第一时间标签。通过上述方法能够提高播放设备系统的效率。
  • 一种发送歌单标识的方法和装置-201611225021.9
  • 林锡雄;刘卓;李祖辉;陶县俊 - 广州酷狗计算机科技有限公司
  • 2016-12-27 - 2019-10-11 - G06F16/68
  • 本发明实施例公开了一种发送歌单标识的方法和装置,属于计算机技术领域。所述方法包括:获取第一歌单的每首歌曲与第二歌单的每首歌曲的行为相似度;根据第一歌单的每首歌曲与第二歌单的每首歌曲的行为相似度,计算第一歌单和第二歌单的行为相似度;根据第一歌单和第二歌单的行为相似度,确定第一歌单和第二歌单的匹配度数值,并将第一歌单和第二歌单的歌单标识、匹配度数值,存储到每两个歌单与匹配度数值的对应关系中;当接收到终端发送的对应目标歌单的歌单获取请求时,根据每两个歌单与匹配度数值的对应关系,确定与目标歌单的匹配度数值最大的预设数目个歌单,向终端发送预设数目个歌单的歌单标识。采用本发明,可以提高选择歌单的效率。
  • 歌曲评论发布方法及装置-201910523711.X
  • 张思佳;李文;潘学基;张志鹏;陈志明;陈成禧;易芳波;李东江;郑博开;廖志勤 - 广州酷狗计算机科技有限公司
  • 2019-06-17 - 2019-09-06 - G06F16/68
  • 本发明公开了一种歌曲评论发布方法及装置,属于网络技术领域。所述方法包括:在终端上播放目标歌曲,显示对所述目标歌曲发布评论的评论入口;获取待发布的目标音频,所述目标音频为用户在所述终端上通过所述评论入口录制或选择的音频;判断所述目标音频是否是演唱所述目标歌曲的翻唱音频;当所述目标音频是演唱所述目标歌曲的翻唱音频时,将所述目标音频存储到服务器中,将所述目标音频的评论标识显示在所述目标歌曲的评论界面;当接收到在所述终端上播放所述目标音频的操作指令时,在所述终端上播放所述目标音频。本发明能够精准的获取到与歌曲匹配的翻唱音频,在该歌曲的评论界面中发布与该歌曲相关的翻唱音频,提高了评论发布的精准性。
  • 音频广告检测的方法及系统、终端以及计算机可读存储介质-201810060938.0
  • 陆永帅;罗荣刚 - 百度在线网络技术(北京)有限公司
  • 2018-01-22 - 2019-09-06 - G06F16/68
  • 本发明提出一种音频广告检测的方法及系统、终端以及计算机可读存储介质。该音频广告检测的方法包括:获取音频资源;将所述音频资源进行切分,以形成多个音频单元;将所述音频单元进行语音识别,以识别出文字文本;检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告;以及将所述音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。通过本发明的音频广告检测的方法,可以简单地、高精度地检测出音频资源中的广告。
  • 一种音乐的推荐方法、装置及系统-201910325505.8
  • 杨文博 - 北京达佳互联信息技术有限公司
  • 2019-04-22 - 2019-08-30 - G06F16/68
  • 本发明实施例提供了一种音乐的推荐方法、装置、电子设备及存储介质,具体为接收视频数据和待匹配的多段音乐数据,并将视频数据和音乐数据输入预先训练的多模态匹配网络模型进行处理,得到视频数据的视频嵌入向量和每段音乐数据的音频嵌入向量;再将视频嵌入向量和音频嵌入向量输入预先训练的个性化排序模型进行计算,得到视频数据与每段音乐数据之间的匹配度;最后将匹配度符合预设标准的音乐数据输出为待匹配的目标音乐,以使用户能够利用该目标音乐对视频进行配乐。由于这里的目标音乐是通过客观计算得到的,结果较为客观可靠,从而有效提高配乐与相应视频作品之间的匹配程度,最终得到满意的音视频作品。
  • 一种防止点读码冲突的系统及方法-201910458314.9
  • 张拥军 - 深圳市九州传媒科技有限公司
  • 2019-05-29 - 2019-08-27 - G06F16/68
  • 本发明涉及点读码识别技术领域,公开了一种防止点读码冲突的系统及方法,包括:将点读笔的身份信息上传至点读云平台;通过点读云平台给点读笔分配对应的码段范围,码段范围包括码段冲突区的范围;点读笔点击印刷品并识别印刷品上的OID码,利用点读笔与点读云平台的交互,判断OID码是否处于码段冲突区内;如果OID码处于码段冲突区内,且点读笔内存在多个内容与OID码对应,判断点读笔是否识别印刷品的具体信息;如果已经确认当前点读的印刷品的具体信息,则播放OID码对应的音频。能够读取多个内容对应的OID码,有效防止点读码冲突,提高了点读笔的适应性,方便快速、准确地读取OID码。
  • 音乐检索方法及装置-201910402006.4
  • 黄瑞阳 - 黄瑞阳
  • 2019-05-15 - 2019-08-16 - G06F16/68
  • 本发明涉及一种音乐检索方法及装置,其中方法包括:接收目标音乐的检索信息,检索信息包括音乐主题和音乐时长,基于构建的高潮音乐数据库,筛选与音乐主题和音乐时长相匹配的候选音乐,将候选音乐按照预设规则显示于目标用户的检索界面,以便目标用户从候选音乐中选择目标音乐作为目标对象的背景音乐。通过音乐主题和音乐时长的方式来搜索目标音乐,使得可以直接筛选到所需的音乐时长,避免了用户裁剪音乐时长的步骤,既节约时间,又提高了效率。
  • 声音特征数据库更新方法及装置-201910310512.0
  • 赵杜;畅菊香;张星宇;文征;邵明绪 - 西安极蜂天下信息科技有限公司
  • 2019-04-17 - 2019-08-09 - G06F16/68
  • 本公开是关于一种声音特征数据库更新方法及装置。该方法包括:获取目标声音信息;确定预设的声音特征数据库中是否存在与所述目标声音信息匹配的特征信息;若所述声音特征数据库中不存在与所述目标声音信息匹配的特征信息,获取所述目标声音信息对应的目标用户和目标情绪状态;根据所述目标声音信息对应的目标用户和目标情绪状态更新所述声音特征数据库。该技术方案在声音特征数据库中不存在与目标声音信息匹配的特征信息时,可以根据该目标声音信息对应的目标用户和目标情绪状态更新该声音特征数据库,使得该声音特征数据库可以根据获取到的声音信息进行实时更新,提高了根据用户情绪进行操作的可靠性,进而提高了用户体验。
  • 语音日志的在线音频分析数据的获取方法及系统-201910371304.1
  • 徐香君;肖通 - 苏州思必驰信息科技有限公司
  • 2019-05-06 - 2019-08-06 - G06F16/68
  • 本发明公开一种语音日志的在线音频分析数据的获取方法及系统,方法包括:根据当前语音日志信息调用与其对应的当前音频采集文件。根据当前音频采集文件生成当前音频波形图和当前音频频谱图。根据设定分析参数从当前音频波形图和当前音频频谱图中提取当前分析参数。将当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。本申请可通过语音日志对其对应音频进行在服务器端的调用。调用速度快。并可预设特征值对其获取的音频特征在音频分析图上进行快速调整。提高了音频处理效率及一致性,适合快速、批量的音频处理。
  • 一种为动画配乐的方法及装置-201610824071.2
  • 吴松城;陈军宏 - 厦门黑镜科技有限公司
  • 2016-09-14 - 2019-07-19 - G06F16/68
  • 本申请公开了一种为动画配乐的方法,包括:依据动画片段,确定动画片段的第一特征向量;动画片段由待配乐的动画中、依据待配乐动画的运动特征提取得到;依据动画片段的第一特征向量,确定与待配乐的动画相对应的第一关键词;依据第一关键词,确定与第一关键词相匹配的音乐资源,建立待配乐的动画与相匹配的音乐资源之间的对应关系。本申请还公开了一种为动画配乐的装置,包括:特征向量确定模块、第一关键词确定模块和音乐资源匹配模块。本申请基于动画的运动特征确定关键词,能够更真实、准确、全面的反映动画的特征,为建立合适的对应关系奠定基础。并且,本申请的全部过程均可由计算机按照预先设定的算法完成,有利于提高为动画配乐的效率。
  • 模型生成方法、音频处理方法、装置、终端及存储介质-201910134036.1
  • 贾少勇 - 北京奇艺世纪科技有限公司
  • 2019-02-22 - 2019-07-12 - G06F16/68
  • 本发明实施例提供了一种模型生成方法、音频处理方法、装置、终端及计算机可读存储介质,所述模型生成方法包括:标注样本音频数据的音乐情感,得到标注音频样本;将所述标注音频样本切割为预设长度的多个标注音频数据段;将各所述标注音频数据段处理为多个预设维度的标注样本音频段特征向量,以作为标注样本集;将所述标注样本集中各所述标注样本音频段特征向量的所述音乐情感标签进行更新,得到标注样本音频训练集;利用深度学习方法对所述标注样本音频训练集进行训练,得到第一音乐情感标注模型。实现了将目标音频数据输入第一音乐情感标注模型,得到音乐情感标签的目的。
  • 歌曲推荐装置和方法-201510532256.1
  • 薛沛 - 努比亚技术有限公司
  • 2015-08-26 - 2019-07-12 - G06F16/68
  • 本发明公开了一种歌曲推荐方法,该方法包括:获取终端播放过的已播歌曲和所述已播歌曲对应的历史积分;根据所述历史积分对所述已播歌曲进行排序,显示包含排序后的所述已播歌曲的歌曲推荐列表;根据用户基于所述歌曲推荐列表输入的歌曲选择指令,选出所述歌曲选择指令对应的所述已播歌曲以构成歌曲推荐文件集合。本发明还公开一种歌曲推荐装置。本发明根据用户播放歌曲的习惯,动态地向用户推荐用户喜爱的歌曲,避免用户进行频繁地切歌,特别是在用户无法切歌的场景下,动态推荐歌曲更能贴近用户需求,进而提高了用户体验。
  • 服务器装置、检索系统及其检索方法-201210359215.3
  • 本间健;福永功一郎;度会则男;本桥将敬;大渊康成 - 歌乐株式会社
  • 2012-09-24 - 2019-07-09 - G06F16/68
  • 本发明提供一种信息终端、服务器装置、检索系统及其检索方法,提供能够更容易地利用高检索功能的信息终端的技术。本发明的信息终端的特征在于,包括:接收声音的输入的声音输入接收单元;通过网络与规定的服务器装置进行通信的通信单元;输出单元;将上述声音输入接收单元接收到的声音的信息发送至上述服务器装置并接收确定与上述声音的信息相关的POI(兴趣点)的候选的信息的POI确定单元;将上述POI确定单元接收到的确定POI的候选的信息输出至上述输出单元的POI候选输出单元;接收确定上述POI的候选的信息的选择输入并搜索到达该POI的路径的路径搜索单元。
  • 在信息检索系统中使用层级评分以进行消歧-201380070581.X
  • A·詹;A·坎德沃尔 - 谷歌有限责任公司
  • 2013-11-08 - 2019-07-09 - G06F16/68
  • 用于检索信息的方法可以包括在非万维网库即非WWW库中接收针对媒体作者的搜索查询。可以在非WWW库内识别针对搜索查询的搜索结果。可以生成针对在搜索结果中所识别出的多个媒体作者各自的得分。针对多个媒体作者中的相应媒体作者的得分可以基于针对多个媒体作者中的相应媒体作者所创作的多个媒体项目的综合媒体流行度得分。可以基于所生成的针对多个媒体作者各自的得分来对搜索结果进行排名。
  • 图像和语音的跨模态检索分类器模型、检索系统和检索方法-201910131147.7
  • 袁媛;卢孝强;郭毛 - 中国科学院西安光学精密机械研究所
  • 2019-02-21 - 2019-07-05 - G06F16/68
  • 为解决现有图像检索方法检索效率低、可能会丢失一些有用或重要的细节信息、不能很好满足用户真正检索需求的技术问题,本发明提供了一种图像和语音的跨模态检索分类器模型、检索系统和检索方法。本发明构建了一个图像‑语音神经网络结构,利用图像及其语音描述之间的相关性作为监督信息,对深度神经网络进行训练,得到图像和语音关联关系的函数模型,从而实现图像和语音的跨模态检索,提高了图像检索效率和检索准确率,使检索过程中的人机交互变得更容易。
  • 基于标签深度分析的音乐自动标注方法-201910047030.0
  • 王振宇;萧永乐;张睿;雷昶;高雨轩 - 华南理工大学
  • 2019-01-18 - 2019-06-21 - G06F16/68
  • 本发明公开了一种基于标签深度分析的音乐自动标注方法,包括以下步骤:S1、收集音乐数据并结合音乐标签体系进行数据清洗;S2、对音乐数据进行采样,转换为梅尔频谱图并进行数据切片;S3、基于一维卷积网络构建音频多层级特征提取网络,通过有监督学习进行参数预训练;S4、基于二维卷积网络进行音乐标签向量表示学习,获取音乐标签特征;S5、实现音频多层级特征与音乐标签特征的特征聚合;S6、基于聚合特征进行最终的音乐标签预测。本发明克服了传统音乐标注方式不能应用于大规模音乐数据集的困难,根据音频内容对音乐进行自动标注,减少了人工维护音乐标签库的工作量,具有很好的可用性。
  • 播放歌曲高潮的方法、装置、设备及存储介质-201910151487.6
  • 吴娜;林最;黄飞 - 广州酷狗计算机科技有限公司
  • 2019-02-28 - 2019-06-21 - G06F16/68
  • 本申请公开了一种播放歌曲高潮的方法、装置、设备及存储介质,属于多媒体技术领域。方法包括:获取目标歌曲的动态信息,动态信息包括目标歌曲的图片信息及文字信息中的至少一种;在动态信息展示页面中展示目标歌曲的动态信息;检测到目标歌曲在动态信息展示页面中被选中后,获取目标歌曲的高潮音频文件,基于高潮音频文件在动态信息展示页面中播放目标歌曲的歌曲高潮。目标歌曲在动态信息展示页面中被选中后,无需进入歌曲播放页面,在动态信息展示页面就能直接播放目标歌曲的歌曲高潮,提高播放歌曲高潮的效率,减少用户的操作,使用户在浏览动态信息展示页面的同时,就能听取歌曲高潮部分,从而快速筛选出心仪的歌曲。
  • 播放音频信息的方法、装置、计算机设备及存储介质-201910120525.1
  • 魏仁 - 深圳市沃特沃德股份有限公司
  • 2019-02-18 - 2019-06-14 - G06F16/68
  • 本申请提出一种播放音频信息的方法、装置、计算机设备及存储介质,其中方法包括步骤:控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;判断所述第一图像内是否有图书;若是,则获取每一本所述图书的书名,得到第一名单;接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。通过本申请的方法可以进行多本图书识别,并辅助用户选定最终想要阅读的图书并播放该图书的音频信息。
  • 歌手封面的显示方法及装置-201610487116.1
  • 陈勇 - OPPO广东移动通信有限公司
  • 2016-06-24 - 2019-05-21 - G06F16/68
  • 本发明适用于智能设备技术领域,提供了一种歌手封面的显示方法及装置,所述显示方法包括:获取歌曲的歌手信息字符串;解析所述歌手信息字符串,得到所述歌曲对应的多个歌手名称;获取每一个歌手名称对应的歌手照片;组合所述歌手照片,得到所述歌曲的歌手封面,并显示所述歌手封面。本发明解决了现有技术对于对唱或者合唱的歌曲无法显示所有歌手的照片的问题;通过本发明实施例,对于对唱或合唱的歌曲,也能够在歌手栏目上显示所有演唱者的照片,提升了用户的体验感。
  • 音频生成方法、装置及存储介质-201811397629.9
  • 陆永帅 - 百度在线网络技术(北京)有限公司
  • 2018-11-22 - 2019-05-07 - G06F16/68
  • 本申请提供一种音频生成方法、装置及存储介质,其中,该方法包括:将目标文本转换成中间文本,根据该目标文本的内容,确定该目标文本所属的主题类别以及与该主题类别相匹配的背景音乐,基于该背景音乐与中间文本得到目标音频。该技术方案在没有人工参与的情况下实现了文本转换成音频,转换效率高,转换成本低,用户体验好。
  • 家庭音乐控制系统及方法-201811630797.8
  • 刘向丽 - 淄博职业学院
  • 2018-12-29 - 2019-04-26 - G06F16/68
  • 本发明公开了一种家庭音乐控制系统及方法,属于音乐领域,包括客户端、播放装置、中央处理单元、总服务器、音乐记录装置;客户端、音乐记录装置分别与中央处理单元连接,中央处理单元与服务器连接,中央处理单元控制播放装置播放音乐。本发明可以实现家庭中日常的音乐播放需求,同时也可以通过音乐记录装置的设置,保证了使用者在任何时候只要产生了灵感即可以录制记录下来,并且形成自动转化为乐谱存储在服务器中;客户端及其安装架的设置保证了家庭任何地方都可以设置客户端,并且不占用空间不影响美观,不需要时隐藏,需要时才会支撑起来。
  • 歌曲收藏方法和装置-201510662399.4
  • 鲍协浩;赵小平;邱诗定 - 小米科技有限责任公司
  • 2015-10-14 - 2019-02-12 - G06F16/68
  • 本公开是关于一种歌曲收藏方法和装置,属于多媒体技术领域。所述方法包括:接收歌曲收藏指令;当终端中正在播放歌曲收藏指令指示的歌曲的APP为非预设APP时,获取歌曲的信息;根据歌曲的信息将歌曲在预设APP中确定为收藏歌曲。本公开通过在当前播放歌曲的APP不为预设APP时,将当前播放的歌曲在预设APP中确定为收藏歌曲,解决了相关技术中终端使用不同的APP播放歌曲时,会在不同的APP中将歌曲确定为收藏歌曲,而不同APP中的收藏歌曲难以集中进行播放的问题。达到了能够始终将正在播放的歌曲在预设APP中确定为收藏歌曲,方便终端集中进行播放的效果。
  • 用于学习的语音播放方法及装置-201811087376.5
  • 王全志 - 王全志
  • 2018-09-18 - 2019-01-11 - G06F16/68
  • 本发明提供了用于学习的语音播放方法及装置,涉及教育教学技术领域,其中,该用于学习的语音播放方法包括:首先,服务器根据接收到的外部触发生成课程选择信号,需要进行说明的是,上述外部触发是用户端向服务器发送的,其次,服务器在数据库中查找与课程选择信号相匹配的目标播放信号,上述目标播放信号为音视频格式,之后,服务器将目标播放信号发送给播放设备进行播放,以使学生通过影音形式来获取相关的教学内容,从而使学生的自学过程更加丰富有趣,大大提升了学生的自学体验。
  • 信息处理方法和装置-201710506048.3
  • 彭艺宇;黄俊;叶璨 - 百度在线网络技术(北京)有限公司
  • 2017-06-28 - 2019-01-04 - G06F16/68
  • 本申请公开了信息处理方法和装置。该方法的一具体实施方式包括:获取待识别的音频文件并从音频文件中提取至少一段音频;从至少一段音频中提取至少一个声纹特征向量;将至少一个声纹特征向量进行聚类生成至少一个中心声纹特征向量;对于每个中心声纹特征向量,将该中心声纹特征向量与预定的声纹库进行匹配,并按照匹配度由高到低的顺序选取第一预定数目个声源信息并输出,其中,声纹库用于表征声纹特征向量和声源信息的对应关系。该实施方式能够提高识别音频文件中各声源的声源信息的速度和准确性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top