[发明专利]计算机系统及音频比对方法在审
申请号: | 201310589528.2 | 申请日: | 2013-11-20 |
公开(公告)号: | CN104637496A | 公开(公告)日: | 2015-05-20 |
发明(设计)人: | 王崇喆;黄耀民;廖珮妤 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G10L25/54 | 分类号: | G10L25/54 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 徐金国 |
地址: | 中国台湾台北市*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机系统 音频 方法 | ||
技术领域
本发明是有关于一种计算机系统及音频比对方法,且特别是有关于一种循序进行音频比对的计算机系统及音频比对方法。
背景技术
音频比对是一种快速的音频检索方式,使用者可在噪音环境下录制一段正在播放的音频片段,并在音频比对系统中找到最符合此音频片段的歌曲、电影、电视节目或广播节目。
然而,已知的音频比对系统在音频比对的正确率、音频比对所需的等待时间以及执行音频比对的服务器的运算量上仍有许多改进的空间。
因此,如何设计一个新的音频比对装置及方法,以解决上述的问题,乃为此一业界亟待解决的问题。
发明内容
因此,本发明的一方面是在提供一种计算机系统,用以进行音频比对。计算机系统包含客户终端以及服务器。
客户终端包含分类器、第一地标特征撷取模块、第一编码模块以及整合模块。分类器用以估算第一音频样本的一第一音频片段的辨识难易度。第一地标特征撷取模块用以根据辨识难易度,决定地标特征撷取的次数,并对第一音频片段进行相对应次数的地标特征撷取,以产生多个第一地标特征。第一编码模块用以将第一地标特征编码为多个第一散列键。整合模块用以整合第一散列键,并产生整合后的多个散列键传送至服务器。
服务器包含第二地标特征撷取模块、第二编码模块、散列表、查表模块、分析模块以及判断模块。
第二地标特征撷取模块用以对第二音频样本进行地标特征撷取,以产生多个第二地标特征。第二编码模块用以将第二地标特征编码为多个第二散列键。散列表用以储存第二散列键与其所对应的多个散列值。查表模块,用以将客户终端所传送的散列键与散列表中的第二散列键进行查表比对。分析模块用以分析查表比对的结果。判断模块,用以决定音频比对结果,并将音频比对结果传送至客户终端。
依据本发明一实施例,判断模块还用以测量一信心度,当信心度达到门槛值时,则决定音频比对结果,并将音频比对结果传送至客户终端。当信心度未达门槛值时,则判断模块发送请求至客户终端,客户终端配合服务器依据请求对第一音频样本中的一第二音频片段进行音频处理。
依据本发明另一实施例,上述第二音频片段是接续于第一音频片段。
依据本发明又一实施例,上述信心度为第一音频片段中每秒比对到的散列键数目。
依据本发明更具有的一实施例,上述第一地标特征与第二地标特征包含一起始频率、一频率差以及一时间差。
依据本发明另具有的一实施例,上述第二散列键的散列值包含一地标特征开始时间以及一节目数据。
依据本发明又具有的一实施例,上述分类器于估算该辨识难易度时,利用第一音频片段的一绝对音量的平均值、一相对音量的标准差、一三次微分绝对值加总的标准差中的一者或上述三者的组合估算辨识难易度。
依据本发明再具有的一实施例,于上述客户终端中,当两个第一散列键相同时,上述整合模块还用以删除该两个第一散列键其中之一。
依据本发明另又一实施例,上述第一音频样本为一歌曲、一电影、一电视节目或一广播节目的音频。
依据本发明另再一实施例,上述客户终端为一智能手机、一平板电脑、一笔记型电脑、一智能手表、一智能眼镜、一智能电视,或一数字电视机上盒。
本发明的再一方面是在提供一种音频比对方法,包含下列步骤:
估算第一音频样本的一第一音频片段的辨识难易度;根据辨识难易度,决定地标特征撷取的次数,并对第一音频片段进行相对应次数的地标特征撷取,以产生多个地标特征;将地标特征编码为多个第一散列键;整合第一散列键,并将整合后的多个散列键与散列表中的多个第二散列键进行查表比对;分析查表比对的结果;以及决定音频比对结果。
依据本发明一实施例,音频比对方法还包含下列步骤:测量信心度;当信心度达到门槛值时,则决定音频比对结果;以及当信心度未达门槛值时,则对第一音频样本的一第二音频片段重新进行上述音频比对方法。
依据本发明另一实施例,上述音频比对方法中,第二音频片段是接续于该第一音频片段。
依据本发明又一实施例,上述音频比对方法中,信心度为第一音频片段中每秒比对到的散列键数目。
依据本发明更具有的一实施例,上述音频比对方法中,各地标特征还包含一起始频率、一频率差以及一时间差。
依据本发明再具有的一实施例,上述音频比对方法中,各第二散列键的散列值还包含一地标特征开始时间以及一节目数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310589528.2/2.html,转载请声明来源钻瓜专利网。