[发明专利]一种互联网音频文件的聚类方法、搜索方法及系统有效
申请号: | 200610139787.5 | 申请日: | 2006-09-25 |
公开(公告)号: | CN1932819A | 公开(公告)日: | 2007-03-21 |
发明(设计)人: | 苏雪峰;郭齐 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 100084北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种互联网音频文件的聚类方法,包括以下步骤:对获取的音频文件进行采样,取得能够描述该音频文件的P个第一特征值;根据预置的第一算法,得到用来代替所述P个第一特征值描述该音频文件的M个第二特征值,其中P大于M;通过预置的第二算法,根据所述M个第二特征值计算得到该音频文件的特征标识;分别对互联网中的音频文件进行上述计算,将特征标识相同的音频文件标记为同一类。本发明通过比较音频文件特征标识的方式判断音频文件是否相同或相似,避免了根据音频文件链接信息和/或相关上下文中的文字信息进行比较时,由于文字信息与音乐内容不符而导致的音频文件聚类错误。 | ||
搜索关键词: | 一种 互联网 音频文件 方法 搜索 系统 | ||
【主权项】:
1、一种互联网音频文件的聚类方法,其特征在于,包括以下步骤:对获取的音频文件进行采样,取得能够描述该音频文件的P个第一特征值;根据预置的第一算法,得到用来代替所述P个第一特征值描述该音频文件的M个第二特征值,其中P大于M;通过预置的第二算法,根据所述M个第二特征值计算得到该音频文件的特征标识;分别对互联网中的音频文件进行上述计算,将特征标识相同的音频文件标记为同一类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610139787.5/,转载请声明来源钻瓜专利网。