[发明专利]一种聚类方法及装置在审
| 申请号: | 201911340565.3 | 申请日: | 2019-12-23 |
| 公开(公告)号: | CN111177466A | 公开(公告)日: | 2020-05-19 |
| 发明(设计)人: | 蔡明祥 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚璐;张颖玲 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 方法 装置 | ||
本申请提供一种聚类方法,包括,获得第一视频数据;对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类;根据所述聚类的结果进行管理。同时,本申请还提供一种聚类装置。
技术领域
本发明涉及视频处理技术,尤其涉及一种针对视频数据的聚类方法及装置。
背景技术
随着终端存储容量的提升,用户可以在终端内存储若干个音频、视频、图片等文件,但随着音、视频文件的增多,用户无法快速的在若干个音、视频文件中找到目标音、视频文件。
发明内容
为解决上述问题,本发明的技术方案是这样实现的:
根据本申请的一方面,提供一种聚类方法,包括,
获得第一视频数据;
对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;
基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类;根据所述聚类的结果进行管理。
上述方案中,所述基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件,包括:
基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据的第一属性;
在所述第一属性和第二视频数据的第二属性满足相同条件的情况下,确定所述第一视频数据与所述第二视频数据满足第一预定条件。
上述方案中,在所述第一属性和第二视频数据的第二属性满足相同条件的情况下,所述方法还包括:
获得所述第一视频数据的第一语义数据;
基于所述第一语义数据确定所述第一视频数据是预设类型数据的情况下,确定所述第一视频数据与所述第二视频数据满足第一预定条件;
所述预设类型数据包括学习类型、工作类型、旅游类型、运动类型、聚会类型中的至少一种。
上述方案中,在所述对所述第一视频数据和第二视频数据进行聚类之前,所述方法还包括:
获得所述第一音频特征数据在所述第一视频数据中所占的第一声音比重;
在所述第一声音比重满足第二预定条件下,对所述第一视频数据和所述第二视频数据进行聚类;
所述第二预定条件表征所述第一声音比重是所述第一视频数据中的最大声音比重。
上述方案中,所述对所述第一视频数据和第二视频数据进行聚类,包括:
为所述第一视频数据和所述第二视频数据构建第一标签;
基于所述第一标签将所述第一视频数据和所述第二视频数据标记为同类别文件。
上述方案中,所述对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据,包括:
对所述第一视频数据进行分析,得到一个第一音频特征数据和多个不同的第一场景特征数据的情况下,基于多个不同的所述第一场景特征数据对所述第一视频数据进行视频分割,得到多个第三视频数据,每个第三视频数据对应于一个第一场景特征数据;
基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第三视频数据与所述第二视频数据满足第一预定条件下,对满足所述第一预定条件的至少一个第三视频数据和所述第二视频数据进行聚类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911340565.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中穴拖扣装置
- 下一篇:一种梳型水煤浆分散剂及其制备方法





