[发明专利]一种作弊视频识别方法和装置有效
| 申请号: | 201810299200.X | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN108764021B | 公开(公告)日: | 2021-03-26 |
| 发明(设计)人: | 梁召;陈英傑;胡军 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F16/951;G06F16/953;G06F16/9532;G06F16/732 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 作弊 视频 识别 方法 装置 | ||
本发明实施例提供了一种作弊视频识别方法和装置,涉及数据处理技术领域。其中,该方法包括:根据预设时间段内各个对象观看目标视频的观看时长中值,以及所述目标视频的总时长,确定所述目标视频的观看时长中值比;确定所述预设时间段内所述各个对象观看所述目标视频的完成度参数;根据所述目标视频的观看时长中值比和完成度参数,确定所述目标视频的作弊参数;当所述目标视频的作弊参数满足预设作弊条件时,确定所述目标视频为作弊视频。在本发明实施例中,可以利用用户行为参数表征视频的作弊参数,进而当视频的作弊参数满足预设作弊条件时,可以确定该视频为作弊视频,从而可以通过用户的观看行为识别出标题与内容严重不符的作弊视频。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种作弊视频识别方法和装置。
背景技术
随着搜索引擎性能和数据量的不断提高,人们使用搜索引擎获取所需数据的频率越来越高,其中,视频作为一种重要的数据承载形式,具有相当大的索引量。
如今的互联网,每时每刻都会有大量的用户上传大量的原创视频,对于此类原创视频,用户可以自主编辑视频标题,从而便于内容介绍,以及便于其他用户进行搜索。然而,由于利益驱使,部分用户可能会故意在视频标题中编辑作弊的关键词,从而吸引其他用户点击观看,而视频标题与视频内容严重不符的作弊视频,将大大降低用户对有效数据的搜索效率,浪费数据流量,因此,亟需一种能够识别作弊视频的方法。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种能够识别作弊视频的作弊视频识别方法和装置。
根据本发明的第一方面,提供了一种作弊视频识别方法,所述方法包括:
根据预设时间段内各个对象观看目标视频的观看时长中值,以及所述目标视频的总时长,确定所述目标视频的观看时长中值比;
确定所述预设时间段内所述各个对象观看所述目标视频的完成度参数;
根据所述目标视频的观看时长中值比和完成度参数,确定所述目标视频的作弊参数;
当所述目标视频的作弊参数满足预设作弊条件时,确定所述目标视频为作弊视频。
可选的,所述完成度参数包括退出率参数或完成率参数,所述确定所述预设时间段内所述各个对象观看所述目标视频的完成度参数,包括:
将所述目标视频的总时长等分为预设个数的各个时长区间;
确定每个对象观看所述目标视频的观看时长所对应的时长区间;
确定对应最短时长区间的观看时长数据比例,作为所述目标视频的退出率参数,或者,确定对应最长时长区间的观看时长数据比例,作为所述目标视频的完成率参数。
可选的,所述根据所述目标视频的观看时长中值比和完成度参数,确定所述目标视频的作弊参数之前,还包括:
从预设的各个总时长范围中,确定所述目标视频对应的目标总时长范围;
根据所述目标总时长范围,对所述目标视频的观看时长中值比进行修正,得到所述目标视频的修正观看时长中值比;
根据所述目标总时长范围,对所述目标视频的完成度参数进行修正,得到所述目标视频的修正完成度参数;
相应的,所述根据所述目标视频的观看时长中值比和完成度参数,确定所述目标视频的作弊参数,包括:
根据所述目标视频的修正观看时长中值比和修正完成度参数,确定所述目标视频的作弊参数。
可选的,所述根据所述目标总时长范围,对所述目标视频的观看时长中值比进行修正,得到所述目标视频的修正观看时长中值比,包括:
确定所述预设时间段内被观看,且对应所述目标总时长范围的各个播放视频的平均观看时长中值比;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810299200.X/2.html,转载请声明来源钻瓜专利网。





