[发明专利]UGC指纹签名确定方法、装置及UGC去重方法、装置在审
申请号: | 201610111706.4 | 申请日: | 2016-02-29 |
公开(公告)号: | CN105681046A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 王路;李国强;周坤朋;乔景亮;张丽辉;朱雨莹;张扬蕾;骆超锋;陈拓 | 申请(专利权)人: | 郑州悉知信息科技股份有限公司 |
主分类号: | H04L9/32 | 分类号: | H04L9/32;H04L29/06;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 450000 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种UGC指纹签名确定方法、装置及UGC去重方法、装置,UGC指纹签名确定方法包括:本申请实施例提供的UGC指纹签名确定方法,获取UGC;过滤所述UGC中的排版信息,得到文字信息;对所述文字信息进行分词以及词频统计,得到若干词以及各词的词频数;计算各个词的hash值;利用各词的词频数对相应词的hash值进行加权,得到加权后hash值;将各词的加权后hash值进行累加,得到序列串信息;将所述序列串信息转换为二进制格式,得到UGC的指纹签名。本申请参考了UGC中各分词及分词词频数确定最终的指纹签名,其指纹签名能够很好的标识UGC的身份。 | ||
搜索关键词: | ugc 指纹 签名 确定 方法 装置 | ||
【主权项】:
一种UGC指纹签名确定方法,其特征在于,包括:获取用户原创内容UGC;过滤所述UGC中的排版信息,得到文字信息;对所述文字信息进行分词以及词频统计,得到若干词以及各词的词频数;计算各个词的hash值;利用各词的词频数对相应词的hash值进行加权,得到加权后hash值;将各词的加权后hash值进行累加,得到序列串信息;将所述序列串信息转换为二进制格式,得到所述UGC的指纹签名。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州悉知信息科技股份有限公司,未经郑州悉知信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610111706.4/,转载请声明来源钻瓜专利网。