[发明专利]基于动态记忆力的社交媒体数据在线检索方法及系统有效
申请号: | 202210971339.0 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115048539B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 罗昕;王娜;丁陈璐;许信顺 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/41;G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 记忆力 社交 媒体 数据 在线 检索 方法 系统 | ||
1.一种基于动态记忆力的社交媒体数据在线检索方法,其特征在于,包括:
获取多个轮次的样本数据和对应的用户标签;
自第一轮次开始,对每个轮次样本数据依次进行哈希函数学习,得到样本数据的哈希码,并存入数据库;其中,针对第t轮样本数据,根据第t轮样本数据和第t轮之前的样本数据所对应用户标签之间的成对相似性矩阵,构造第t轮样本数据的精细化伪标签;根据所构造的精细化伪标签确定哈希损失函数,通过最小化哈希损失函数,优化哈希函数的相关参数,以及得到第t轮样本数据的哈希码;
接收待检索的社交媒体数据,根据优化后的哈希函数映射得到相应的哈希码,通过将所述社交媒体数据的哈希码与数据库中样本数据的哈希码进行比较,得到检索结果;
其中,所述哈希损失函数的确定方法包括:
根据哈希学习的范式和所构造的精细化伪标签,确定第t轮时样本数据的成对相似性矩阵,构造用于学习第t轮样本数据的哈希码的第一目标函数;
根据第t轮在内存中的代表点和样本数据之间的成对相似性,构造用于学习第t轮样本数据的哈希码的第二目标函数;
捕捉所述样本数据的非线性特征,使用线性回归来进行哈希函数学习,得到用于学习第t轮样本数据的哈希码的第三目标函数;
将所述第一目标函数、第二目标函数和第三目标函数整合进哈希损失函数中,得到最终的哈希损失函数;
成对相似性矩阵Snn的构建为:
;
其中,表示在第t轮时新数据的成对相似性矩阵,表示通过精细化伪标签矩阵得来的,,j表示矩阵的第j列,表示向量的模,
定义第t轮的精细化伪标签矩阵为:;其中,表示平衡参数,表示在当前第t轮的one-hot编码的标签矩阵,表示在t轮的标签相似矩阵标准化到[0,1]区间的相似性矩阵;
用于学习第t轮样本数据的哈希码的第一目标函数写为:
;
其中,表示平衡这一项的超参数,表示矩阵的2范数,表示当前第t轮的哈希码,nt表示当前第t轮样本数量;
与在内存中的代表点与新数据样本点之间的相似性相应的第二目标函数表示为:
;
其中,表示平衡超参数,表示在内存中的代表点对应的哈希码,它是存储在内存中的已知信息,代表第t轮在内存中的数据点和新数据之间的成对相似性矩阵;
相关的第三目标函数写为:
;
其中,μ表示平衡超参数,表示防止过拟合的超参数,表示用于为测试样本生成哈希码的哈希函数,视觉特征X被内核函数处理以捕捉非线性特征;
将上述三个部分的目标函数整合进哈希损失函数中,得到最终的哈希损失函数:
其中,表示近似于离散哈希码的实值矩阵,通过引入实值矩阵可以简化哈希码的求解;是不相关约束,是位平衡约束。
2.如权利要求1所述的基于动态记忆力的社交媒体数据在线检索方法,其特征在于,所述样本数据包括文本数据、图像数据和视频数据;在获取多个轮次的样本数据和对应的用户标签之后,对每个轮次训练样本依次进行哈希函数学习之前,所述方法还包括:提取所述样本数据的特征,并对用户标签进行独热编码得到标签表示。
3.如权利要求2所述的基于动态记忆力的社交媒体数据在线检索方法,其特征在于,根据第t轮样本数据和第t轮之前的样本数据所对应的标签表示,确定标签矩阵;将所述标签矩阵的转置与自身相乘,得到标签的成对相似矩阵;对所述成对相似矩阵进行标准化处理,得到第t轮的精细化伪标签。
4.如权利要求1所述的基于动态记忆力的社交媒体数据在线检索方法,其特征在于,计算精细化伪标签与用户标签中各样本点之间的距离,并将所得到的距离按照从小到大的顺序进行排序,选取排列在前的预设数量的样本点作为代表点,在哈希学习过程中,内存固定存放多个数量的代表点,并用每一轮新选择的代表点代替预设部分内存中的代表点。
5.如权利要求1所述的基于动态记忆力的社交媒体数据在线检索方法,其特征在于,利用径向基核函数对样本数据进行处理,捕捉样本数据的非线性特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210971339.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于LED的可见光通信发射端校正方法及系统
- 下一篇:一种海藻糖结晶方法