[发明专利]一种基于异构物品使用事件的物品语意标注方法在审
申请号: | 201810205055.4 | 申请日: | 2018-03-13 |
公开(公告)号: | CN108427752A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 陈垣毅;郑增威;王驰 | 申请(专利权)人: | 浙江大学城市学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
地址: | 310015*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于异构物品使用事件的物品语意标注方法,包括以下步骤:1)建立物品潜在关系强度挖掘模型;2)提取物品隐式特征;3)提取物品显示特征;4)训练物品语义标注模型;提取上述四种特征后,将(FLatent+Ftext+FS+FT)组合在一起作为二分类SVM分类器的训练数据,由所有独立二分类器预测的标签聚合作为物品的语义标注结果。本发明的有益效果是:本发明是基于异构物品使用事件建立物品隐式关系强度的潜变量模型,从中提取物品隐式特征,并综合利用显示与隐式特征预测给定物品的类别语义标签,本方法在效率、性能等方面显著优于基于显式特征的现有物品标注方法。 | ||
搜索关键词: | 隐式 使用事件 异构 标注 语义标注 二分类 语意 变量模型 潜在关系 特征预测 物品显示 训练数据 语义标签 显式 聚合 标签 挖掘 预测 | ||
【主权项】:
1.一种基于异构物品使用事件的物品语意标注方法,其特征在于,包括以下步骤:1)建立物品潜在关系强度挖掘模型:定义
为物品oi和oj之间的使用事件,I(ij)为物品oi与oj之间的潜在关系强度,
为物品之间属性相似度的评价指标,
表示一些为了增加模型准确性引入的辅助变量;对物品潜在关系强度与其使用事件的频率之间的关系进行分析与变换可以得到如下表述形式:
对凸函数L使用随机梯度下降法来估计参数αl,βl,θl和Iij,求解一阶导数与二阶导数,使用Netwton‑Raphson算法在每次迭代过程中更新参数∑={α,β,θ,ω}直至收敛;2)提取物品隐式特征:定义G=表示物品的top‑k关系图,其中V=Vs∪Vr是关系图的顶点集,其中Vs是已经标注的物品集,Vr是未标注的物品集,E图G的边集合;对于oi,oj∈Vs,定义Wij=1,如果oi和oj具有相同的类别标签,否则为0;如果oi,oj中至少一个物品未标注,Wij的值由上述公式确定:
其中Ωi=[Ωj1,Ωj2,...,Ωjk]为物品oi在top‑k关系图中的k近邻集,η是一个权重调节参数;定义τi表明物品oi具有语义标签μ,μ∈U,定义P(τi=μ|i),μ∈U为物品oi可能具有语义标签μ的概率,为未标注物品初始化P(τi=μ|i)=1/|U|,如果物品oi具有语义标签μ则初始化P(τi=μ|i)=1,否则初始化P(τi=μ|i)=0;利用随机游走为每个物品计算P(τi=μ|i),μ∈U;随机游走过程表示为如下公式:Pt+l(τi=μ|Ωi)=(1‑λ)MPt(Ωi)+λPr(τi=μ|Ωi)当随机游走过程收敛时,可以获得物品oi上的每个标签的概率估计值,并将其作为隐式特征FLatent训练分类器;3)提取物品显示特征:利用文档频率/逆文档频率从文本资料中提取关键字,并将关键字的权重作为基本文字的显示特征Ftext;将空间模式定义为F维向量:Fs(i)=[SFi(loc1),SFi(loc2),...,SFi(locF)];其中SFi(lock)通过公式
计算,Ni(lock)为在位置lock发生的物品使用事件中包括物品oi的数目,
为所有涉及物品oi的使用事件数量,F是位置类别数目;将时间模式定义为一个T维向量:FT(i)=[TFi(t1),TFi(t2),...,TFi(tT)],其中TFi(tk)通过
进行计算,其中Ni(tk)为在时间戳tk发生的物品使用事件中包括物品oi的事件数目,
为所有涉及物品oi的使用事件数量,T为时间戳数目;4)训练物品语义标注模型:提取上述四种特征后,将(FLatent+Ftext+FS+FT)组合在一起作为二分类SVM分类器的训练数据,由所有独立二分类器预测的标签聚合作为物品的语义标注结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学城市学院,未经浙江大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810205055.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种短链接跳转方法、装置及电子设备
- 下一篇:一种新的数据挖掘方法