[发明专利]对单词情感值进行自动标定的方法在审
申请号: | 201711105704.5 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107766331A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 王津;彭博;张学杰;张骥先;杨旭涛 | 申请(专利权)人: | 云南大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京国坤专利代理事务所(普通合伙)11491 | 代理人: | 郭伟红 |
地址: | 650031*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单词 情感 进行 自动 标定 方法 | ||
1.一种对单词情感值进行自动标定的方法,其特征在于,具体按照以下步骤进行:
步骤1,训练出词库中所有单词的词向量,通过人工标记的方法初始化少量单词,记作种子单词vj,其余单词为待标定单词vi;被初始化的种子单词vj的情绪值为valvj、激励值为arovj;
步骤2,利用word2vec工具计算每个种子单词vj和每个待标定单词vi的词向量之间的余弦夹角值,得到每个种子单词vj和每个待标定单词vi之间的相似度;
步骤3,以种子单词vj和待标定单词vi作为节点,以种子单词vj和待标定单词vi之间的相似度作为连边权重,构建权重图模型;
步骤4,预测待标定单词vi的情绪值valvi和激励值arovi。
2.根据权利要求1所述的一种对单词情感值进行自动标定的方法,其特征在于,所述步骤4中,预测待标定单词vi的情绪值valvi,通过式(3)进行不断迭代更新至收敛:
其中,α是衰变因子或置信水平,取值在0-1之间,随机数取值在1-9之间,Sim(vi,vj)代表待标定单词vi和种子单词vj之间的相似度,valvj代表被初始化的种子单词的情绪值,t代表迭代的步数,代表第t步迭代待标定单词的情绪值,代表第t-1步迭代待标定单词的情绪值。
3.根据权利要求1所述的一种对单词情感值进行自动标定的方法,其特征在于,所述步骤4中,预测待标定单词的激励值arovi的方法,通过式(4)进行不断迭代更新至收敛:
其中,α是衰变因子或置信水平,取值在0-1之间;随机数取值在1-9之间,Sim(vi,vj)代表待标定单词vi和种子单词vj之间的相似度,arovj代表被初始化的种子单词的激励值,t代表迭代的步数,代表第t步迭代待标定单词的激励值,代表第t-1步迭代待标定单词的激励值。
4.根据权利要求1所述的一种对单词情感值进行自动标定的方法,其特征在于,所述步骤4中,预测待标定单词vi的情绪值valvi和激励值arovi采用矩阵运算方法,具体为:将所有待标定单词、种子单词的情绪值用向量V表示,将所有待标定单词、种子单词的激励值用向量A表示,设所有待标定单词和种子单词之间的相似度构成邻接矩阵S,
其中,Sim(vi,vj)表示待标定单词vi和种子单词vj之间的相似度,1≤i<N,1≤j<N;
设定向量I=(1,1T,,1,向.量..D,=(1d1,)d2,...,dN)T,其中,α是衰变因子或置信水平,取值在0-1之间;假设向量X=(x1,x2,...,xN)T,向量Y=(y1,y2,...,yN)T,则函数运算M(X,Y)=(x1×y1,x2×y2,...,xN×yN)T,函数运算U(X,Y)=(x1/y1,x2/y2,...,xN/yN)T;
利用式(5)计算第t步迭代包含种子单词和待标定单词在内所有词汇的情绪值向量Vt和激励值向量At;
Vt=M[(I-D)T,Vt-1]+M[DT,U(SVt-1,S×I)],
At=M[(I-D)T,At-1]+M[DT,U(SAt-1,S×)](5)
其中,Vt-1代表第t-1步迭代包含种子单词vj和待标定单词vi在内所有词汇的情绪值向量,At-1代表第t-1步迭代包含种子单词vj和待标定单词vi在内所有词汇的激励值向量;
待多次迭代收敛后,待标定单词vi的情绪值valvi为情绪值向量Vt的第i维相应数值;待标定单词vi的激励值arovi为激励值向量At的第i维相应数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711105704.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:保健救心草拌花生米的凉拌菜
- 下一篇:一种补肾滋阴壮阳黑色膳食纤维代餐食品