[发明专利]一种基于用户行为和情感分析的短文本推荐方法及装置有效
申请号: | 201710345317.2 | 申请日: | 2017-05-16 |
公开(公告)号: | CN107103093B | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 刘金硕;李瞧;邓娟;刘必为;陈煜森;杨广益;李晨曦;李扬眉;房金城;谈聪;陈凯 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/335;G06F16/33 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 行为 情感 分析 文本 推荐 方法 装置 | ||
1.一种基于用户行为和情感分析的短文本推荐方法,其特征在于,包括:
步骤1,基于获取的用户历史数据生成用户特征向量;
步骤2,基于所述用户特征向量获取与目标用户具有相似历史行为的参考用户作为目标用户的相似用户群,具体包括:
步骤2.1,计算用户发表行为相似度
步骤2.2,计算短文本的主题相似度ρT=Num(T1∩T);
步骤2.3,基于公式ρH=w1ρT+w2ρu获取用户行为相似度,按用户行为相似度对参考用户进行降序排序,取前N个参考用户作为目标用户的相似用户群;
式中,目标用户的原创短文本频率FT1,目标用户的转发短文本频率FO1,目标用户的主题特征T1,w1,w2分别为用户发表行为相似度、用户发表行为相似度的权值;
步骤3,计算目标用户最近发表的短文本情感特征向量E1;
步骤4,基于用户最近发表的短文本的情感向量对该用户进行短文本的推荐。
2.根据权利要求1所述的一种基于用户行为和情感分析的短文本推荐方法,其特征在于,所述步骤1具体包括:
步骤1.1,计算用户一段时间内发表原创短文本频率,记为FO;
步骤1.2,计算用户一段时间内发表转发短文本频率,记为FT;
步骤1.3,使用LDA主题模型对用户已发表的短文本及自我介绍进行分析,获取主题特征,记为T;
步骤1.4,基于F0,FT,T构造用户特征向量。
3.根据权利要求1所述的一种基于用户行为和情感分析的短文本推荐方法,其特征在于,所述步骤3具体包括:
步骤3.1,对目标用户最近发表的短文本进行分词;
步骤3.2,统计不同词性的词语出现的频率,将各词性词语出现频率按序填入数组,记为该短文本的情感向量E1;
步骤3.3,基于公式e1=x·pemotion-y·nemotion计算情感向量E1的情感值;其中,pemotion为各正向情感词对应权重,nemotion为各负向情感词对应权重,x为情感向量E1中各正向情感词对应的分值,y为情感向量E1中的负向情感词对应的分值。
4.根据权利要求3所述的一种基于用户行为和情感分析的短文本推荐方法,其特征在于,所述步骤4具体包括:
步骤4.1,将相似用户群最近发表的短文本选入待推荐文本集,基于以下公式获取待推荐文本集中的各个待推荐文本与目标用户最近发表的短文本之间的情感相似度ρ:
式中,为待推荐文本情感向量E和目标用户最近发表短文本的情感向量E1的标准差;
步骤4.2,根据情感相似度ρ从待推荐文本集中选择若干个待推荐文本作为候选文本。
5.根据权利要求4所述的一种基于用户行为和情感分析的短文本推荐方法,其特征在于,所述步骤4.2中,
当e1<0时,将待推荐文本集中的短文本与目标用户最近发表的短文本逐一进行比对,最后得到三个ρ最趋近于-1的短文本作为候选推荐;当e1>0时,将待推荐文本集中的短文本与目标用户最近发表的短文本逐一进行比对,最后得到三个最趋近于1的短文本作为候选推荐。
6.根据权利要求5所述的一种基于用户行为和情感分析的短文本推荐方法,其特征在于,从候选推荐的短文本选择点赞数最高的作为推荐短文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710345317.2/1.html,转载请声明来源钻瓜专利网。