[发明专利]评论数据处理方法、装置及设备有效
申请号: | 201810317233.2 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108550065B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 岳爱珍;崔燕;翟庆羽;宋烈金;张琳琳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/33;G06N3/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评论 数据处理 方法 装置 设备 | ||
1.一种评论数据处理方法,其特征在于,包括:
获取待处理的目标评论数据及所述目标评论数据对应的用户信息;
根据所述用户信息,确定所述用户的可信度;
对所述目标评论数据进行识别处理,确定所述目标评论数据的可信度;
根据所述用户的可信度及所述目标评论数据的可信度,确定所述目标评论数据所属的类型,其中,所述目标评论数据所属的类型包括:优质类和普通类;
所述确定所述目标评论数据所属的类型,包括:
利用预设的分类模型,对所述用户的可信度及所述目标评论数据的可信度进行分类处理,确定所述目标评论数据所属的类型;所述预设的分类模型包两层逻辑回归模型,其中第一层逻辑回归模型的准确率大于第二层逻辑回归模型的准确率;
所述确定所述目标评论数据的可信度,包括:
对所述目标评论数据进行预处理,确定所述目标评论数据对应的特征信息,所述特征信息包括:包含的字符数量、图片数量、情感词数量、所述目标评论数据的转移概率和/或所述目标评论数据与已知评论数据的相似度;
根据所述目标评论数据对应的特征信息,确定所述目标评论数据的可信度;
确定所述目标评论数据的转移概率之前,还包括:
对评论样本数据库中的样本数据进行解析处理,确定词状态转移矩阵;
所述确定目标评论数据的转移概率,包括:
将所述目标评论数据进行分词,确定所述目标评论数据中包括的各词单元;
根据所述词状态转移矩阵,确定所述目标评论数据中各词单元间的转移概率;
将所述目标评论数据中各词单元间的转移概率相乘,得到所述目标评论数据的转移概率。
2.如权利要求1所述的方法,其特征在于,所述确定所述用户的可信度,包括:
基于所述用户信息,利用预设的用户评价模型,确定所述用户的可信度;
或者,
根据预设的用户信息与可信度的映射关系,确定与所述用户信息对应的用户可信度。
3.如权利要求1所述的方法,其特征在于,确定所述目标评论数据与已知评论数据的相似度,包括:
利用Simhash算法,从已知评论数据中抽取与所述目标评论数据相似的各评论数据;
分别确定所述目标评论数据与所述相似的各评论数据间的各相似度;
所述确定所述目标评论数据的可信度,包括:
根据所述目标评论数据与相似的各评论数据间的最大相似度,确定所述目标评论数据的可信度。
4.如权利要求1所述的方法,其特征在于,所述确定所述目标评论数据所属的类型之后,还包括:
获取修正指令,所述修正指令用于指示对所述目标评论数据所属的类型进行修正,所述修正指令中包括所述目标评论数据修正后的类型;
根据所述目标评论数据修正后的类型及所述目标评论数据,对所述分类模型进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810317233.2/1.html,转载请声明来源钻瓜专利网。