[发明专利]一种方面挖掘模型的训练方法、装置及电子设备有效
申请号: | 201810750122.0 | 申请日: | 2018-07-10 |
公开(公告)号: | CN108932637B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 石川;吉余岗 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2458;G06F40/284 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方面 挖掘 模型 训练 方法 装置 电子设备 | ||
1.一种方面挖掘模型的训练方法,其特征在于,所述方法包括:
获得多条针对商家对象的评论信息,其中,每条评论信息包括:用户的标识、商家对象的标识、所述用户对所述商家对象的评论文本和用户总评分;
确定各个评论文本中的评论词组与评价方面的目标对应关系,其中,所述评论词组包括一个先行词和一个修饰词,所述先行词为:表示评价方面的词,所述修饰词为:表示用户情绪的词;
确定所述多条评论信息中的用户评论关系和商家评论关系,其中,所述用户评论关系为:关于用户总评分、用户的标识及评论文本的对应关系,所述商家评论关系为:关于用户总评分、商家对象及评论文本的对应关系;
利用预设的函数优化公式,优化预设的损失函数;其中,所述损失函数为关于方面评分的取值范围、所述用户总评分、所述目标对应关系、所述用户评论关系和所述商家评论关系的函数;所述方面评分的取值范围为基于预设的评分取值范围和预设的评分偏差所确定的;
在所述损失函数优化完成后,将所述用户总评分和所述目标对应关系作为输入内容,对方面挖掘模型进行训练,直至通过所述损失函数所计算出的损失值低于预设阈值时,完成所述方面挖掘模型的训练;其中,所述方面挖掘模型为用于确定商家对象的各个评价方面对应的评价分数的模型。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的评分取值范围和预设的评分偏差,确定方面评分的取值范围的方式,包括:
按照如下公式,计算与预设的评分取值范围内每个评分对应的方面评分:
rz=Ri-bz
其中,rz为方面评分,Ri为所述预设的评分取值范围内第i个评分,1≤i≤n,n为所述预设评分取值范围内评分的个数,bz为所述预设的评分偏差;
基于与所述预设的评分取值范围内每个评分对应的方面评分,确定方面评分的取值范围。
3.根据权利要求1所述的方法,其特征在于,所述确定各个评论文本中评论词组与评价方面的目标对应关系的步骤,包括:
利用预设的语言处理工具,从各个评论文本中提取评论词组;
针对每一评论词组,将该评论词组输入至预先训练完成的主题模型中进行检测,得到该评论词组与评价方面的目标对应关系。
4.根据权利要求1所述的方法,其特征在于,所述确定所述多条评论信息中的用户评论关系和商家评论关系的步骤,包括:
针对每一用户的标识,从该标识对应的评论文本中,获取与各个用户总评分对应的第一评论文本;
针对每一用户的标识,建立用户总评分与所对应的第一评论文本的对应关系,作为用户评论关系;
针对每一商家对象,从该商家对象对应的评论文本中,获取与每个用户总评分对应的第二评论文本;
针对每一商家对象,建立用户总评分与所对应的第二评论文本的对应关系,作为商家评论关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810750122.0/1.html,转载请声明来源钻瓜专利网。