[发明专利]一种基于文本评论挖掘的智能餐饮推荐算法在审
申请号: | 201810566021.8 | 申请日: | 2018-06-04 |
公开(公告)号: | CN108776940A | 公开(公告)日: | 2018-11-09 |
发明(设计)人: | 郎非;赵志斌;苗栋晨 | 申请(专利权)人: | 南京邮电大学盐城大数据研究院有限公司 |
主分类号: | G06Q50/12 | 分类号: | G06Q50/12;G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 224005 江苏省盐城市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于文本评论挖掘的智能餐饮推荐算法,本发明属于计算机算法领域。本发明通过搜集用户餐饮数据,建立用户餐厅打分矩阵,计算用户打分相似度;提取出特征情感词对;合并同类特征,量化各特征的分数;建立用户偏好打分矩阵,计算用户的偏好相似度;计算用户综合相似度;计算用户信任值;计算用户间的信任度;基于用户间信任度通过加权评价值为餐厅打分;推荐前N个餐厅。本发明利用文本评论挖掘的方法,制定了一系列抽取规则,形成评论摘要,利用依存句法从评论摘要中提取出用户对餐厅的环境、服务等特征属性的情感信息,将特征属性量化之后的分数与用户的餐厅总体打分结合,对餐厅进行推荐。与传统的餐饮推荐相比,提高了推荐的准确率。 | ||
搜索关键词: | 餐厅 文本评论 餐饮 矩阵 特征属性 相似度 信任度 算法 挖掘 量化 计算机算法 综合相似度 智能 抽取规则 情感信息 用户偏好 用户信任 传统的 情感词 准确率 评论 句法 偏好 加权 搜集 合并 制定 服务 | ||
【主权项】:
1.一种基于文本评论挖掘的智能餐饮推荐算法,其特征在于:算法步骤如下:1)、搜集用户餐饮数据,根据收集数据信息建立如下式的用户‑餐厅打分矩阵,分别定义餐饮数据为用户U,餐厅G,用户打分M,用户评论,
式中
表示用户Ui对餐厅Gj的打分;并采用用户‑餐厅打分矩阵通过下式计算得到欧几里得距离:
采用上式得到的欧几里得距离通过下式计算打分相似度:
式中其中Di,j为用户Ui和Uj的欧几里得距离,
和
为用户对餐厅a的打分,A为用户Ui和用户Uj共同打过分的餐厅数目;
为用户Ui和用户Uj的打分相似度;2)、针对步骤1)中的用户评论进行分词与词性标记;采用LTP对预处理后的评论短句进行依存句法分析;得到句子各成分之间的依存关系类型;制定摘要抽取规则从依存句法树中提取出特征情感词;特征情感词对的形式为W=(wc,we),式中wc为特征属性词,we为此特征的修饰词;3)、分别针采用服务,环境,卫生,菜品为特征;通过如下式合并同类特征量化各特征:Gj={wc1:[we11,we12,…we1n];wc2:[we21,we22,…we2n];…wc4:[we41,we42,…we4n]}式中wc1,wc2,wc3,wc4分别对应为服务,环境,卫生,菜品;wem1,wem2…wemn为该特征下的所有修饰词;并建立积极情感词典、消极情感词典、否定情感词典与程度副词词典,对每个特征进行评分;4)、针对步骤3)得到评分建立如下用户‑偏好打分矩阵:
其中:
表示用户Uj对4个特征cm(服务,环境,卫生,菜品)的打分;并通过如下式计算用户偏好相似度![]()
![]()
式中其中Di,j为用户Ui和Uj的欧几里得距离,
和
为用户对特征b的打分,B为用户Ui和用户Uj共同打过分的特征数目;
为用户Ui和用户Uj的打分相似度。5)、将步骤1中得到的用户打分相似度
与步骤4)得到的用户偏好相似度
通过下式进行权值结合:
其中:β等于0.5;6)、分别计算户活跃度与用户评价有效率;通过下式得到用户活跃度
其中HU为用户的活跃度,e是自然底数,n为标记操作的次数,ti为持续时间,υ为活跃度;通过下式判断评论是否为有效评论,
Nfavour为评论赞成数,Nagainst为评论反对数;再通过下式计算有效评价的有效率:
其中EU为用户评论有效率,N有效评论为有效评论的数量,N评论为该用户的评论总数;7)、针对步骤6得到的用户活跃度和用户评价有效率,通过下式计算用户信任度:TU=HU+EU用户活跃度HU越高,用户信任值TU越高;用户评论有效率EU越高,用户信任值TU越高;8)、通过用户信任度计算用户间信任度:TDi,j=Simi,j×Tj其中TDi,j表示用户Ui对Uj的信任度,Simi,j为用户Ui和Uj的综合相似度,Tj为用户Uj的信任值。用户Uj信任值越高,用户Ui对Uj的信任度越高;9)、基于步骤8用户间信任度通过加权评价值通过下式为餐厅打分:
其中:Scorei,g表示用户Ui对餐厅Gg的加权评价值,TDi,j表示用户Ui对Uj的信任度,Mj,g为用户Uj对餐厅Gg的打分,U为用户集合;10)、通过对所有未打分餐厅进行打分后,按由高到低进行排序,推荐前N个餐厅。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学盐城大数据研究院有限公司,未经南京邮电大学盐城大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810566021.8/,转载请声明来源钻瓜专利网。