[发明专利]一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法在审
申请号: | 201910961379.5 | 申请日: | 2019-10-11 |
公开(公告)号: | CN112651237A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 刘垚;邹更;任钰欣;黄梓杰 | 申请(专利权)人: | 武汉渔见晚科技有限责任公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430070 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 情绪 立场 画像 建立 方法 装置 可视化 | ||
本发明公开了一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法,其中的用户画像建立方法包括:从用户历史数据中获取独立短文本语料;对获取的短文本语料根据情感倾向进行分类,并根据短文本语料分类结果中词语的分布情况,构建情感词库;根据应用场景构建立场触发词库;计算待分析语料块的情感概率;根据待分析语料块的情感概率,计算单个用户对应的立场触发词的情感概率;根据单个用户对应的立场触发词的情感概率,计算社群内立场触发词的平均情感概率,并根据平均情感概率进行排序;根据社群内立场触发词的排序情况和单个用户对立场触发词的情感概率,构建用户画像。本发明的方法可以提高用户情绪分析的准确性和直观性。
技术领域
本发明涉及数据分析技术领域,具体涉及一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法。
背景技术
用户在网络平台中的用户行为常常被用来描述一个用户的特征,这种用户特征被称为用户画像,而根据目的不同,构建用户画像的侧重点也会不同。例如电商平台侧重于用户的消费能力,购买偏好建立用户画像,而社交平台会基于用户的兴趣特点和社交关系建立用户画像,不同的用户画像会帮助平台对用户进行分类,更好的为用户实现定制化服务。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
现有技术中,在对用户进行情感分析时,其采用的情感词库中包含了大量的非网络用语和非日常用语的词汇,同时缺乏现今网络常用语的词汇,使得基于现有的情感词库的情感分析准确性和实用性有所限制。
由此可知,现有技术中的方法存在分析结果不够准确的技术问题。
发明内容
有鉴于此,本发明提供了一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法,用以解决或者至少部分解决现有技术中的方法存在的结果不够准确的技术问题。
本发明第一方面提供了一种基于用户情绪立场的用户画像建立方法,包括:
从用户历史数据中获取独立短文本语料;
对获取的短文本语料根据情感倾向进行分类,并根据短文本语料分类结果中词语的分布情况,构建情感词库,并计算情感词库中情感词的原始情感概率;其中,情感词库中包含正面情感词和负面情感词;
根据应用场景构建立场触发词库,其中,立场触发词库中包含能够引起用户立场或情绪反应的立场触发词;
提取出用户发布的文字信息中包含的立场触发词,并根据提取出的立场触发词组成待分析语料块,然后根据待分析语料块中情感词的情感概率、程度副词的数量和否定词的数量,计算待分析语料块的情感概率;
根据待分析语料块的情感概率,计算单个用户对应的立场触发词的情感概率;
根据单个用户对应的立场触发词的情感概率,计算由所有用户组成的社群内立场触发词的平均情感概率,并根据平均情感概率进行排序;
根据社群内立场触发词的排序情况和单个用户对立场触发词的情感概率,构建用户画像。
在一种实施方式中,对获取的短文本语料根据情感倾向进行分类,并根据短文本语料分类结果中词语的分布情况,构建情感词库,并计算情感词库中情感词的情感概率,包括:
对获取的短文本语料根据情感倾向进行分类,分为正向语料、中立语料和负向语料;
将分类后的语料进行分词,并去冗余后得到语料词库;
统计语料词库中的每一个词语在正向语料、中立语料和负向语料中的分布情况;
根据词语的分布情况,结合卡方校验筛选出与正向、负向有关的词汇作为情感倾向的标志词候选;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉渔见晚科技有限责任公司,未经武汉渔见晚科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910961379.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面条机条宽调节装置
- 下一篇:防盗方法及地垫