[发明专利]一种用户画像分析方法及系统有效
申请号: | 202310094436.0 | 申请日: | 2023-02-10 |
公开(公告)号: | CN115795040B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 邓翼;谢丽菁;童颖;何以然 | 申请(专利权)人: | 成都桉尼维尔信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F18/241;G06F40/284;G06F18/23;G06F40/289 |
代理公司: | 成都云纵知识产权代理事务所(普通合伙) 51316 | 代理人: | 熊曦 |
地址: | 610095 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 画像 分析 方法 系统 | ||
本发明公开了一种用户画像分析方法及系统,涉及计算机技术领域,本方法获取评论数据后,首先根据评论内容对所述评论数据进行分类,然后分别计算每一类评论数据对应的主题和情感清倾向,分别从用户关注的主题和用户对主题的情感倾向两个维度刻画了用户画像,获得了用户最感兴趣且最受欢迎的主题,实现了用户喜好分布和倾向的直观展现,完成了粉丝用户画像的刻画,提取了粉丝类别特征并进行粉丝分类管理,向自媒体从业者提供了创作内容方向的指导,能够有效帮助自媒体从业者提高粉丝的转化率与留存率。
技术领域
本发明涉及计算机技术领域,具体地,涉及一种用户画像分析方法及系统。
背景技术
当前互联网技术发展迅速,互联网已经成为了人类生活密不可分的一部分,基于互联网的自媒体行业逐渐代替了传统社交媒体的功能,具有优秀的信息获取和信息传播能力。目前,各类自媒体平台拥有极大的用户量,也吸引了越来越多的自媒体从业者入驻,但由于自媒体账户面向的用户量极大,自媒体从业新人通常难以全面了解粉丝或观众的喜好以及情绪变化,从而难以提高粉丝的转化率与留存率。现有用户画像技术通常为面向用户的技术,旨在解决内容推荐相关的问题,即在对用户画像时关注每个用户在媒体平台上的总体行为和爱好并进行刻画,通过用户画像向对应的用户推荐特定的内容,而不能面向内容提供者对粉丝进行分析,无法为自媒体从业者提供信息支持。因此,如何对自媒体账户对应的粉丝群体进行用户画像的刻画,提取粉丝类别特征并进行粉丝分类管理这一问题亟待解决。
发明内容
为了对自媒体账户对应的粉丝群体进行用户画像的刻画与分析,提取粉丝类别特征,实现粉丝分类管理,本发明提供了一种用户画像分析方法,所述用户画像分析方法包括以下步骤:
配置爬虫规则,根据所述爬虫规则下载评论数据,获得第一评论数据;
对所述第一评论数据进行分类,获得分类结果;
根据所述分类结果分别提取每一类数据对应的关键词,获得第一数据,所述第一数据用于描述用户关注的主题;
根据所述分类结果分别计算每一类数据对应的情感倾向,获得第二数据,所述第二数据用于描述用户对主题的喜好;
分析所述第一数据和所述第二数据,获得用户喜好分布和倾向。
其中,本方法原理为:配置爬虫规则下载指定位置的评论数据后,首先根据评论内容对所述评论数据进行分类,获得分类结果;然后根据所述分类结果分别计算每一类数据对应的关键词,获得第一数据;根据分类结果分别计算每一类数据对应的情感倾向,获得第二数据;所述第一数据和所述第二数据分别从用户关注的主题和用户对主题的情感倾向两个维度刻画了用户画像,通过分析所述第一数据和第二数据,能够获得用户最感兴趣且最受欢迎的主题,实现了用户喜好分布和倾向的直观展现,为自媒体从业者提供了创作内容方向的指导,能够有效帮助自媒体从业者提高粉丝的转化率与留存率。
进一步的,由于自媒体从业者发布的作品通常包括多个主题,且自媒体账户面向的用户包括粉丝群体和非粉丝群体,为了有针对性的获得用户喜好分布和倾向,因此,获得所述第一评论数据后,首先将所述第一评论数据存入本地数据库,然后确定分析范围,根据所述分析范围调用所述本地数据库中对应的数据,获得第二评论数据,其中,所述分析范围用于确定用户画像的分析目标,所述分析范围包括用户范围和作品范围。
进一步的,由于所述第一评论数据中包括用户对不同主题内容的观点,需要对所述第一评论数据分类,BERT(Bidirectional Encoder Representations fromTransformers)模型是一种自然语言处理框架,基于多个堆叠的Transformers模型实现,能够从目标文本的左右上下文中汲取信息,且BERT模型在包含25亿余字的无标签号文本语料库和8亿余字的图书语料库中进行了预训练,相比其余语言处理框架在预测准确性上有更好的表现,因此,对所述第一评论数据进行分类,获得分类结果的具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都桉尼维尔信息科技有限公司,未经成都桉尼维尔信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310094436.0/2.html,转载请声明来源钻瓜专利网。