[发明专利]一种电商平台销售商品品牌形成品牌池的方法在审
申请号: | 202110793276.X | 申请日: | 2021-07-14 |
公开(公告)号: | CN113515559A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 宋娇 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F40/289;G06F16/951;G06Q30/02 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 销售 商品 品牌 形成 方法 | ||
本发明涉及大数据挖掘和分析处理领域,具体提供了一种电商平台销售商品品牌形成品牌池的方法,将电商平台的商品公开信息进行爬虫获取后,将商品的品牌信息整理提取,结合商品及分词技术,可以将名称相近的品牌加以区分,同一品牌进行统一编码,并形成映射关系;不同品牌进行不同编码加以区分,从而形成完整的品牌池。与现有技术相比,本发明将各个电商平台上所涉及商品的品牌进行规范化整理,形成品牌池,后续若对品牌在各大电商平台销售额情况进行大数据统计时可以统一与整理,方便快捷。
技术领域
本发明涉及大数据挖掘和分析处理领域,具体提供一种电商平台销售商品品牌形成品牌池的方法。
背景技术
品牌是商家与消费者快速建立信任的有益桥梁,所以品牌的分析是分析目前的消费零售市场不可或缺的一部分。数据爆炸的时代,各种各样的品牌如雨后春竹般涌现,面对形形色色的品牌,大数据行业进行品牌分析则需要对电商平台的品牌进行整理与规范化。而品牌不似商标一般规整,不同商家,不同平台对于同一品牌的叫法不一。不同行业,不同厂家存在品牌重名问题;品牌没有统一的规范化处理办法,使得大数据行业对于品牌销售情况的统计与归纳变的非常困难。
针对以上问题,需要对品牌进行规范化处理,建立品牌池,解决治理杂乱无章的品牌,形成统一规范化品牌,从而有利于品牌的进一步统计与分析。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的电商平台销售商品品牌形成品牌池的方法。
本发明解决其技术问题所采用的技术方案是:
一种电商平台销售商品品牌形成品牌池的方法,将电商平台的商品公开信息进行爬虫获取后,将商品的品牌信息整理提取,结合商品及分词技术,可以将名称相近的品牌加以区分,同一品牌进行统一编码,并形成映射关系;
不同品牌进行不同编码加以区分,从而形成完整的品牌池。
进一步的,具体的步骤如下:
S1、获取电商平台销售商品及商品品牌信息;
S2、选取每个平台每个品牌销售额靠前的若干商品;
S3、对商品利用分词技术进行分词,将商品名称拆解成若干关键词;
S4、统计各个关键词的出现频率,选取出现频率较高的若干关键词作为品牌的代表词;
S5、将相似品牌按照匹配程度进行判断;
S6、区分后,对同一品牌进行统一编码;
S7、对品牌进行以上处理,形成规范化的品牌池。
作为优选,在步骤S1中,电商平台品牌信息中仅研究包含品牌名称和品牌ID的情况。
进一步的,在步骤S4中,对关键词进行统计之前,要去除关键词的脏数据,包括标点符号、数字和语气助词。
进一步的,在步骤S5中,首先,当匹配程度为两个品牌选取的关键词有一半以上相同时,即认为是同一个品牌,然后,再通过品牌商品所属行业加以辅助进行进一步的判断。
进一步的,在步骤S5中,首先,当匹配程度为两个品牌选取的关键词有三分之一以上相同时,即认为品牌有较大可能为同一品牌,然后,再通过品牌商品所属行业加以辅助进行进一步的判断。
进一步的,在步骤S5中,首先,当匹配程度为两个品牌选取的关键词有三分之一以下相同时,即认为不属于同一品牌,然后,再通过品牌商品所属行业加以辅助进行进一步的判断。
进一步的,在步骤S6中,根据匹配程度加以区分后,形成带有映射关系的品牌池是指对同一品牌进行统一编码,形成该编码与平台ID、平台名称、平台内品牌名称的对应,并规范化中文英文名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110793276.X/2.html,转载请声明来源钻瓜专利网。