[发明专利]基于文本评论的线上品牌评估方法在审
申请号: | 201510866411.3 | 申请日: | 2015-12-01 |
公开(公告)号: | CN105469282A | 公开(公告)日: | 2016-04-06 |
发明(设计)人: | 王军;甘骏;彭中正;王磊;张迪;肖琴 | 申请(专利权)人: | 成都知数科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/27 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 赵正寅 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 评论 线上 品牌 评估 方法 | ||
技术领域
本发明涉及一种基于文本评论的线上品牌评估方法。
背景技术
近年来,互联网电子商务蓬勃发展,大量网络卖家经过多年积累,很多都走上了原创品牌的道路,比如淘宝等平台已经涌现了不少著名服装品牌。线上品牌的经营时间短,经营范围仅限于线上,对于普通消费者来说,信息太少,了解困难。
一套准确高效的线上品牌评估方案,可以使用户快速了解品牌价值,节约购物时间,准确作出决定。也能迅速识别互联网上滥竽充数的品牌,提高电子商务安全性。然而,现有技术中,并没有解决线上品牌的信息收集问题,也很难准确评估一个品牌的价值和持续性。
因此,一种基于文本评论的线上品牌评估方法,是当前急需解决的问题。
发明内容
本发明的目的在于提供一种基于文本评论的线上品牌评估方法,解决如何收集品牌信息和利用品牌产品相关评论进行识别评估的问题。
为了实现上述目的,本发明采用的技术方案如下:
基于文本评论的线上品牌评估方法,包括以下步骤:
(1)通过网络爬虫程序,收集目标品牌在各大电商网站上商品的相关评论文本;
(2)随机选择部分评论数据分词,并进行标注;
(3)将标注完成的评论数据作为隐马尔可夫算法模型的训练集数据;
(4)通过训练集数据train.csv训练出隐马尔可夫算法模型的参数,并由隐马尔可夫算法来识别商品评论数据,得到结构化的情感描述语料。
(5)进一步处理情感描述语料,保留其中跟商品本身和品牌文化相关的评价性描述;
(6)基于目标品牌旗下商品的评价数据向量化,利用机器学习算法,给予目标品牌登记分类和量化评分;
(7)存储目标品牌评估结果,按时间线定期更新品牌评估。
进一步地,所述步骤(1)的具体方法如下:
(11)分析电商网站网页结构;
(12)按时间爬取目标品牌对应的产品的所有评论信息。
再进一步地,所述步骤(4)中识别评论数据的算法模型的具体方法如下:
(41)调用隐马尔可夫算法模型,输入评论数据的文本语料;
(42)通过隐马尔可夫算法识别出预料中的不同实体词及其对应形容词;
(43)结构化实体词对,作为下一步算法的输入。
进一步地,所述步骤(6)的具体方法如下:
(61)将每一个评价指标作为特征;
(62)每个评价指标的好中差评量化为分值;
(63)目标品牌数据以特征和分值做向量化;
(64)用机器学习算法,得到品牌等级分类;
(65)加权计算品牌每个特征对应的数值,得到量化评分。
本发明与现有技术相比,具有以下优点及有益效果:
本发明解决了线上品牌的信息收集问题,也能准确评估一个品牌的价值和持续性;应用本发明,可以使用户快速了解品牌价值,提升购物体验,准确作出决定;也能迅速识别互联网上滥竽充数的品牌,提高电子商务安全性。
附图说明
图1为本发明整体流程图。
图2为本发明中数据采集的流程示意图。
图3为本发明中建立隐马尔可夫算法模型的流程示意图。
图4为本发明中用户评论语料识别方法的流程示意图。
图5为本发明中品牌数据向量化和分类方法的流程示意图。
图6为本发明中品牌评分按时间线更新方法的流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,本发明的实施方式包括但不限于下列实施例。
实施例
如图1~6所示,基于文本评论的线上品牌评估方法,包括以下步骤:
一、根据目标品牌,进行数据采集。主要集中于淘宝、天猫、京东等大型电商网站商品评论。
如图2所示,数据采集方法如下:
根据品牌分类,确定爬取目标网站;
分析网站http连接,找到数据接口api;
定制多线程爬虫程序,通过对应的api接口获取数据。
二、随机选择部分用户评论数据分词并进行标注:
根据商品品类的标注规则,将该品类的一句商品标题的句子,通过人工识别来标记句子的不同tag的词性。需要注意的是,分词器完成的分词并不完全规范为表示一个完整意思的最小单元,即不是一个tag,若一个tag被分成了两个词,例如:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都知数科技有限公司,未经成都知数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510866411.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:判断用户兴趣度的方法及装置
- 下一篇:一种用户确认交易的方法