[发明专利]一种获取产品信息的方法及装置在审
申请号: | 201210190616.0 | 申请日: | 2012-06-11 |
公开(公告)号: | CN103488635A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 唐沐;陈妍;樊中一;骆玘;孙鹏;牟伟成;郭洪伟;黄利贤;吕虹;胡炜;苏楠;张弘 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 温青玲 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 产品信息 方法 装置 | ||
1.一种获取产品信息的方法,其特征在于,所述方法包括:
从微博和/或论坛采集用户评论的与产品相关的原始信息;
对采集的原始信息进行过滤;
对过滤后的信息进行分析,获取与所述产品相关的热点关注词和/或口碑词;
对所获取的热点关注词和/或口碑词进行归类,并对归类后的热点关注词和/或口碑词进行统计和分析,获取所述产品信息的分析报告。
2.如权利要求1所述的方法,其特征在于,所述对采集的原始信息进行过滤前还包括:
将采集的所述原始信息按其内容特征进行分类后存储。
3.如权利要求1所述的方法,其特征在于,所述过滤包括去重处理以及去除无效信息的处理。
4.如权利要求1所述的方法,其特征在于,所述对过滤后的信息进行分析,获取与所述产品相关的热点关注词和/或口碑词包括:
根据所述产品和/或其竞争产品的通用名词对过滤后的信息进行分词处理,获得处理结果。
5.如权利要求4所述的方法,其特征在于,选取处理结果中达到一定出现频次的词语,通过预存的词库对选取结果进行筛选,获取与所述产品相关的热点关注词和/或口碑词。
6.如权利要求1所述的方法,其特征在于,所述方法在还包括:
从微博和/或论坛采集用户评论的与所述产品相关的竞争产品的信息。
7.一种获取产品信息的装置,其特征在于,所述装置包括:
信息采集模块,用于从微博和/或论坛采集用户评论的与产品相关的原始信息;
信息过滤模块,用于对所述信息采集模块采集的原始信息进行过滤;
信息分析模块,用于对所述信息过滤模块过滤后的信息进行分析,获取与所述产品相关的热点关注词和/或口碑词;
结果获取模块,用于对所获取的热点关注词和/或口碑词进行归类,并对归类后的热点关注词和/或口碑词进行统计和分析,获取所述产品信息的分析报告。
8.如权利要求7所述的装置,其特征在于,所述装置包括:
信息存储模块,用于对采集的原始信息进行过滤前,将采集的所述原始信息按其内容特征进行分类后存储。
9.如权利要求7所述的装置,其特征在于,所述过滤包括去重处理以及去除无效信息的处理。
10.如权利要求7所述的装置,其特征在于,所述信息分析模块包括:
处理模块,用于根据所述产品和/或其竞争产品的通用名词对过滤后的信息进行分词处理,获得处理结果。
11.如权利要求10所述的装置,其特征在于,所述信息分析模块还包括:
获取模块,用于从所述处理模块的处理结果中选取达到一定出现频次的词语,通过预存的词库对选取结果进行筛选,获取与所述产品相关的热点关注词和/或口碑词。
12.如权利要求7所述的装置,其特征在于,所述信息采集模块还用于,从微博和/或论坛采集用户评论的与所述产品相关的竞争产品的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210190616.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:单频率双芯片一卡通
- 下一篇:一种机械能转换为电能的鼠标