[发明专利]一种基于文本的商品分类处理方法及其系统在审
申请号: | 201310701215.1 | 申请日: | 2013-12-18 |
公开(公告)号: | CN103646343A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 王冬杰;朱勇勇 | 申请(专利权)人: | 世纪禾光科技发展(北京)有限责任公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/27 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙) 11417 | 代理人: | 刘元霞 |
地址: | 100088*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 商品 分类 处理 方法 及其 系统 | ||
1.一种基于文本的商品分类处理方法,其特征在于,
从商品数据库提取文本格式商品数据,对商品数据进行分组并进行特征提取,利用训练文件依据概率模型构造出分类器,对商品数据进行分类。
2.根据权利要求1所述的方法,其中所述文本格式商品数据包括:类目信息和商品信息。
3.根据权利要求2所述的方法,其中所述类目信息包括类目ID、类目名称和父类目ID。
4.根据权利要求2所述的方法,其中所述商品信息包括商品ID、商品描述和商品所属类目号。
5.根据权利要求1所述的方法,进一步包括以下步骤:在对商品数据进行分组之前对商品数据进行预处理。
6.根据权利要求4所述的方法,其中对商品数据进行特征提取包括:对商品描述进行机器分词处理,形成包含有效词汇的待分类项。
7.根据权利要求1所述的方法,其中对商品数据进行分组包括将商品数据按比例随机分组为训练文件和测试文件。
8.根据权利要求1所述的方法,其中概率模型为朴素贝叶斯变换。
9.根据权利要求8所述的方法,其中朴素贝叶斯变换计算式为:
贝叶斯全概率公式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪禾光科技发展(北京)有限责任公司,未经世纪禾光科技发展(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310701215.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:人造血管成型机
- 下一篇:变压器绝缘套管的底座