[发明专利]一种基于大数据的鞋子流行趋势预测系统及方法有效
| 申请号: | 202210372074.2 | 申请日: | 2022-04-11 |
| 公开(公告)号: | CN114912941B | 公开(公告)日: | 2023-08-11 |
| 发明(设计)人: | 周晋;陈筱雨;曾杰 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06Q30/0202 | 分类号: | G06Q30/0202;G06V10/74;G06V10/75;G06V10/56;G06V10/50;G06F40/242;G06F40/289;G06F16/903;G06N3/0442;G06N3/048 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610065 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 鞋子 流行 趋势 预测 系统 方法 | ||
1.一种基于大数据的鞋子流行趋势预测方法,其特征在于:具体的大数据流行趋势预测方法为:
步骤一:图像解析单元解析鞋子图像元素;
步骤二:获取鞋子品牌,人工编制添加鞋子品牌到词典;获取鞋子标题输入元素解析模块,所述鞋子标题输入急速分词,所述急速分词基于正向最大匹配算法分词标题抓取元素;
步骤三:剩余的标题字符串输入新词词典,所述新词词典基于N-gram模型将获得的鞋子标题分词从而获得元素,将已获得的元素添加到词典中,并将获得的元素输入数据清理单元;
步骤四:数据清理单元筛选和重组鞋子元素,将单位时间重复的鞋子元素的流行度累计后,所述流行度归一化输入元素预测模块;
所述数据清理单元统计鞋子元素的重复度,将所述鞋子元素以重复度为序排序,筛选重复度前N个的元素并剔除Y年内没有重复的元素;
基于销量获得鞋子元素的流行度,计算公式为:
P=A*S
其中,A表示鞋子元素,S表示鞋子元素对应的单位时间销售量,P表示鞋子元素的流行度;
步骤五:所述元素预测模块基于LSTM算法进行流行度预测,输入不同时间步长的鞋子元素的流行度P,所述元素预测模块最终输出前N个的元素的不同时间的流行度;
步骤六:数据分析模块提取不同时间步长的预测结果,输出不同时间步长的鞋子流行趋势;
所述图像解析单元基于HSV空间获取颜色直方图表达鞋子的色彩搭配,具体步骤为:
获取鞋子基于HSV空间的颜色直方图;
所述颜色直方图均值滤波;
设立参考色,计算颜色直方图与参考图之间的相似值,具体计算公式为:
其中,P表示所述颜色直方图和参考图之间的相似值;
设置分类区间范围,在同一分类区间内图像为同一色彩搭配。
2.一种基于大数据的鞋子流行趋势预测系统,其特征在于:该系统包括元素解析模块、元素预测模块和数据分析模块,所述元素解析模块解析鞋子的元素组成,并且统计元素的重复度从而获得元素的流行度,将元素的流行度输入元素预测算法,获取元素流行趋势,将所述元素流行趋势输入数据分析模块,不同维度的解读流行元素,获得鞋子的流行趋势;
所述元素解析模块包括图像解析单元、标题分词单元、关键词提取单元和数据清洗单元,所述图像解析单元解析鞋子图像元素,所述图像元素包括线条语言和色彩搭配,所述标题分词单元分词鞋子标题获取鞋子元素,所述关键词提取单元提取鞋子详情页的关键词获取鞋子元素,所述数据清洗单元清洗鞋子元素数据,统计鞋子元素的重复度,输出鞋子元素的流行度;
所述图像解析单元基于HSV空间获取颜色直方图表达鞋子的色彩搭配,计算颜色直方图的相似值,认定在阈值以内的颜色直方图为同一色彩搭配;
所述图像解析单元基于Roberts交叉算子算法获得鞋子的线条语言作为元素,基于HOG特征提取算法计算鞋子的线条语言的梯度统计直方图,将梯度直方图转化为向量,通过余弦相似度划分种类。
3.根据权利要求2所述的一种基于大数据的鞋子流行趋势预测系统,其特征在于:所述标题分词单元包括急速分词和新词词典,所述急速分词基于正向最大匹配算法,取词典中最长词为最大匹配长度m,截取鞋子标题的前m位与词典匹配,如果匹配成功输出截取鞋子标题的前m位至鞋子元素;如果词典无法匹配,截取鞋子标题的前m-1位与词典匹配,依次循环直至匹配成功,如果截取鞋子标题的字段等于1,输出鞋子标题的第一位字符至新词,剩余的鞋子标题依次循环直至鞋子标题长度小于等于1;
所述新词字段输入新词词典,所述新词词典分词新词字段从而获得元素,且已获得的元素添加到词典中,人工编制添加鞋子品牌到所述词典;
所述新词词典模型公式为:
其中,P为概率,m为词的个数,wm为输入语句中的词,i为词的位置;
其中,c(wi-1,wi)表示二元组(wi-1,wi)在训练语料库中出现的次数,c(wi)表示词wi在训练预料库中出现的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210372074.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





