[发明专利]一种用于识别商品价格异常风险的方法有效
申请号: | 201811450643.0 | 申请日: | 2018-11-30 |
公开(公告)号: | CN110390077B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 雒方祎;谢赟;尹淑平 | 申请(专利权)人: | 上海德拓信息技术股份有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06K9/62;G06Q10/06;G06Q30/00;G06Q30/02 |
代理公司: | 上海湾谷知识产权代理事务所(普通合伙) 31289 | 代理人: | 张恒 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 识别 商品价格 异常 风险 方法 | ||
本发明公开了一种用于识别商品价格异常风险的方法,包括:从各数据平台获取待识别商品种类的各类数据;利用主成因分析法分析待识别商品,得到影响价格最大的要素;计算出待识别商品的申报单价;利用k‑均值算法对申报单价分类,得到各价格区间;将获得影响价格最大的要素作为分析维度,申报单价为分析对象,构建决策树模型;输入待识别商品的属性数据以及待查询价格数据,利用决策树模型分析商品的正常价格属于哪个价格区间,并判断商品价格是否在合理区间内,若不在,则提示该商品存在价格风险。本发明减少人工对行业知识的理解,能快速的对大量商品进行价格风险排查。
技术领域
本发明涉及大数据技术领域,尤其涉及识别商品价格异常风险的方法。
背景技术
近年来,随着互联网大数据和电子商务的不断发展,对于商品的价格定价也日趋透明化。商品价格是其价值的直接体现,目前了解同类商品的价格趋势主要是通过不同渠道商品价格比对分析的方式实现的,这往往需要很丰富的行业相关知识。
发明内容
本发明的目的在于提供一种识别商品价格异常风险的方法,能够针对不同类商品精准识别其的价格区间。
实现上述目的的技术方案是:
一种用于识别商品价格异常风险的方法,包括:
步骤S1,从各数据平台获取待识别商品种类的各类数据;
步骤S2,利用主成因分析法分析待识别商品,得到影响价格最大的要素;
步骤S3,计算出待识别商品的申报单价;
步骤S4,利用k-均值算法对申报单价分类,得到各价格区间;
步骤S5,将获得影响价格最大的要素作为分析维度,申报单价为分析对象,构建决策树模型;
步骤S6,输入待识别商品的属性数据以及待查询价格数据,利用决策树模型分析商品的正常价格属于哪个价格区间,并判断商品价格是否在合理区间内,若不在,则提示该商品存在价格风险。
优选的,所述的步骤S2,包括:
步骤S21,组织数据集:建立一组有M个变量的观察数据,其中,M为商品的维度;进一步将数据整理成一组具有N个向量的数据集,每个向量都代表M个变量的单一观察数据;其中,X1…XN为列向量,其中每个列向量有M行;将列向量放入M×N的数据矩阵X里;
步骤S22,计算经验均值:对每一维m=1,...,M计算经验均值;将计算得到的均值放入一个M×1维的经验均值向量u中:
其中,n=1,2…,N。
步骤S23,计算平均偏差:
从数据矩阵X的每一列中减去经验均值向量u;
将平均减去过的数据存储在M×N矩阵B中;
B=X-uh;
其中,h是一个1×N的行向量;
h[n]=1;其中,n=1,2…,N。
步骤S24,求协方差矩阵:从矩阵B中找到M×M的经验协方差矩阵C:
其中,B*为矩阵B的共轭转置矩阵,表示期望值;是最外层运算符;
步骤S25,计算矩阵C的特征向量V:
V-1CV=D
其中,D是C的特征值对角矩阵;V-1为特征向量的逆向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德拓信息技术股份有限公司,未经上海德拓信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811450643.0/2.html,转载请声明来源钻瓜专利网。