[发明专利]一种基于改进马尔科夫链的店铺信用风险预测方法在审
申请号: | 201811430043.8 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109345272A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 徐新胜;唐敬文 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 店铺 信用 风险预测 中文自然语言处理 马尔科夫链 马尔科夫链模型 预处理 电子商务安全 商品指定信息 网络爬虫技术 多维度数据 安全监管 电子商务 店铺商品 评论文本 情感分析 综合评价 改进 语料库 构建 数据库 保存 融合 预测 监管 优化 | ||
本发明提出了一种基于改进马尔科夫链的店铺信用风险预测方法,具体步骤如下:1,店铺语料库获取:利用网络爬虫技术在电商平台爬取店铺详情及店铺的商品指定信息并保存到数据库中;2,中文自然语言处理:首先对店铺商品的评论文本进行预处理,然后利用中文自然语言处理工具进行情感分析,得到情感得分;3,信用风险预测:根据多维度数据融合,设计出店铺信用综合评价表,计算出每个店铺的信用得分,进一步,构建出改进的马尔科夫链模型,根据此模型完成对店铺的信用值预测,最后,根据信用值得分得到店铺的风险等级。这就为优化电子商务店铺安全监管工作,提高监管质量和电子商务安全创造了条件。
技术领域:
本发明涉及到商品质量管理领域,尤其涉及一种基于改进马尔科夫链的店铺信用风险预测方法。
背景技术:
近年来,以互联网为依托进行商品和服务交易的电子商务蓬勃发展,极大提高了经济运行的质量和效率,改变了人类的生产生活方式。2016年,全球电子商务市场规模超过25万亿美元,成为世界经济的亮点和新增长点。我国商务部的最新统计显示,2017年我国网络零售额达到7.18万亿元,其中实物商品的网上零售额达到5.48万亿元,网络零售对消费的拉动作用进一步增强。但是,由于电商平台质量管理模式与传统企业质量管理模式存在显著差异,现有的线下质量管理经验并不能直接被电商质量监管直接采用。近年来,质检总局把商品质量作为电子商务健康发展的生命线,积极探索包容创新的审慎监管措施,推动建立了“标准引领、风险监测、网上抽查、源头追溯、属地查处、信用管理”的电子商务商品质量监管新机制。
另据了解,目前我国正在开展的电子商务产品质量监管标准化工作涉及基础通用、质量管理、质量诚信、质量监管、质量风险防控等领域,电商质量标准体系建设有序推进。2017年12月底,质检总局和国家标准委还发布了3项电子商务方面标准,分别是《电子商务平台商家入驻审核规范》《电子商务平台产品信息展示要求》和《电子商务质量管理术语》,将在2018年内相继实施。这些标准对电子商务平台商家入驻制定了资质要求,对审核内容、结果反馈和商家信息更新等作出规定,对网络平台上产品信息展示的基本原则、展示的内容和方式提出了明确要求,让网上发布的产品信息更接近消费者的实体感受,使消费者的网购体验更真实、更安心。
电子商务在发展过程中,非常重要的一个就是信用。虚拟经济有着较快的流动速度和较高的风险,如果信用危机出现,那么就会在较大程度上冲击到实体的贸易体系。因此,就需要充分研究电子商务信用风险。如今,国内在研究电子商务信用预测方面还处于起步阶段,通常将案例研究和定性描述方法结合应用,并未构建相关的风险预测模型。消费者在网络上很难辨识店铺是否值得信任及店铺里面商品质量是否如描述一样,因此非常容易购买到这些问题店铺的商品,如果可以通过对网络上海量的舆情数据和质量检测数据的分析,利用数据挖掘技术,对网上店铺进行信用值风险的预测,就可以有效的避免由店铺关闭、商品下架引发的各种问题。因此需要质检部门采取有效的监管措施来监督企业提高商品质量水平,同时也要加强电子商务平台的管理。
发明内容:
为了能快速、有效地从海量,多源异构的有关店铺的信息中分析出其存在的问题信用的店铺,本发明提供了一种基于改进马尔科夫链的店铺信用风险预测方法,是对传统电子商务质量管理方法的一种补充。
本发明解决其技术问题所采用的技术方案如下述内容:
一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:该方法包括下述步骤:
步骤1:语料库获取:利用网络爬虫软件,制定爬取规则,抓取与指定店铺相关的店铺信息及店铺的相关商品的评论文本,以结构化形式保存到数据库中;
步骤2:中文自然语言处理:首先对抓取的商品评论数据进行数据清理操作,然后利用中文自然语言处理工具对评论语料分别进行初次分词及词性标注、关键词及语气词的识别等预处理以获得结构化的情感分析结果并保存到数据库中,进一步,将这些关键词及语气词与词库中关键字及语气词进行对比,计算得到评论真实度值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811430043.8/2.html,转载请声明来源钻瓜专利网。