[发明专利]基于正则化的信息分析方法在审
申请号: | 201711294493.4 | 申请日: | 2017-12-08 |
公开(公告)号: | CN107992450A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 徐娇 | 申请(专利权)人: | 成都谷问信息技术有限公司 |
主分类号: | G06F17/15 | 分类号: | G06F17/15 |
代理公司: | 成都路航知识产权代理有限公司51256 | 代理人: | 李凌 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 正则 信息 分析 方法 | ||
技术领域
本发明涉及计算机技术领域,具体涉及基于正则化的信息分析方法。
背景技术
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。
然而现有的数据信息分析方法中,由于无法对数据中所有的项目进行准确确认,所以得出的分析结果中,非常容易出现过拟合,即将不同类的相似项归为一类,影响数据分析结果。
发明内容
本发明所要解决的技术问题是现有的数据信息分析方法中,由于无法对数据中所有的项目进行准确确认,所以得出的分析结果中,非常容易出现过拟合,即将不同类的相似项归为一类,影响数据分析结果,目的在于提供基于正则化的信息分析方法,解决上述问题。
本发明通过下述技术方案实现:
基于正则化的信息分析方法,包括以下步骤:S1:对数据进行线性回归拟合产生拟合函数;S2:根据拟合函数和数据得出经验风险;S3:设置正则化项;S4:将正则化项和经验风险求和得到结构风险;S5:根据结构风险对拟合函数进行修正。
现有技术中,由于无法对数据中所有的项目进行准确确认,所以得出的分析结果中,非常容易出现过拟合,即将不同类的相似项归为一类,影响数据分析结果。本发明应用时,先对数据进行线性回归拟合产生拟合函数;再根据拟合函数和数据得出经验风险;然后设置正则化项;再然后将正则化项和经验风险求和得到结构风险;再然后根据结构风险对拟合函数进行修正。本发明通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。
进一步的,所述正则化项采用多维函数。
进一步的,所述拟合函数采用高阶多项式。
进一步的,所述高阶多项式的项数为五个及以上。
进一步的,步骤S5还包括以下子步骤:得出结构风险的L1范数,并根据L1范数对拟合函数进行修正。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于正则化的信息分析方法,通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
本发明基于正则化的信息分析方法,包括以下步骤:S1:对数据进行线性回归拟合产生拟合函数;S2:根据拟合函数和数据得出经验风险;S3:设置正则化项;S4:将正则化项和经验风险求和得到结构风险;S5:根据结构风险对拟合函数进行修正。所述正则化项采用多维函数。所述拟合函数采用高阶多项式。所述高阶多项式的项数为五个及以上。步骤S5还包括以下子步骤:得出结构风险的L1范数,并根据L1范数对拟合函数进行修正。
本实施例实施时,先对数据进行线性回归拟合产生拟合函数;再根据拟合函数和数据得出经验风险;然后设置正则化项;再然后将正则化项和经验风险求和得到结构风险;再然后根据结构风险对拟合函数进行修正。本发明通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都谷问信息技术有限公司,未经成都谷问信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711294493.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于低秩表示的地铁异常流量检测方法
- 下一篇:双芯皮线分支器
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置