[发明专利]基于多通道异质数据的信息型操纵自动识别方法在审
申请号: | 201910973561.2 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110738570A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 部慧;吴俊杰;唐文金 | 申请(专利权)人: | 北京智信度科技有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06F16/9535;G06F16/25;G06F16/248 |
代理公司: | 11369 北京远大卓悦知识产权代理事务所(普通合伙) | 代理人: | 史霞 |
地址: | 100071 北京市丰台区南四环西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异质数据 预警结果 多通道 监测数据库 监测指标 判别模型 信息感知 多维度 非结构化数据 结构化数据 分类存储 核心指标 监管部门 监管效率 实时监控 主动发现 主动获取 自动识别 自动推送 线索 构建 筛选 输出 金融 打击 帮助 | ||
本发明公开了一种基于多通道异质数据的信息型操纵自动识别方法,包括以下步骤:获取多通道异质数据,将得到的异质数据按照结构化数据和非结构化数据进行分类存储,以构建信息感知和监测数据库,建立多维度监测指标,并建立以多维度监测指标为特征的集成判别模型,采用判别模型对信息感知和监测数据库内的数据进行实时监控,输出一级预警结果,在一级预警结果的基础上,基于核心指标筛选形成二级预警结果;本发明能实现主动获取多通道异质数据到自动推送信息型操纵线索的全过程,以帮助金融监管部门主动发现市场上信息型操纵的可疑线索,及时进行打击,提高监管效率。
技术领域
本发明涉及信息监管方法领域。更具体地说,本发明涉及一种基于多通道异质数据的信息型操纵自动识别方法。
背景技术
信息型操纵指利用信息优势连续买卖,操纵证券交易价格和交易量的市场操纵行为,信息型操纵破坏了市场正常的量价形成机制,扰乱了市场信号,降低了市场效率,具有极大的危害性。
目前信息型操纵行为的实施越来越隐蔽与复杂,涉及多家机构的一系列违法行为的配合,传统的基于账户数据的识别方法难以实现信息型操纵该类新型市场操纵的监管。如何从金融市场海量实时数据中发现实施信息型操纵的可疑线索,已对金融监管部门形成巨大挑战。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种基于多通道异质数据的信息型操纵自动识别方法,其能实现主动获取多通道异质数据到自动推送信息型操纵线索的全过程,以帮助金融监管部门主动发现市场上信息型操纵的可疑线索,及时进行打击,提高监管效率。
为了实现根据本发明的这些目的和其它优点,提供了一种基于多通道异质数据的信息型操纵自动识别方法,包括以下步骤:
获取多通道异质数据,将得到的异质数据按照结构化数据和非结构化数据进行分类存储,以构建信息感知和监测数据库,建立多维度监测指标,并建立以多维度监测指标为特征的集成判别模型,采用判别模型对信息感知和监测数据库内的数据进行实时监控,输出一级预警结果,在一级预警结果的基础上,基于核心指标筛选形成二级预警结果。
优选的是,多通道异质数据获取采用基于Scrapy的可扩展爬虫集群技术、基于Selenium工具的动态网页抓取技术,获取社交媒体、财经媒体、监管机构渠道的数据;对于来自第三方数据库的数据,采用API接口技术获取。
优选的是,构建信息感知和监测数据库是基于高扩展的分布式全文检索引擎数据库Elasticsearch进行结构化数据和非结构化数据的存储得到的。
优选的是,核心指标是指操纵期内股票质押率位于全市场前10%的水平,担保率位于全市场前10%的水平,操纵开始日期和结束日期间的大宗交易次数位于同行业前10%的水平,操纵开始日期和结束日期间的利好公告数目位于同行业前10%的水平、实际控制人持股比例高于50%、质押触及平仓线的提示性公告发生后股价急剧上涨、限售股解禁的提示性公告发生后股价急剧上涨的预警事件。
优选的是,一级预警模型的建立包括以下步骤:收集证监会确切判罚的信息型操纵的股票和同行业的未被证监会判罚的股票构成训练数据集;将各个股票各交易日视为样本点,被判罚股票操纵期内的样本视为正类样本,其它样本视为负类样本;将多维监测指标进行时间维度和空间维度的对比,形成判别维度,再基于Xgboost集成判别模型训练模型;将网格搜索法和五折交叉检验法相结合,确定Xgboost模型中的关键参数,再将训练好的模型运用至全市场样本期内的股票上,得到各股票各交易日实施信息型操纵的概率,若概率大于0.5,判定实施了信息型操纵,输出一级预警结果。
优选的是,关键参数包括学习率、随机采样参数、正则化参数、不平衡参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智信度科技有限公司,未经北京智信度科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910973561.2/2.html,转载请声明来源钻瓜专利网。