[发明专利]上市公司非定期公告的分类方法、装置及存储介质在审
申请号: | 201910936610.5 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110750643A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 李炜;赵伟;王海菲;王辉 | 申请(专利权)人: | 上证所信息网络有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 11694 北京万思博知识产权代理有限公司 | 代理人: | 刘冀 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 特征关键词 公告文本 自动化 机器学习模型 准确度 存储介质 分类流程 文本解析 准确率 申请 | ||
本申请公开了一种上市公司非定期公告的分类方法、装置及存储介质。其中,上市公司非定期公告的分类方法,包括:获取待分类的非定期公告的公告文本;对所述提取所述公告文本的特征关键词;以及利用预先训练的机器学习模型,根据所提取出的特征关键词,确定所述非定期公告的类别。通过这种方式,提高上市公司非定期公告分类的准确率,自动化公告分类流程,提高了上市公司非定期公告的自动化文本解析的精度和准确度。
技术领域
本申请涉及信息的分类领域,特别是涉及一种上市公司非定期公告的分类方法、装置及存储介质。
背景技术
沪市与深市每日产生的非定期公告数量巨大,涵盖主板所有上市公司企业经营变动信息,而且包含的种类繁多且内容复杂,比如重大事项公告,交易提示公告,配股公告,增发公告等等。不断增加的公告数量对于投资人对于信息的获取以及监管等方面都带来了极大的挑战,想要在这些海量的非定期公告书中通过传统的人工方式高效准确地找到所需要的信息已经变得十分困难。因此,公告的自动化解析正在积极被用于金融分析和金融监管领域。作为公告解析的前序步骤,公告的精准分类是公告正确解析的基础。
上市公司信息披露的种类繁多,如上交所将上市公司公告分为35大类,376个小类(上海证券交易所,2013)。传统的人工非定期公告分类会依据公告标题等进行粗略的划分。然而,由于公告的多样性,往往存在标题相似,而公告实质内容应分属不同类别的情况。因此,非定期报告的分类,应不仅仅依赖于其标题,而须要根据其发布内容进行更加精细的类别划分。然而当前并无实际有效的非定期公告分类标准去依据实行。因此,如何对上市公司非定期公告进行细粒度分类是目前需要解决的技术问题。
现有的公告分类技术,通常基于规则,根据不同非定期公告所特有的领域行业知识,建立不同公告类型的关键词词库,根据关键词词库来判断其公告所属的类别。然而,这样的分类粒度较粗,只能对几种类型的公告分类具有较高精度,对于细分公告类别的分类精度较差。同时,为了提高精度,需要技术人员撰写大量规则才能覆盖不同类别的公告中的特征,效率低下。
机器学习算法在文本分类上有着广泛应用。然而有监督分类方法需要大量的标注数据作为训练集,而目前的上市公司企业非定期公告类别较多,不同的人判断标准无法统一,因此基于机器学习的公告分类方法仍需要不断探索提高。
针对上述的现有技术中存在的基于规则的非定期公告的分类方法在进行细粒度分类时精度不足以及效率低下的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种上市公司非定期公告的分类方法、装置及存储介质,以至少解决现有技术中存在的基于规则的非定期公告的分类方法在进行细粒度分类时精度不足以及效率低下的技术问题。
根据本公开实施例的一个方面,提供了一种上市公司非定期公告的分类方法,包括:获取待分类的非定期公告的公告文本;提取公告文本的特征关键词;以及利用预先设置的机器学习模型,根据所提取出的特征关键词,确定非定期公告的类别。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本公开实施例的另一个方面,还提供了一种上市公司非定期公告的分类装置,包括:获取模块,用于获取待分类的上市公司非定期公告的公告文本;提取模块,用于提取公告文本的特征关键词;以及确定模块,用于利用预先训练的机器学习模型,根据所提取出的特征关键词,确定非定期公告的类别。
根据本公开实施例的另一个方面,还提供了一种上市公司非定期公告的分类装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取待分类的非定期公告的公告文本;提取公告文本的特征关键词;以及利用预先训练的机器学习模型,根据所提取出的特征关键词,确定非定期公告的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上证所信息网络有限公司,未经上证所信息网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910936610.5/2.html,转载请声明来源钻瓜专利网。