[发明专利]一种基于机器学习的财务报表数据自动识别和分析方法在审

专利信息
申请号: 201910820809.1 申请日: 2019-08-29
公开(公告)号: CN110543475A 公开(公告)日: 2019-12-06
发明(设计)人: 李梓成;刘广洲;杨超凡 申请(专利权)人: 深圳市原点参数科技有限公司
主分类号: G06F16/215 分类号: G06F16/215;G06F16/25;G06F16/33;G06F16/35;G06F17/22;G06Q10/06;G06Q40/00
代理公司: 11754 北京鱼爪知识产权代理有限公司 代理人: 曹治丽<国际申请>=<国际公布>=<进入
地址: 518033 广东省深圳市福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于机器学习的财务报表数据自动识别和分析方法,经由数据抽取模块进行数据抽取,通过数据清洗及文本聚合模块对文本内容进行筛选和组合,使之抽取的单个信息能形成完整的数据块或者文本块,然后对于所形成的数据块进行文档结构的分析和信息点的标注,由财务信息格式化模块提取其中的财务数据,然后通过检查之后输出财务数据。无法通过信息完整度检查的数据,由人工辅助子系统进行人工标记和纠正,并将标记和纠正的数据反馈给知识库进行大数据学习,从而训练文档结构及信息标注模块、财务信息格式化模块和信息完整度检查模块进行信息系统的训练升级,使之信息处理更加完善并形成数据解析闭环。
搜索关键词: 格式化 财务数据 财务信息 文档结构 信息完整 数据块 知识库 闭环 财务报表数据 数据抽取模块 信息标注模块 单个信息 基于机器 检查模块 聚合模块 模块提取 人工标记 人工辅助 数据抽取 数据反馈 数据解析 数据清洗 文本内容 信息处理 信息系统 自动识别 大数据 文本块 信息点 纠正 标注 抽取 分析 检查 文本 筛选 输出 学习 升级
【主权项】:
1.一种基于机器学习的财务报表数据自动识别和分析方法,其特征在于:所述方法应用于财务报表数据识别和分析系统,从解析最原始的数据开始,利用机器学习算法对信息进行分析和抽取,并且借助人工辅助子系统对极端情况进行处理,并积累标签数据使整个数据解析过程形成闭环。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市原点参数科技有限公司,未经深圳市原点参数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910820809.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top