[发明专利]一种股票资讯智能提取方法在审
申请号: | 201711432710.1 | 申请日: | 2017-12-26 |
公开(公告)号: | CN110020056A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 万雪婷 | 申请(专利权)人: | 武汉楚鼎信息技术有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/957;G06F17/27;G06Q40/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本方法公开了一种通过表格抽取和文本段落相似的方法,来提取个股公告、研报的摘要。采用先分离再合并的策略,分离公告或研报的表格和纯文本,对表格进行结构化处理,对纯文本进行段落划分处理,然后结合预定义的摘要模板(关键词模板),从结构化表格中抽取关键词指标数据并填充模板;从划分段落中寻找与模板最相似的top N个作为摘要候选段落,如果结构化表格中匹配不到关键词,则从候选段落中寻找最相似的段落作为一个子摘要。该方法极大地提高了摘要的准确性,提高编辑人的编辑效率,通过不断反馈提升提取的准确率,最后真正做到自动化。 | ||
搜索关键词: | 纯文本 结构化 结构化处理 表格抽取 股票资讯 指标数据 智能提取 预定义 准确率 填充 匹配 抽取 自动化 文本 反馈 合并 | ||
【主权项】:
1.一种个股公告智能摘要提取方法,观察寻找个股公告特点,发现大多由表格和纯文本组成,同种类型的个股公告表格结构相似,对个股公告采用先分再合的策略,先分离表格和纯文本,分别进行各自独立的处理后,再合并处理之后的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉楚鼎信息技术有限公司,未经武汉楚鼎信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711432710.1/,转载请声明来源钻瓜专利网。