[发明专利]公告标题生成方法、装置、终端以及介质在审
| 申请号: | 202211584172.9 | 申请日: | 2022-12-09 |
| 公开(公告)号: | CN115934892A | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 杨杰;潘康 | 申请(专利权)人: | 深圳市富途网络科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/332;G06F40/216;G06F40/109;G06F40/189 |
| 代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 公告 标题 生成 方法 装置 终端 以及 介质 | ||
本申请属于金融技术领域,尤其涉及一种公告标题生成方法、装置、终端以及介质。该公告标题生成方法包括:根据文件类型在组成公告的文件中确定待分析文件;将所述待分析文件的文本内容转换为行向量集合;根据字体类型和排版风格对所述行向量集合内的行向量进行筛选,以确定目标行向量;基于所述目标行向量生成公告标题。如此,本申请通过对公告文件的文本内容进行文本分析,以在公告文件中获取关键内容作为公告标题,从而确保该公告标题能够准确地反映公告内容,提高了用户获取公告内容的便捷性。
5技术领域
本发明涉及金融技术领域,尤其涉及一种公告标题生成方法、装置、终端以及介质。
背景技术
0标题对于一篇资讯来说至关重要,从资讯本身的角度来说,标题通常为资讯内容最精炼的表达;从用户体验的角度来说,用户在浏览资讯过程中可通过标题快速了解到该资讯内容。
然而,当今的股票证券市场,股票公告标题经常无法准确地反映对应的股票公告内容,例如美股公告入库后,通常会取美国证券交易委员会接收到5的对应财务报表或者其他正式文件,即SEC文件的标题作为公告标题进行展示,但SEC文件标题属于公告类型,无法很好地反映公告内容,从而影响了用户获取公告内容的便捷性。
因此,如何为股票公告生成能够准确地反映公告内容的标题,是金融技术领域亟需解决的难题。
发明内容
本发明的主要目的在于提供一种公告标题生成方法、装置、终端以及介质,旨在通过对公告文件的文本内容进行文本分析,以在公告文件中获取关键内容作为公告标题,从而确保该公告标题能够准确地反映公告内容。
5根据本申请实施例的一方面,公开了一种公告标题生成方法,包括:
根据文件类型在组成公告的文件中确定待分析文件;
将所述待分析文件的文本内容转换为行向量集合;
根据字体类型和排版风格对所述行向量集合内的行向量进行筛选,以确定目标行向量;
0基于所述目标行向量生成公告标题。
在本申请的一些实施例中,基于以上技术方案,将所述待分析文件的文本内容转换为行向量集合,包括:
检测所述待分析文件包含的标签信息;
根据所述标签信息遍历递归所述待分析文件的文本内容,以将所述文本内容转换为多个行向量;
基于所述多个行向量生成行向量集合。
在本申请的一些实施例中,基于以上技术方案,根据所述标签信息遍历递归所述待分析文件的文本内容,以将所述文本内容转换为多个行向量,包括:
根据所述标签信息确定所述待分析文件的文本内容对应的主体部分;
基于预设分段标签和预设表格标签遍历递归所述主体部分,以将所述文本内容转换为多个行向量。
在本申请的一些实施例中,基于以上技术方案,根据文件类型在组成公告的文件中确定待分析文件,包括:
对组成公告的文件检测文件类型;
根据所述文件类型在组成公告的文件中确定目标附加文件;
将所述目标附加文件确定为待分析文件。
在本申请的一些实施例中,基于以上技术方案,根据文件类型在组成公告的文件中确定目标附加文件,包括:
根据文件类型在组成公告的文件中确定附加文件;
将所述附加文件与预设优先级列表进行比对得到比对结果,所述预设优先级列表用于反映在多种类型的附加文件中能够获取到合适的公告标题分别对应的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市富途网络科技有限公司,未经深圳市富途网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211584172.9/2.html,转载请声明来源钻瓜专利网。





