[发明专利]基于文章实体词依赖关系的金融领域篇章级事件抽取方法有效
申请号: | 202110648901.1 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113255321B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 王海涛;许浩;刘智;周丹;孙婉琪;马雪环 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/216;G06F40/295 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文章 实体词 依赖 关系 金融 领域 篇章 事件 抽取 方法 | ||
本发明公开了一种基于文章实体词依赖关系的金融领域篇章级事件抽取方法,设计了一种结构化依赖自注意力机制模块,该模块将文章中的实体词依赖关系作为事件抽取深度学习模型的一种输入数据,与词级、语句级的语言特征结合以提升深度学习模型在进行金融事件抽取时的对事件触发词和事件论元的预测精度。此外,本发明在中文金融事件抽取任务中,首次提出8种不同类型的实体关系,用于统一化表示文章中的实体依赖关系。本发明同时构建了一套金融领域的层次事件关系,用于模型区分相似的事件类型。本发明从系统输入到系统输出,逻辑结构清晰,层次分明,系统实现细节详尽,实现了一种端到端的系统闭合工作方式,极易落地和大规模应用。
技术领域
本发明属于人工智能与金融的交叉领域,尤其涉及一种基于文章实体词依赖关系的金融领域篇章级事件抽取方法。
背景技术
现阶段人工智能正逐步涉足各个行业领域,并为其发展提供了新的可能。金融领域,作为实时数据产生最大的行业之一,同样步入“AI+金融”时代。作为金融领域的重要任务之一,从重大金融公告/新闻中,抽取出具有价值的重大金融事件是非常有意义与价值的。目前已知的篇章级金融事件抽取方法以基于传统规则、传统机器学习范式为技术基础的事件抽取系统,存在以下不足:
1)目前大部分的金融事件抽取方法大多基于单语句的事件抽取,无法处理篇章级、多语句的金融事件抽取;
2)现有的篇章级金融事件抽取方法并没有考虑实体之间长依赖之间关系信息;例如,同一实体在不同语句中出现代表的含义,不同实体同时出现在同一语句中代表的语义信息等。而实体在不同语境或同一语境中出现所代表的含义,构成了某一实体的丰富语义信息,对于事件抽取任务而言,是必不可少的语义特征。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于文章实体词依赖关系的金融领域篇章级事件抽取方法。本发明将人工智能方法应用于金融领域内,针对上市公司发布的重大公告及新闻,自主提取重大事件并形成结构化事件表示。
本发明的目的是通过以下技术方案来实现的:一种基于文章实体词依赖关系的金融领域篇章级事件抽取方法,包括以下步骤:
(1)实体词抽取:将中文文章转换为包含n个实体的实体集
(2)实体词向量映射模块:使用Embedding映射方法将实体集的汉语实体映射为向量空间的实体词向量集,实体词向量为:
其中,
(3)候选论元集抽取:利用基于预训练语言模型的序列标注方法抽取文章的候选论元集
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110648901.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大理石喷砂磨砂装置
- 下一篇:一种缓解体力疲劳的中药组合物及其应用