[发明专利]一种提升金融风险防控领域舆情实体识别率的方法在审
申请号: | 202010550784.0 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111695346A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 郑杰文 | 申请(专利权)人: | 广州商品清算中心股份有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/36;G06F16/953;G06F16/955;G06N3/04;G06N3/08 |
代理公司: | 新余市渝星知识产权代理事务所(普通合伙) 36124 | 代理人: | 张瑜生 |
地址: | 511455 广东省广州市南沙区海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及互联网技术领域,具体是一种提升金融风险防控领域舆情实体识别率的方法,包括以下步骤:S1.收集通用领域语料,诸如百度百科,维基百科,人民日报等,对语料中的通用实体进行BIO标签标注;S2.收集金融领域语料,只对语料中的金融简称、金融新实体等专用实体进行BIO标签标注,不对通用实体进行BIO标注;S3.选取深度学习NLP预训练模型,诸如bert预训练模型等;S4.挑选适合NER任务的下游模型,诸如bilstm_crf模型等。本发明的有益效果为利用基于深度学习的方法,通过分别训练基于NLP预训练模型的通用领域NER模型和基于NLP预训练模型的专用领域NER模型,再将二者抽取结果进行融合,从而提高金融领域舆情实体识别的抽取率。 | ||
搜索关键词: | 一种 提升 金融风险 领域 舆情 实体 识别率 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州商品清算中心股份有限公司,未经广州商品清算中心股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010550784.0/,转载请声明来源钻瓜专利网。