[发明专利]一种基于预训练模型和BiLatticeLSTM的标书关键信息抽取方法在审
申请号: | 202310165102.8 | 申请日: | 2023-02-24 |
公开(公告)号: | CN116127986A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 涂著刚;汤双明;周鸿章 | 申请(专利权)人: | 贵阳高新数通信息有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F16/951;G06N3/0442;G06N3/045;G06N3/08 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 王照伟 |
地址: | 550000 贵州省贵阳市高新*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及信息提取技术领域,具体涉及了一种基于预训练模型和BiLatticeLSTM的标书关键信息抽取方法。包括以下步骤:S100:获取若干标书文件并进行预处理,生成数据集;S200:将数据集输入Bert模型进行预训练,学习标书文件的语义信息,得到BidBert预训练模型S300:将数据集中的关键信息进行标注后输入到BidBert模型,得到标书文件中每个字的字向量,以及关于关键信息的每个词的词向量;S400:根据字向量和词向量提取标书文件中关键信息识别所需的特征向量,将特征向量通过条件随机场进行解码,得到最优参数模型;S500:迭代训练得到标书关键信息抽取最终模型。能够提高标书关键信息提取的准确度及效率。 | ||
搜索关键词: | 一种 基于 训练 模型 bilatticelstm 标书 关键 信息 抽取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵阳高新数通信息有限公司,未经贵阳高新数通信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310165102.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种局部镀锡的方法
- 下一篇:产品推荐方法、装置、设备及存储介质