[发明专利]基于小样本学习的网络协议实体抽取方法与系统在审
申请号: | 202110660203.3 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113343697A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 李守斌;常志远;胡军;王青 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/289;G06K9/62;G06N20/10 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于小样本学习的网络协议实体抽取方法与系统,该方法仅需要少量的带标注的RFC文档样本,即可实现对大量未标注的RFC文档进行网络协议实体抽取且保持较高的识别精度。该方法首先尽可能多的挖掘RFC文档中潜在网络协议实体,其次对已识别的潜在的网络协议实体进行精准再识别。通过实验表明,利用5篇人工标注的RFC文档来训练本发明的模型,网络协议实体抽取的准确率达到了88.4%,该方法较现有方法在网络协议实体抽取方面具有较高的精度和较好的强鲁棒性,同时对未在训练集中出现过的网络协议实体同样具有较好的辨识能力。本发明有助于在未来实现网络协议的自动化分析,为计算机网络方面的研究提供帮助。 | ||
搜索关键词: | 基于 样本 学习 网络 协议 实体 抽取 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110660203.3/,转载请声明来源钻瓜专利网。