[发明专利]一种基于主动学习的电力预案文本标注方法在审
申请号: | 202010891711.8 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112232063A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 杨群;袁鑫;刘绍翰 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06K9/62;G06N3/04;G06N3/08;G06Q50/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于主动学习的电力预案文本标注方法。方法包括:针对电力预案文本的预聚类方法,用于将原始电力预案文本数据进行分类,使类中数据呈现语句结构和字词上的相似性;针对电力预案文本序列标注的主动学习样本选择策略,策略参考样本的信息性和代表性,可用于迭代时挑选出最合适的样本交予人工标注并加入训练集,以最大化提升模型的性能;针对电力预案文本序列标注的神经网络预测结果结构化输出方法,可结构化输出模型对文本的预测标签和各标签的概率,该概率可用于挑选新样本。采用本发明后只需使用一半的数据集即可达成与使用完整数据集一样的模型训练效果,减少了标注数据所需的人力物力。 | ||
搜索关键词: | 一种 基于 主动 学习 电力 预案 文本 标注 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010891711.8/,转载请声明来源钻瓜专利网。