[发明专利]一种无监督的密点标注和辅助定密方法在审
申请号: | 202210935013.2 | 申请日: | 2022-08-04 |
公开(公告)号: | CN115481429A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 杜晔;王心蕴;黎妹红;周俊杰 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/35;G06F40/194;G06F40/216;G06F40/289 |
代理公司: | 北京卫平智业专利代理事务所(普通合伙) 11392 | 代理人: | 闫萍 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 标注 辅助 方法 | ||
本发明涉及一种为一种无监督的密点标注和辅助定密方法,包括如下步骤:1)在训练过程之前,针对不同秘密类型分别建立语料统计库;2)从语料统计库中利用算法计算词语置信度,按不同类型进行密级置信度排序,构建密点词库;3)从语料统计库中利用多特征融合的密点句置信度评估方法,提取已定密文档中不同密级的密点句,构建密点句库;4)利用构建的密点词库和密点句库对待定密文档进行密点标注;5)根据待标注文档的定密结果,纳入对应类别,更新词语统计库中相关词语的记录。该方法提高了密点标注的效率和准确率,通过辅助定密有效避免了定密的随机性、主观性。
技术领域
本发明涉及电子文件安全技术领域,具体说是一种无监督的密点标注和辅助定密方法。
背景技术
定密工作作为保密管理工作的基础和源头,其重要性不言而喻。如何实现精准定密是目前保密工作亟待解决的问题。随着信息化手段的不断进步和电子政务系统研发的不断完善,各机关单位分别搭建了自己的办公自动化系统,还有部分单位开展了无纸化办公。国家秘密的产生形式和存储形态已发生较大变化,数字化手段在提升各级单位保密工作效率的同时,也带来了全方面的新挑战。
当前,文件密级的确定大多以人工查找、确定、审核的方式进行,仅依靠于定密人员的保密知识和工作经验,难免存在“主观感觉”定密的现象,导致定密不准、定密尺度把握困难、定密经验无法传承等问题。一方面,由于涉密事项种类繁多,仅通过人工确定,使得定密周期长,定密效率低下。另一方面,一个事项定密的关键是由国家秘密的密点决定的,具有可区分的特点。而当前涉密文件的密级标注方式是对文件全文进行整体标注,机关单位形式上确定的“一项”国家秘密,实质内容上可能包含多项,或者仅有极少数的内容才属于国家秘密。对于这种情况,如果不对密点进行明确标注,简单按照“一项”国家秘密管理,往往会导致层层派生、层层定密、国家秘密过多、管理资源浪费、泄密风险加大等问题。确定国家秘密的密点,就是要筛选出真正具备国家秘密本质属性,泄露后会损害国家安全和利益的关键的、最小化的信息内容,为定密提供依据。因此,在人工定密的基础上,使用计算机技术辅助定密技术进行精准定密及密点标注,实现定密规范化、科学化、数字化,是当前保密工作的迫切需求。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种无监督的密点标注和辅助定密方法,提高了密点标注的效率和准确率,通过辅助定密有效避免了定密的随机性、主观性。
为达到以上目的,本发明采取的技术方案是:
一种无监督的密点标注和辅助定密方法,其特征在于,包括如下步骤:
步骤1,针对不同秘密类型分别建立语料统计库;
步骤2,根据步骤1得到的语料统计库计算词语置信度,按不同类型进行密级置信度排序,构建密点词库;
步骤3,根据步骤1得到的语料统计库,利用多特征融合的密点句置信度评估算法,提取已定密文档中不同密级的密点句,构建密点句库;
步骤4,利用步骤2构建的密点词库和步骤3构建的密点句库对待定密文档进行密点标注;
步骤5,根据步骤4中得到的待标注文档的定密结果,纳入对应类别,更新词语统计库中相关词语的记录。
在上述方案的基础上,步骤2所述根据步骤1得到的预料统计库计算词语置信度的算法为改进的SS3算法,通过函数gv(w,c)计算词语w专属于类别c的置信度,gv的计算涉及三个函数,定义如下式(1):
gv(w,c)=lvσ(w,c)·sgλ(w,c)·snρ(w,c) (1);
上式中gv(w,c)为词语w专属于类别c的置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210935013.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种BiAg纳米合金催化剂及其制备方法和应用
- 下一篇:半导体装置