[发明专利]基于深度学习的敏感信息查询方法在审
申请号: | 202011482836.1 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112597770A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 綦大勇;梁媛媛;王琦;朱霖;邓晓露;陈华 | 申请(专利权)人: | 盐城数智科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06N3/04;G06N3/08;G06F16/33 |
代理公司: | 盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙) 32454 | 代理人: | 邵珑;葛潇敏 |
地址: | 224199 江苏省盐城市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 敏感 信息 查询 方法 | ||
1.一种基于深度学习的敏感信息查询方法,其特征在于包括如下步骤:
步骤1,对待查询文本进行分词处理,然后转换为特征向量;
步骤2,将步骤1得到的特征向量输入神经网络模型中,输出与敏感词词库的相似度,若该相似度高于阈值,则判定该待查询文本中包含敏感词,并输出相应的敏感词结果。
2.如权利要求1所述的基于深度学习的敏感信息查询方法,其特征在于:所述步骤1中,还对分词处理后的结果进行人工抽查复核。
3.如权利要求1所述的基于深度学习的敏感信息查询方法,其特征在于:所述步骤1中,根据分词规则对待查询文本进行分词处理,该分词规则为在训练过程中满足置信度要求的分词规则。
4.如权利要求1所述的基于深度学习的敏感信息查询方法,其特征在于:所述步骤2中,所述神经网络模型包括输入层、隐藏层和输出层,其中,输入层的输入为待查询文本进行分词处理后得到的特征向量,输出层的输出为前述特征向量与敏感词词库的相似度。
5.如权利要求4所述的基于深度学习的敏感信息查询方法,其特征在于:所述神经网络模型的代价函数采用交叉熵损失函数,采用随机梯度下降方法进行训练。
6.如权利要求1所述的基于深度学习的敏感信息查询方法,其特征在于:所述步骤2中,敏感词词库包含现有敏感词词库及自定义的敏感词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城数智科技有限公司,未经盐城数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011482836.1/1.html,转载请声明来源钻瓜专利网。