[发明专利]基于同义词扩展和标签传递的文本无载体信息隐藏方法有效
申请号: | 202110403886.4 | 申请日: | 2021-04-15 |
公开(公告)号: | CN112989809B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 张祯;倪嘉铭;姚晔;吴国华;王玉娟;袁理锋;任一支 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/289;G06F40/30;G06F16/31;G06F16/36;G06F21/62 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同义词 扩展 标签 传递 文本 载体 信息 隐藏 方法 | ||
1.基于同义词扩展和标签传递的文本无载体信息隐藏方法,其特征在于,具体步骤包括:
步骤1,遍历文本库路径,对于每一篇文本,将所有定位标签以及对应的关键词,存储在索引文本中;
步骤2,使用多层RNN模型提取文本库中的文本特征,得到满足文本库样本特征的语言模型;
步骤3,发送端对秘密信息进行切分,得到关键词集合,将单个关键词扩展为同义词集合,将不同的关键词或其同义词嵌入同一篇自然文本中,同时记录每篇载体文本中包含的所有关键词信息;将所有关键词信息按固定格式转换为二进制序列,作为秘密信息生成载体文本;最后将所有自然载体文本和生成文本发送给接收端完成秘密通信;步骤3具体包括:
步骤3.1,对秘密信息I进行分词、去停用词,得到关键词集合K;
步骤3.2,对于关键词集合K中每个关键词,使用同义词林将每个关键词扩充成同义词集合,接着采用词汇语义相似度方法筛选同义词集合中相似度与原关键词在0.5以上的词,其计算公式如下:
其中,βi(1≤i≤4)是4个调节参数,满足β1+β2+β3+β4=1且β1≤β2≤β3≤β4;四个调节参数取值如下:β1=0.5,β2=0.2,β3=0.17,β4=0.13;Simj(1≤j≤4)表示语义描述式中特定描述之间的相似度,公式如下:
其中,p1,p2表示义原,d是p1,p2在义原层次体系中的最短路径长度,y的取值为1.6;得到最终同义词扩展集合S;
步骤3.3,对于S中的每个关键词扩展集合s,遍历s中每个关键词w,在所有索引文件中检索关键词w,获得所有满足条件的文本集合T,并记录索引文件名中的标签L,以及定位标签的位置信息构成位置信息集合D;
步骤3.4,当步骤3.3过程中出现同一个关键词扩展集合s中不同关键词在同一篇的文本中存在的情况时,只记录第一次出现的关键词相关信息;最终得到每个s对应文本集的集合T′、对应标签集的集合L′对应关键词位置集的集合D′;若在遍历完s后,文本集的集合T′为空,则将原秘密关键词切分成单个汉字继续隐藏;
步骤3.5,对于文本集的集合T′,构建词袋模型,选出频率最高的文本txt,记录其中包含的所有关键词在秘密信息中的位置集合M、标签集合L″和标签位置集合D″,将txt作为载体文本发送给接收方,M、L″和D″按固定格式转化成二进制参数序列e存储;
步骤3.6,剔除T中在步骤3.5中已经隐藏的关键词扩展集合,再次执行步骤3.5,直到所有关键词都隐藏完成;
步骤3.7,使用RNN模型计算候选池中单词的概率分布,使用Huffman编码按条件概率对候选词进行编码,根据二进制参数e选择合适的候选词作为下一轮输入,直到参数e完全被嵌入,最终生成文本txt′;
步骤4,接收端按顺序接受所有文本,使用与发送端相同的RNN模型从最后一个文本中提取二进制序列,按固定格式解析出关键词信息,从自然文本中提取关键词组成秘密信息。
2.根据权利要求1所述的基于同义词扩展和标签传递的文本无载体信息隐藏方法,其特征在于,步骤1具体如下:
步骤1.1,遍历文本库中的每一个文本t,从文本的起始位置IP开始,取出n个汉字根据GBK的奇偶性转换成二进制序列作为标签label;
步骤1.2,选取定位标签后的4个汉字,进行分词操作,选取分词结果的第一个词或字作为关键词k;
步骤1.3,创建以标签label命名的索引文件并存储步骤1.2得到的关键词k和文本t的文本路径;起始位置IP=IP+1,重复上述步骤1.2,直到IP+n等于文本长度为止。
3.根据权利要求2所述的基于同义词扩展和标签传递的文本无载体信息隐藏方法,其特征在于,步骤4具体包括:
步骤4.1,对于收到的最后一个文本txt′,使用与发送端相同地RNN模型计算每个单词在每个时刻的概率分布,根据计算出来的条件概率使用Huffman编码方法对文本中的词语进行编码,解出二进制参数e;
步骤4.2,对于参数e,按固定格式解析,得到各篇文本中包含的关键词个数,以及每个关键词对应的标签集合L″、标签位置集合D″和秘密信息位置集合M;
步骤4.3,根据标签集合L″和标签位置集合D″在对应的文本中提取关键词,最后根据秘密信息位置集合M将关键词进行排序组句,得到最终完整秘密信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110403886.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柔性串状生态浮岛装置及其应用方法
- 下一篇:一种H型钢支护与防水装置