[发明专利]基于困惑度计算的高隐蔽性自动生成文本的隐写方法有效

申请号：	201910301979.9	申请日：	2019-04-08
公开（公告）号：	CN110543771B	公开（公告）日：	2022-11-25
发明（设计）人：	不公告发明人	申请（专利权）人：	沈阳工业大学
主分类号：	G06F21/60	分类号：	G06F21/60;G06F40/216;G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	110087 辽宁省沈阳市沈***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了基于困惑度计算的高隐蔽性自动生成文本的隐写方法，该方法可以根据需要隐藏的秘密比特流生成高隐蔽性的文本载体。区别于以往的文本隐写方法，本方法的创新点在于充分利用候选池中文本的出现频率，使生成的隐写文本具有更高的隐蔽性。该方法在隐写文本自动生成过程中，考虑了隐写文本中单词的灵敏度不同，引入困惑度计算，对候选池进行二次筛选，提升了生成的隐写文本的自然度，从而大幅度提升了系统整体的隐蔽性。
搜索关键词：	基于困惑计算隐蔽自动生成文本方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于困惑度计算的高隐蔽性自动生成文本的隐写方法，包括以下步骤：/n(1)通过网上搜集的大量常用媒体形式的文本构建数据集；/n(2)对数据进行预处理，删除文本中的特殊符号、表情符号等，过滤低频词，并将英文中的所有单词转换为小写；/n(3)对自然文本进行建模，并构建相应的马尔可夫模型；/n(4)按照三元模型对构建的文本数据集进行训练，并按照词语出现的次数降序排序为一个字典T；/n(5)统计数据集中的第一个词的词频分布，按照词频降序排序后，选取前200个作为起始词列表；/n(6)在生成一句话之前，先从起始词列表中随机抽取一个单词作为马尔可夫模型的输入；/n(7)基于马尔可夫模型计算各个时刻单词的条件概率分布，根据给定候选池大小embedding rate对字典T进行第一次筛选，筛选后的字典为T1；/n(8)在每个迭代时刻t，依据字典T1中各单词的条件概率计算T1中单词与t时刻之前产生的单词共同的困惑度；/n(9)根据预设的困惑度阈值thr_ppl对字典T1进行二次筛选，筛选过后的字典为T2；/n(10)若筛选后的字典T2为空，即视作该字典不具备隐藏秘密信息的能力，在选词的过程中，直接选取字典T1中出现频率最多的单词作为当前时刻的输出；/n(11)若筛选后的字典T2非空，则依据字典T2中各单词的条件概率分布构建哈夫曼树并进行哈夫曼编码；/n(12)根据需要嵌入的码流从哈夫曼树的根节点开始搜索，到相应的叶子结点为止，该叶子结点对应的单词即为当前时刻的输出，基于此实现在自动生成文本的过程中隐藏秘密信息；/n(13)重复步骤(7)～(12)，直到生成一个完整的隐写句子，完成根据秘密信息自动生成文本载体的过程；/n(14)接收方在接收到模型生成的隐写文本后，对其进行解码并获取机密消息。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于沈阳工业大学，未经沈阳工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910301979.9/，转载请声明来源钻瓜专利网。

上一篇：一种开源软件的漏洞检测方法、装置及系统
下一篇：离线解密方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于困惑度计算的高隐蔽性自动生成文本的隐写方法有效

专利文献下载