[发明专利]一种自然语言水印方法在审
| 申请号: | 202310375998.2 | 申请日: | 2023-04-10 |
| 公开(公告)号: | CN116522298A | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 向凌云;黄明豪;刘杨凡;张晨凌;王蓉 | 申请(专利权)人: | 长沙理工大学 |
| 主分类号: | G06F21/16 | 分类号: | G06F21/16;G06F40/284;G06F40/30;G06F40/211;G06F40/247;G06F16/35;G06N3/0455;G06N3/0442;G06N3/047;G06N3/08 |
| 代理公司: | 北京国贝知识产权代理有限公司 11698 | 代理人: | 牟昌兵;于倩 |
| 地址: | 410114 湖南省*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自然语言 水印 方法 | ||
本发明公开了一种自然语言水印方法,包括以下步骤:步骤1、鲁棒词识别器构建;步骤2、标注语料库,训练鲁棒词识别器;步骤3、词替换模型构建;步骤4、鲁棒词语料库的数据增强;步骤5、水印信息嵌入。
技术领域
本发明涉及自然语言处理技术及信息安全领域,具体涉及一种自然语言水印方法。
背景技术
随着互联网技术和网络社交媒体的发展,数字内容便利共享的同时也引发了如数字内容泄露、侵权、伪造等一系列信息安全问题。自然语言数字水印是一种针对文本内容的版权保护技术,它对文本内容进行语义等价变换,从而以不可感知的方式嵌入能够标识文本版权的水印信息,通过水印信息的检测来保护文本的版权。
已有自然语言数字水印方法在保证文本语义不变的前提下,通常通过对文本中的词进行同义替换或者语义等价的句子变换,实现水印信息的嵌入。相比基于句法变换的自然语言数字水印方法,基于同义词替换的方法实现难度较低,对文本内容的修改较少,具有较好的鲁棒性和不可感知性。但基于同义词替换的方法局限于同义词之间的替换,且即使一个词具有多种语义,为了避免提取时的歧义,通常一个词将限定与规定的少量词进行替换。另外,受限于上下文,并不是所有的同义词均适合当前的上下文,因此,为了使得水印文本最大程度地保留原始文本的语义,通常需要利用嵌入位置的上下文来衡量同义词的合适度,以选择更加合适的同义词。因此,虽然基于同义词替换的方法能够较好地保留文本语义不变,但实际的水印容量较低。
为了提高基于同义词替换的自然语言水印方法的不可感知性和容量,有研究者提出了基于神经网络语言模型的词替换自然语言水印方法,这种方法利用神经网络语言模型来为文本中的内容自动生成合适的替换项以嵌入水印。相比基于同义词替换的方法,由于可替换的词不局限于互为同义的词,水印容量更大;其次,神经网络语言模型能够更好地表示上下文的语义信息,通过上下文语义信息来预测当前位置的合适的可替换词,使得替换前后的文本内容具有更高的语义相似度,更好地保持了文本内容的语义,使水印文本的不可感知性更高。但是,由于这类方法是利用上下文的信息来自动预测可替换词列表的,因此可替换词的预测是对上下文敏感的,当上下文发生改变,如遭受删除、替换、插入词等文本编辑攻击,可替换词的预测结果将随之发生改变,从而影响水印信息的正确提取。同时,在水印信息提取时,难以准确定位水印信息的位置。特别是,现有基于词替换的自然语言水印方法在遭受攻击时,容易导致水印信息提取失败,失去对文本内容版权的保护,制约了自然语言水印方法的应用价值。因此,如何提升自然语言水印技术的鲁棒性是亟需解决的重要问题。
面对现有自然语言数字水印技术存在的不足,本发明在保证文本语义不变和流畅性的前提下,实现了一种对文本编辑鲁棒的自然语言水印方法,提高了水印方法的鲁棒性,该方法使水印文本在遭受词删除、插入等文本编辑攻击时,仍能准确提取水印信息进行版权保护。
发明内容
为解决现有技术存在的不足,本发明提出了一种对文本编辑鲁棒的自然语言水印方法。
为实现本发明之目的,采用以下技术方案予以实现:
一种自然语言水印方法,包括以下步骤:
步骤1、鲁棒词识别器构建;
步骤2、标注语料库,训练鲁棒词识别器;
步骤3、词替换模型构建;
步骤4、鲁棒词语料库的数据增强;
步骤5、水印信息嵌入。
所述的自然语言水印方法,其中,所述步骤1中,鲁棒词识别器构建包括:
步骤1.1将单词及其词性标签进行向量化,表示为嵌入向量;
步骤1.2对单词及词性标签嵌入进行编码;
步骤1.3计算单词间的上下文语义特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310375998.2/2.html,转载请声明来源钻瓜专利网。





