[发明专利]文本处理的方法、装置、设备和存储介质有效
申请号: | 202010212928.1 | 申请日: | 2020-03-24 |
公开(公告)号: | CN113449511B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 王文华;吕中厚;刘焱 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F40/30;G06F40/211;G06F40/253 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 设备 存储 介质 | ||
本公开的实施例提供了文本处理的方法、装置、设备和计算机可读存储介质,涉及自然语言处理领域。该方法包括:接收第一文本,第一文本包括一组词;从第一文本的一组词中确定第一词,第一词在第一文本中的重要度超过阈值;基于第一文本和与第一词相关联的第二词,来生成第二文本,第二文本的合理程度高于第一文本,合理程度指示文本的语义或语法的合理性。基于这样的方式,能够有效地防御针对文本的对抗样本攻击。
技术领域
本公开的实施例主要涉及计算机技术领域,并且更具体地,涉及用于文本处理的方法、装置、设备以及计算机可读存储介质。
背景技术
随着计算机技术的发展,自然语言处理(NLP)技术已经获得越来越多的应用。例如,一些公司提供基于NLP的情感分析服务来对文本进行自动地情感分析。这能够帮助使用者理解用户消费习惯、舆情监控和分析热点话题,为企业提供有力的决策支持。然而,针对自然语言处理的对抗样本攻击能够导致自然语言处理技术作出错误的判断。
发明内容
根据本公开的实施例,提供了一种文本处理的方案。
在本公开的第一方面中,提供了一种文本处理的方法。该方法包括:接收第一文本,第一文本包括一组词;从第一文本的一组词中确定第一词,第一词在第一文本中的重要度超过阈值;基于第一文本和与第一词相关联的第二词,来生成第二文本,第二文本的合理程度高于第一文本,合理程度指示文本的语义或语法的合理性。
在本公开的第二方面中,提供了一种用于文本处理的装置。该装置包括:接收模块,被配置为接收第一文本,第一文本包括一组词;第一词确定模块,被配置为从第一文本的一组词中确定第一词,第一词在第一文本中的重要度超过阈值;第二文本生成模块,被配置为基于第一文本和与第一词相关联的第二词,来生成第二文本,第二文本的合理程度高于第一文本,合理程度指示文本的语义或语法的合理性。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;
图2示出了根据本公开的一些实施例的文本处理的示例方法的流程图;
图3A示出了根据本公开的一实施例的确定重要度的示例方法的流程图;
图3B示出了根据本公开的另一实施例的确定重要度的示例方法的流程图;
图3C示出了根据本公开的又一实施例的确定重要度的示例方法的流程图;
图4示出了根据本公开的一些实施例的文本处理的装置的示意性结构框图;以及
图5示出了能够实施本公开的多个实施例的计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010212928.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于目标特征的时间序列相似性计算方法
- 下一篇:一种烘炉用烧嘴