[发明专利]一种内容发布方法、装置、电子设备及存储介质在审
申请号: | 202110252218.6 | 申请日: | 2021-03-08 |
公开(公告)号: | CN115048601A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 魏国 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/335;G06F16/35;G06F40/194;G06F40/216;G06F40/284;G06F40/289 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵祎 |
地址: | 100195 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 内容 发布 方法 装置 电子设备 存储 介质 | ||
本申请公开一种内容发布方法、装置、电子设备及存储介质,属于自然语言处理技术领域,该方法包括:接收包含有文本内容的内容发布请求,对文本内容进行分词处理,得到文本内容中的分词,将每个分词与各预设词进行比对,得到各预设词中与该分词匹配的目标词,然后,获取用于表征目标词被拒绝发布的概率的预设因子,根据预设因子对应的文本过滤策略,响应内容发布请求,其中,各预设词是指定类型的词。这样,在发布文本内容之前,基于指定类型如敏感类型的各预设词对文本内容进行过滤,可以降低包含指定类型的词的文本内容的发布概率和传播概率。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种内容发布方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的快速发展,网络用户也越来越多,网络用户可以很容易地发布网络信息也可以很容易地获取到他人发布的网络信息。
网络信息的易发布性和易传播性给人们的生活带来了极大的自由,但同时也带来了一些隐患。比如,一些敏感性或危害性的网络信息短时间内就可以在世界范围内传播,从而造成重大影响。因此,在网络信息发布前进行管控,防止具有敏感性和危害性的网络信息的传播,具有重大意义。
发明内容
本申请实施例提供一种内容发布方法、装置、电子设备及存储介质,用以提供一种在发布前对文本内容进行审核的方案。
第一方面,本申请实施例提供一种内容发布方法,包括:
接收内容发布请求,所述内容发布请求中包含有文本内容;
对所述文本内容进行分词处理,得到所述文本内容中的分词;
将每个分词与各预设词进行比对,得到各预设词中与所述分词匹配的目标词,其中,各预设词是指定类型的词;
获取所述目标词的预设因子,所述预设因子用于表征所述目标词被拒绝发布的概率;
根据所述预设因子对应的文本过滤策略,响应所述内容发布请求。
在一些可能的实施方式中,将每个分词与各预设词进行比对,得到各预设词中与所述分词匹配的目标词,包括:
获取所述分词的词向量;
计算所述分词的词向量与各预设词的词向量之间的相似度;
将相似度高于预设值的预设词,确定为与所述分词匹配的目标词。
在一些可能的实施方式中,根据以下步骤设置所述目标词的预设因子:
将所述目标词输入到词分类模型中进行分类处理,得到所述目标词的子类别,所述词分类模型是对属于所述指定类型的不同子类别的词的类别特征预先进行学习得到的;
将所述子类别对应的预设因子,确定为所述目标词的预设因子。
在一些可能的实施方式中,还包括:
接收设置所述目标词的预设因子的设置指令,所述设置指令中包含有预设因子;
若确定所述设置指令中的预设因子大于所述目标词的子类别对应的预设因子,则将所述设置指令中的预设因子确定为所述目标词的预设因子。
在一些可能的实施方式中,根据所述预设因子对应的文本过滤策略,响应所述内容发布请求,包括:
若确定所述预设因子对应的文本过滤策略是自动替换,则使用预设字符对所述文本中与所述目标词匹配的分词进行替换,发布替换后的文本内容;
若确定所述预设因子对应的文本过滤策略是人工审核,则将所述文本发送给审核人员进行审核,基于接收到的审核结果响应所述内容发布请求;
若确定所述预设因子对应的文本过滤策略是拒绝发布,则拒绝所述内容发布请求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110252218.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:费托合成催化剂的再生方法
- 下一篇:无人机载水基灭火装置及灭火方法
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法