[发明专利]文本审核的方法与系统在审
| 申请号: | 202011423003.8 | 申请日: | 2020-12-08 |
| 公开(公告)号: | CN112541053A | 公开(公告)日: | 2021-03-23 |
| 发明(设计)人: | 钟正阳;李一文;朱泽瑞;刘名运 | 申请(专利权)人: | 湖南映客互娱网络信息有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/284;G06Q10/10 |
| 代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 周志中 |
| 地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 审核 方法 系统 | ||
一种文本审核的方法,包括:获取待审核文本;在内容库模块查找与待审核文本匹配的历史审核文本,内容库模块包括历史审核文本及其审核结果;若查找到与待审核文本匹配的历史审核文本,则确定历史审核文本的审核结果作为待审核文本的审核结果;若未查找到与待审核文本匹配的审核结果,则将待审核文本转给人工审核;根据人工审核确定待审核文本的审核结果。通过本发明的文本审核方法,能学习反馈人工审核的结果,提升自动审核文本的准确性,提高审核效率。
技术领域
本发明涉及网络技术领域,特别是涉及一种文本审核的方法与系统。
背景技术
近年来直播用户量不断增长,审核业务量的增长,需要审核的内容大幅增长,审核的压力越来越大。早期主要利用配置敏感词,识别文本类型,如是否为纯数字,手机号码等,拦截部分常见的文本内容,但是实际应用效果只能处理个别任务,对于新型内容,变种内容却素手无策,只能依赖手工逐步添加完善词库来增强敏感词拦截的内容的概率,此方法并不能及时处理违规内容,而且只能审核不合法内容,对于合法的内容无法处理,处理内容的能力有限。因此,在保障内容安全的前提下提高审核效率、节省人力成本成为亟待解决的问题。
前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
发明内容
本发明的目的在于提供一种能提高审核效率的文本审核的方法与系统。
本发明提供一种文本审核的方法,包括:
获取待审核文本;
在内容库模块查找与所述待审核文本匹配的历史审核文本,所述内容库模块包括所述历史审核文本及其审核结果;
若查找到与所述待审核文本匹配的历史审核文本,则确定所述历史审核文本的审核结果作为所述待审核文本的审核结果;
若未查找到与所述待审核文本匹配的审核结果,则将所述待审核文本转给人工审核;
根据人工审核确定所述待审核文本的审核结果。
进一步地,所述在内容库模块查找与所述待审核文本匹配的历史审核文本,包括:
根据所述待审核文本的敏感词、文本类型和业务类型中的至少一项在内容库模块查找与所述待审核文本匹配的历史审核文本。
进一步地,所述确定所述历史审核文本的审核结果作为所述待审核文本的审核结果,还包括:
判断所述待审核文本的审核次数与预设阈值的关系;
若所述待审核文本的审核次数不大于所述预设阈值,则根据所述待审核文本及其审核结果更新审核日志库;
若所述待审核文本的审核次数大于预设阈值,则将所述待审核文本转给人工审核以更新所述审核结果。
进一步地,所述待审核文本的审核次数根据所述与所述待审核文本匹配的历史审核文本的审核通过数与审核拒绝数的差值确定。
进一步地,所述确定所述待审核文本的审核结果之后,还包括:
将所述待审核文本及其审核结果写入审核日志库;
执行异步脚本实时扫描所述审核日志库;
将在审核日志库扫描到的更新内容写入所述内容库模块;
在所述内容库模块中去除所述待审核文本中的表情和/或符号。
本发明还提供一种文本审核的系统,包括:
内容库模块、接口模块和人工审核模块;
所述内容库模块,用于存储历史审核文本及其审核结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南映客互娱网络信息有限公司,未经湖南映客互娱网络信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011423003.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:油量计量阀的控制方法及装置
- 下一篇:一种根据转速收缩滚筒直径的网线收拢装置





