[发明专利]基于命名实体识别的违法广告词检测方法在审
| 申请号: | 202111012858.6 | 申请日: | 2021-08-31 |
| 公开(公告)号: | CN113849597A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 闫连山;袁子博;姚涛;蒲桂东 | 申请(专利权)人: | 艾迪恩(山东)科技有限公司;西南交通大学烟台新一代信息技术研究院 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/295;G06F40/30;G06Q30/02;G06N3/04;G06N3/08;G06N7/00 |
| 代理公司: | 烟台双联专利事务所(普通合伙) 37225 | 代理人: | 矫智兰 |
| 地址: | 264000 山东省烟*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供基于命名实体识别的违法广告词检测方法,步骤1)将广告数据转化为文本格式,形成广告文本;步骤2)对广告领域进行分类,利用BERT中文预训练模型将广告文本按领域分类;步骤3)对应不同广告领域类别,根据每个广告领域的广告违法行为编码对广告文本按字粒度进行标注形成标注文本;步骤4)将标注文本分为训练集与验证集,将训练集映射到BERT中文预训练模型中获得动态字向量;步骤5)将动态字向量传入BiLSTM双向长短期记忆网络获取得分向量;步骤6)将得分向量传入条件随机场CRF,CRF获取标签之间的关系,对最终预测的标签加以约束,得到最优标签,本发明通过深层网络BERT+BiLSTM+CRF结构学习违法词特征,达到提取违法词并匹配违法条例的功能。 | ||
| 搜索关键词: | 基于 命名 实体 识别 违法 广告词 检测 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾迪恩(山东)科技有限公司;西南交通大学烟台新一代信息技术研究院,未经艾迪恩(山东)科技有限公司;西南交通大学烟台新一代信息技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111012858.6/,转载请声明来源钻瓜专利网。





