[发明专利]一种基于Bi-LSTM-CRF模型的内容相关广告投放方法及系统有效
申请号: | 202110332049.7 | 申请日: | 2021-03-29 |
公开(公告)号: | CN112907301B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 景东;张大勇;卓兴良 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bi lstm crf 模型 内容 相关 广告 投放 方法 系统 | ||
一种基于Bi‑LSTM‑CRF模型的内容相关广告投放方法及系统,属于广告投放技术领域,用以解决对于小规模数据集的基于深度学习的命名实体识别模型,由于其不容易自动获取特征,从而导致模型难以取得很好的识别效果,进一步导致广告推荐不能精准投放的问题。本发明的技术要点包括:将训练数据集输入Bi‑LSTM‑CRF模型进行训练,获取最优预测模型;将待预测数据输入最优预测模型,获取预测的商品词;根据所述商品词匹配相关广告,获取匹配度最高的广告信息;将携带广告信息的广告进行投放。本发明在Bi‑LSTM‑CRF算法的基础上结合商品词的特征,通过特征工程方式增强数据,使数据具有更丰富的语义,构建一种适用于文档商品词抽取的系统用于内容相关的广告推荐,提升了广告精准投放效果。
技术领域
本发明涉及广告投放技术领域,具体涉及一种基于Bi-LSTM-CRF模型的内容相关广告投放方法及系统。
背景技术
二手社区是供用户发布浏览帖子的网络平台,用户可以发布帖子表达闲置转让的诉求或者浏览帖子查看是否符合自己的购买意愿,而对于二手社区而言,其收益方式主要是广告投放。由于二手社区的广告投放过程中需要进行精准投放,所以从社区内容出发分析用户的购买意图并以此进行广告投放,即内容相关广告。内容相关广告的主要思想是在向用户提供网页内容的同时,投放与该内容相关的广告。在现有技术中,多采用关键词抽取的方法,即通过抽取文档内容中的关键词,然后去匹配广告获得内容相关广告。但是,基于关键词抽取的内容相关广告投放方法准确率不高。
现有的命名实体识别算法主要集中在识别人名、地名以及结构名等方面,其中,相对于其他命名实体识别算法,基于深度学习的命名实体识别算法对于上述识别任务取得了较好的识别效果。但是对于商品命名实体识别任务还有待挖掘研究,因此将基于深度学习的命名实体识别算法应用于内容相关广告投放方法中,但是由于深度学习需要大规模数据集,对于小规模数据集的基于深度学习的命名实体识别模型,其不容易自动获取特征,从而导致该命名实体识别模型难以取得很好的识别效果。
发明内容
鉴于以上问题,本发明提出一种基于Bi-LSTM-CRF模型的内容相关广告投放方法及系统,用以解决对于小规模数据集的基于深度学习的命名实体识别模型,由于其不容易自动获取特征,从而导致模型难以取得很好的识别效果,进一步导致广告推荐不能精准投放的问题。
根据本发明一方面,提出一种基于Bi-LSTM-CRF模型的内容相关广告投放方法,该方法包括以下步骤:
步骤一、获取包含对商品实体进行标注的训练数据集;
步骤二、将所述训练数据集输入Bi-LSTM-CRF模型进行训练,获取最优预测模型;
步骤三、将包含商品实体的待预测数据输入最优预测模型,获取预测的商品词;
步骤四、根据所述商品词匹配相关广告,获取匹配度最高的广告信息;
步骤五、将携带广告信息的广告进行投放。
进一步地,步骤二中所述Bi-LSTM-CRF模型包括输入特征层、Bi-LSTM中间层、CRF输出层;其中,输入特征层用于将所述训练数据集每个字符分开,以字向量表示训练数据并输入Bi-LSTM中间层;Bi-LSTM中间层用于利用双向LSTM循环神经网络对输入的序列信息进行上下文特征提取,并将两个方向的LSTM特征结果进行拼接,并输入CRF输出层;CRF输出层用于生成最终的标签序列。
进一步地,所述字向量为利用Skip-gram模型预训练得到的特征词向量。
进一步地,步骤二在进行训练的过程中采用最大似然估计的方法寻找最优的标签序列。
进一步地,步骤二所述输入特征层中,将分词特征、词性特征、依存关系特征、字母特征、数字特征中的一种或多种组合与字向量进行拼接作为输入特征输入Bi-LSTM中间层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332049.7/2.html,转载请声明来源钻瓜专利网。