[发明专利]一种文章的生成方法及装置有效
申请号: | 201810331686.0 | 申请日: | 2018-04-13 |
公开(公告)号: | CN109190095B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 孙宝龙 | 申请(专利权)人: | 北京爱群游网络信息技术有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/35;G06N3/08 |
代理公司: | 北京睿博行远知识产权代理有限公司 11297 | 代理人: | 黄艳丽 |
地址: | 050000 河北省石家庄*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文章 生成 方法 装置 | ||
本申请公开了一种文章的生成方法及装置,其特征在于,包括:获取基础语料集合;利用学习排序LTR算法对基础语料集合中的基础语料进行依次排序,得到待筛选基础语料集合;利用集合抽样DDPS算法筛选待筛选基础语料集合中的基础语料,得到目标基础语料集合;根据目标基础语料集合生成文章。本申请通过将获取到的基于目标产品的基础语料集合利用LTR算法进行排序,并将排序后的基础语料集合利用DDPS算法进行筛选得到目标基础语料集合,进而根据目标基础语料集合生成文章。本申请的技术方案不仅可以根据相关算法快速的生成基于目标产品的推送文章。还可以精准的匹配与目标产品相契合的推送文章以避免出现由于推送文章的质量低下所导致的用户浏览体验较差的问题。
技术领域
本申请涉及互联网领域,尤其涉及一种文章的生成方法及装置。
背景技术
随着通信时代与社会的发展,将涵盖自身产品介绍的文章推送给用户已经成为了商家必不可少的一种营销手段。
其中,生成一个优秀的,真正满足用户需求的推送文章并通过有效的渠道送达到用户,可以极大的引起用户兴趣,从而提高了自身产品的潜在购买量。以旅游产品为例,由于各旅游景点的分散,导致用户只能通过网上浏览相关的旅游景点的文章来判断该旅游景点是否对自身具有吸引力。
然而,现有技术中,经常会出现一种问题,即当营销者利用文章生成系统生成匹配其产品的推送文章时,由于现有的文章生成系统只能根据固定的预设语句生成一些简单的推送文章,进而导致该文章使得用户的浏览体验较差。因此,如何设计出一种可以精准匹配产品的文章推送给用户,成为了本领域技术人员迫待解决的难题。
发明内容
本申请实施例所要解决的一个技术问题是:提供一种文章的生成方法及装置。可以解决现有技术中由于产品的推送文章质量较低所导致的用户体验较差的问题。
根据本申请实施例的一个方面,提供的一种文章的生成方法,包括:
获取基础语料集合,所述基础语料集合为从基于目标产品的文本集合中获取的基础语料的集合,所述基础语料用于生成文章;
利用学习排序LTR算法对所述基础语料集合中的基础语料进行依次排序,得到待筛选基础语料集合,所述待筛选基础语料集合为在所述基础语料集合中排序顺序在预定范围内的基础语料的集合;
利用集合抽样DDPS算法筛选所述待筛选基础语料集合中的基础语料,得到目标基础语料集合;
根据所述目标基础语料集合生成文章。
可选地,在基于本申请上述方法的另一个实施例中,所述获取基础语料集合,包括:
通过神经网络算法对所述文本集合进行分类,得到目标文本集合;
利用关键词提取TF-I DF技术对所述目标文本集合进行语料提取,得到所述基础语料集合。
可选地,在基于本申请上述方法的另一个实施例中,所述通过神经网络算法对所述文本集合进行分类,得到目标文本集合,包括:
通过目标神经网络语义分割模型对所述文本集合进行分类,得到所述目标文本集合。
可选地,在基于本申请上述方法的另一个实施例中,在所述通过目标神经网络语义分割模型对所述文本集合进行分类,得到目标文本集合之前,还包括:
获取样本文本,其中,所述样本文本包括至少一个标注的文本类别特征;
利用所述包括至少一个标注的文本类别特征的样本文本对预设的神经网络语义分割模型进行训练,得到所述目标神经网络语义分割模型。
可选地,在基于本申请上述方法的另一个实施例中,所述利用学习排序 LTR算法对所述基础语料集合进行依次排序,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱群游网络信息技术有限公司,未经北京爱群游网络信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810331686.0/2.html,转载请声明来源钻瓜专利网。