[发明专利]评论生成方法、装置、服务器及存储介质有效
申请号: | 201910537401.3 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110263340B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 潘禄;陈玉光;彭卫华;罗雨;刘远圳;韩翠云;施茜;黄俊衡;李法远 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F18/214 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评论 生成 方法 装置 服务器 存储 介质 | ||
1.一种评论生成方法,其特征在于,所述方法包括:
从目标文章中提取至少一个目标实体,并获取每个目标实体的至少一种属性信息,其中,所述属性信息用于从不同维度对实体进行描述;
将每种属性信息转化为属性向量,并将每个目标实体的每种属性信息的属性向量进行合并,得到每个目标实体的属性合并向量;
将每个目标实体转化为实体向量,并将每个目标实体的实体向量和属性合并向量进行拼接,得到每个目标实体的实体信息向量;
将每个目标实体的实体信息向量进行拼接,得到目标文章的实体集合信息向量;
获取目标文章的语义特征向量,并将所述语义特征向量与所述实体集合信息向量进行拼接,将拼接后的向量作为预先训练的评论生成模型的输入,利用所述评论生成模型生成目标文章的评论;
其中,所述将每个目标实体的每种属性信息的属性向量进行合并,得到每个目标实体的属性合并向量,包括:
将每种属性信息的属性向量作为max-pool算法的取值区域,基于max-pool算法对各属性向量进行合并,得到每个目标实体的属性合并向量。
2.根据权利要求1所述的方法,其特征在于,所述从目标文章中提取至少一个目标实体,并获取每个目标实体的至少一种属性信息,包括:
按照预设规则从所述目标文章中提取句子集合,对所述句子集合中的每个句子进行文本分词,得到分词集合;
在所述分词集合中通过词性筛选,确定实体备选集合;
将所述实体备选集合中的每个实体在预先创建的知识库中进行比对,将存在于所述知识库中的实体确定为所述至少一个目标实体;
从所述知识库中获取每个目标实体的至少一种属性信息;
其中,所述知识库中记载有多个实体以及各实体的至少一种属性信息。
3.根据权利要求1所述的方法,其特征在于,所述评论生成模型是利用Encoder-Decoder框架生成;
相应的,所述获取目标文章的语义特征向量,包括:利用Encoder-Decoder框架的Encoder部分对目标文章进行编码,得到所述语义特征向量;
相应的,所述将拼接后的向量作为预先训练的评论生成模型的输入,利用所述评论生成模型生成目标文章的评论,包括:
将拼接后的向量作为Encoder-Decoder框架Decoder部分的起始信号输入,得到输出的目标文章的评论。
4.根据权利要求1所述的方法,其特征在于,所述评论生成模型为seq2seq模型;
相应的,所述seq2seq模型的训练过程包括:
获取文章样本及其多个候选评论样本;
从所述文章样本中提取至少一个实体,并获取每个实体的至少一种属性信息,其中,所述实体为知识库中存在的实体;
在所述多个候选评论样本中按照实体进行过滤,保留包含至少一个实体的候选评论,作为用于训练的评论样本;
将每种属性信息转化为属性向量,并将每个实体的每种属性信息的属性向量进行合并,得到每个实体的属性合并向量;
将每个实体转化为实体向量,并将每个实体的实体向量和属性合并向量进行拼接,得到每个实体的实体信息向量;
将每个评论样本中出现的实体的实体信息向量进行拼接,得到每个评论样本的实体集合信息向量;
利用seq2seq模型中的Encoder部分对所述文章样本进行编码,得到所述文章样本的样本语义特征向量;
将所述样本语义特征向量、与所述评论样本中的任一目标评论样本的实体集合信息向量进行拼接,并将拼接后的向量作为seq2seq模型中Decoder部分的起始信号输入,将所述目标评论样本的向量表示作为所述Decoder部分的输出,对所述seq2seq模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910537401.3/1.html,转载请声明来源钻瓜专利网。