[发明专利]结合上下文实体词和知识的故事结局生成方法在审
申请号: | 201911001420.0 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110750652A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 黄清宝;刘庆广;韦杰龙;韩超 | 申请(专利权)人: | 广西大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06F40/205 |
代理公司: | 45104 广西南宁公平知识产权代理有限公司 | 代理人: | 杨立华 |
地址: | 530004 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三元组 故事 知识库 上下文编码 词性标注 故事结局 解码处理 知识编码 重要信息 词向量 累积式 输入端 增强型 知识图 词性 语句 语法 嵌入 标注 注意力 并用 应用 | ||
1.一种结合上下文实体词和知识的故事结局生成方法,其特征在于该法基于累积式增强型注意力序列到序列的模型,先基于词性标注先对上下文进行词性的标注,然后通过Glove词嵌入方法对故事上下文的词进行编码得到相对应的词向量,之后通过ConceptNet知识库网对每一个词进行三元组知识编码,并用知识图表示方法对三元组进行处理,同时结合得到的实体词一并和故事上下文编码到输入端,通过对输入的信息进行解码处理得到一组故事对应的结局序列。
2.根据权利要求1所述的结合上下文实体词和知识的故事结局生成方法,其特征在于具体包括以下步骤:
1)、构建累积式增强型注意力序列到序列的深度学习联合模型,该模型的输入是由不包含结局的故事文本上下文,上下文实体词和知识拼接好的词向量,输出是基于故事的结局的一组序列;
2)、对故事文本上下文的词进行词性标注,得到相应的词性词;
3)、通过知识获取处ConceptNet上得到每一个词三元组的知识信息,用知识图的形式进行表示;
4)、通过预训练好的Glove词嵌入方法将步骤2)和步骤3)中得到词和故事文本上下文中的词进行词向量的表示,同时将这三者通过一种累积式增强型的编码方式得到其隐含的状态信息;
5)、将得到的词向量输入累积式增强型注意力序列到序列的深度学力联合模型中,最终得到的输出是一组故事对应结局的一组序列。
3.根据权利要求2所述的结合上下文实体词和知识的故事结局生成方法,其特征在于步骤步骤1)中的累积式增强型注意力序列到序列的深度学力联合模型包括长短时记忆网络模型和注意力模型,其具体步骤为:
2.1)、设是输入是不含结局的故事文本上下文,由X={X1,X2,L,XK}序列组成,其中表示第i个句子的第li个词,通过词性标注所得到的上下文实体词Ccontext和通过知识库得到的知识Kg,输出是故事对应的结局Y=y1y2...yl;
2.2)、将所述上下文词,上下文实体词和知识进行词嵌入预处理,得到相对应的词向量表示;
2.3)、将所述词向量以一种逐步迭代增强的方式输入所述长短时记忆网络模型;
2.4)、将所述长短时记忆网络模型的输出向量输入该注意力模型;
2.5)、将所述注意力模型的输出参数与所述上下文实体词向量进行比较,根据比较结果调整所述长短时记忆网络模型和所述注意力模型的参数;
2.6)、迭代执行上述步骤,当所述输出参数的准确度在一定规定范围内,得到最终的注意力序列到序列的深度学习联合模型。
4.根据权利要求3所述的结合上下文实体词和知识的故事结局生成方法,其特征在于步骤2.6)中当所述输出参数的准确度在一定规定范围内,得到最终的注意力序列到序列的深度学习联合模型,具体包括以下步骤:
3.1)、分别对所述累积式增强型注意力序列到序列深度学习联合模型中的编码解码进行监控;
3.2)、计算负对数似然作为损失函数对编码解码进行监控,当Φ=Φen+Φde最小时,将当前的累积式增强型注意力序列到序列深度学习联合模型作为最佳的深度学习联合模型,其具体为:
5.根据权利要求2所述的结合上下文实体词和知识的故事结局生成方法,其特征在于步骤2)的具体过程为:
4.1)、将上下文的词进行词性分类,得到其中所包含的名词和名词复数词;
4.2)、将得到的这些名词再输入到长短时记忆网络,然后与当前的输入向量进行拼接得到新的拼接向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911001420.0/1.html,转载请声明来源钻瓜专利网。