[发明专利]一种文本生成方法及装置有效
申请号: | 201810540691.2 | 申请日: | 2018-05-30 |
公开(公告)号: | CN109002433B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 祝文博;李超 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/211;G06F40/258;G06F40/186 |
代理公司: | 北京庚致知识产权代理事务所(特殊普通合伙) 11807 | 代理人: | 李伟波 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 生成 方法 装置 | ||
本发明实施例提供一种文本生成方法及装置,所述方法包括:获得关键词和待生成的目标文本所对应的题目,其中,所述关键词为所述待生成的目标文本中的每一句文字序列的首字所组成的文字序列中的一部分;基于所述关键词和所述题目,通过预先训练的文本生成模型,生成所述待生成的目标文本中的第一句文字序列;至少基于所述第一句文字序列和预设的韵母,通过所述文本生成模型,按照预设的押韵规则,生成所述待生成的目标文本中除所述第一句文字序列以外的其它文字序列;按照生成所述第一句文字序列和所述其它文字序列的先后顺序,将所述第一句文字序列和所述其它文字序列进行组合,获得押韵的目标文本。
技术领域
本发明实施例涉及自然语言处理领域,尤其涉及一种文本生成方法及装置。
背景技术
使用计算机来自动生成文本如生成诗词、歌词、对话等的技术,属于自然语言处理领域,主要是以计算机语言学、人工智能、深度学习等技术为基础,来研究和模拟人类生成自然语言文本的过程和方法。诗歌是人类语言的结晶,具有格律、对仗、押韵等特点,而藏头诗是诗歌中一种特殊形式的诗体,它以每句诗的头一个字嵌入你要表达的内容中的一个字,藏头诗涵义深、品位高、价值重。
随着计算机语言学、人工智能以及深度学习的快速发展,目前常使用神经网络(Neural Networks,NN)作为编码器(Encoder)和解码器(Decoder)的seq2seq(Sequence toSequence,序列到序列)模型来生成文本。由于seq2seq模型是基于概率分布来生成文本中的每一句文字序列的,所以必然存在的一个问题就是往往通过该seq2seq模型直接生成的文本都是不押韵的,这极大影响了生成的文本的美感。可见,现有的生成文本的方法不够合理,生成效果不好。
发明内容
有鉴于此,本发明实施例提供一种文本生成方法及装置,本发明实施例的一个目的在于通过将文本生成模型和预设的押韵规则相结合,来生成预设的韵母对应的押韵的文本。
为达到上述目的,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供一种文本生成方法,包括:获得关键词和待生成的目标文本所对应的题目,其中,所述关键词为所述待生成的目标文本中的每一句文字序列的首字所组成的文字序列中的一部分;基于所述关键词和所述题目,通过预先训练的文本生成模型,生成所述待生成的目标文本中的第一句文字序列;至少基于所述第一句文字序列和预设的韵母,通过所述文本生成模型,按照预设的押韵规则,生成所述待生成的目标文本中除所述第一句文字序列以外的其它文字序列;按照生成所述第一句文字序列和所述其它文字序列的先后顺序,将所述第一句文字序列和所述其它文字序列进行组合,获得押韵的目标文本。
第二方面,本发明实施例提供一种文本生成装置,包括:第一获得单元、第一生成单元、第二生成单元以及第二获得单元,其中,所述第一获得单元,用于获得关键词和待生成的目标文本所对应的题目,其中,所述关键词为所述待生成的目标文本中的每一句文字序列的首字所组成的文字序列中的一部分;所述第一生成单元,用于基于所述关键词和所述题目,通过预先训练的文本生成模型,生成所述待生成的目标文本中的第一句文字序列;所述第二生成单元,用于至少基于所述第一句文字序列和预设的韵母,通过所述文本生成模型,按照预设的押韵规则,生成所述待生成的目标文本中除所述第一句文字序列以外的其它文字序列;所述第二获得单元,用于按照生成所述第一句文字序列和所述其它文字序列的先后顺序,将所述第一句文字序列和所述其它文字序列进行组合,获得押韵的目标文本。
第三方面,本发明实施例提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述文本生成方法。
第四方面,本发明实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述文本生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810540691.2/2.html,转载请声明来源钻瓜专利网。