[发明专利]自动作诗方法和装置及系统有效
申请号: | 201611184297.7 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106776517B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 何江聪;杨溥 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 作诗 方法 装置 系统 | ||
1.一种自动作诗方法,其特征在于,包括:
接收作诗主题词及作诗藏头字,所述作诗藏头字包括首句藏头字;
根据所述作诗主题词及作诗藏头字,以及预先构建的自动作诗模型生成诗,所述自动作诗模型包括诗首句生成模型和诗非首句生成模型;
其中,所述诗首句生成模型根据输入的诗主题词向量和首句藏头字的字向量,依次输出预测得到的首句中的每个非首字;所述诗非首句生成模型根据输入的诗的非首句的历史诗句中字的字向量和非首句藏头字的字向量,依次输出预测得到的非首句中的每个非首字;其中,预测得到每个非首字包括:依次将每个非首字作为当前字,基于当前字的前一个字和当前字所在诗句的主题信息得到当前字的每个候选字的生成概率,根据每个候选字的生成概率,预测得到当前字。
2.根据权利要求1所述的方法,其特征在于,还包括:构建自动作诗模型,所述构建自动作诗模型包括:
获取诗的文本数据及其标注信息,并根据所述标注信息确定所述诗的主题词;
对所述诗的主题词及所述诗中的字进行向量化,得到主题词向量和字向量;
根据所述主题词向量及所述诗的首句中的字的字向量,构建诗首句生成模型;
根据所述诗的非首句的历史诗句中的字的字向量和所述非首句中的字的字向量,构建诗非首句生成模型。
3.根据权利要求1所述的方法,其特征在于,还包括:
对所述作诗主题词和作诗藏头字进行向量化,得到主题词向量和藏头字的字向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述作诗主题词及作诗藏头字,以及预先构建的自动作诗模型生成诗,包括:
将所述主题词向量作为首句的主题信息,并根据首句藏头字的字向量和主题信息以及诗首句生成模型,依次预测得到首句中的每个非首字;
获取非首句藏头字,并根据非首句的历史诗句中字的字向量、非首句藏头字的字向量以及诗非首句生成模型,依次预测得到非首句中的每个非首字。
5.根据权利要求4所述的方法,其特征在于,所述获取非首句藏头字,包括:
如果所述作诗藏头字还包括非首句藏头字,则直接从所述作诗藏头字中获取非首句藏头字;或者,
如果所述作诗藏头字不包括非首句藏头字,则根据非首句的前一个诗句的尾字和主题信息预测得到所述尾字的下一个字,将所述下一个字确定为所述非首句藏头字。
6.根据权利要求1所述的方法,其特征在于,所述根据每个候选字的生成概率,预测得到当前字,包括:
直接将生成概率最大的候选字作为预测得到的当前字。
7.根据权利要求1所述的方法,其特征在于,所述根据每个候选字的生成概率,预测得到当前字,包括:
确定当前字需要满足的韵律要求;
获取每个候选字的韵律信息和生成概率,以及,在韵律信息满足所述韵律要求的候选字中选择生成概率最大的候选字,作为预测得到的当前字。
8.根据权利要求7所述的方法,其特征在于,
所述韵律包括:平仄韵律,和/或,押韵韵律;
其中,当所述韵律包括平仄韵律时,所述当前字需要满足的韵律要求包括当前字需要满足的平仄取值,以便在平仄取值为所述当前字需要满足的平仄取值的候选字中,选择生成概率最大的候选字作为预测得到的当前字;
当所述韵律包括押韵韵律时,所述当前字需要满足的韵律要求包括当前字需要属于的汉字集,以便在属于所述当前字需要属于的汉字集的候选字中,选择生成概率最大的候选字作为预测得到的当前字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611184297.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:质量数据的管理装置及管理方法
- 下一篇:人机对话平台用词造句的软件