[发明专利]一种级联式作文生成方法有效
申请号: | 201711160875.8 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107967257B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 秦兵;冯骁骋;孙承杰;冷海涛;刘挺 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/211;G06F16/35 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 级联 作文 生成 方法 | ||
本发明涉及一种级联式作文生成方法,是为了解决现有技术仅针对作文评分进行研究,未出现关于作文生成方法的研究,以及已有的主题分析技术很难对作文的题目进行分析的缺点而提出的。本发明用一个或多个话题词表示待生成作文的中心思想;得到话题词后,将作文生成分解为话题词扩充、句子抽取和篇章组织;话题词扩展后,利用句子抽取模块寻找与话题词相关的句子,并最终使用篇章组织模块对抽取获得的句子排序,使之成为连贯的整体。本发明还可以从已抽取的句子集合中挖掘词语对已有的话题词进行补充。本发明适用于自动作文生成。
技术领域
本发明涉及主题分析技术领域,具体涉及一种级联式作文生成方法。
背景技术
现有技术中,与作文相关的研究大多以作文自动评分为主,尚未出现关于作文生成方法的研究。作文生成的首要问题是对作文主题进行分析,已有的主题分析技术都是针对大量文本集合进行的,且主要提取的是文章表面的主题信息或事实性主题信息。而作文题目一般较短,且要求对题目进行引申,得到题目中蕴含的深层主题。因此,很难直接利用已有的主题分析技术来进行针对作文题目的主题分析。
发明内容
本发明的目的是为了解决现有技术仅针对作文评分进行研究,未出现关于作文生成方法的研究,以及已有的主题分析技术很难对作文的题目进行分析的缺点,而提出一种级联式作文生成方法。
一种级联式作文生成方法,包括:
步骤一、根据所输入的材料作文题干,提取话题词集;
步骤二、根据所述话题词集,生成句子;
步骤三、将步骤二中生成的所有句子进行排序,得到作文。
本发明的有益效果为:
1、本发明能够对于材料作文题目进行分析,得出隐含在材料作文中表示哲理的关键词;2、本发明能够针对表示哲理的关键词形成的句子进行扩展,使得到的句子不包含关键词但与关键词相关;3、本发明能对生成的句子进行合理的排序,使其符合正常的行文逻辑;
4、本发明选取6683篇高中议论文进行实验,以段落为单位,过滤掉句子数小于3的段落,
本实验采用了Rouge-S、Rouge-N、P-all来作为评测指标,其中
其中sm代表了第m个文档,S(·)代表了所有的skip bigram句子对,N(·)代表所给出顺序中的所有N个连续句子组合和om*分别代表预测的顺序序列和真实顺序。
具体实验结果为:
附图说明
图1为本发明的总体框架示意图;
图2为本发明具体实施方式二中基于GRU的层次化神经网络模型的示意图;
图3为本发明具体实施方式二中基于GRU和CNN的层次化神经网络结构图;
图4为本发明具体实施方式二中基于Attention层次化神经网络结构图;
图5为本发明具体实施方式二中迁移学习模型的示意图;
图6为具体实施方式三中以“诚信”为主题抽取的句子。
图7为LDA模型示意图;
图8为具体实施方式三中LDA模型生成的主题示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711160875.8/2.html,转载请声明来源钻瓜专利网。