[发明专利]基于无监督学习的文本自动摘要方法、系统、设备及介质有效
申请号: | 201910211374.0 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109947931B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 庄浩杰;王聪;孙庆华 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于无监督学习的文本自动摘要方法、系统、设备及介质,所述方法包括:获取训练集,对训练集中的原文与摘要分别进行随机打乱,得到原文集合与摘要集合,并获取文本分类的数据集;搭建生成网络、分类判别网络以及真实性判别网络;采用原文集合对生成网络进行预训练;采用文本分类的数据集对分类判别网络进行预训练;采用摘要集合和预训练完成的生成网络输出的文本对真实性判别网络进行预训练;将生成网络与分类判别网络、真实性判别网络进行对抗训练;将待处理的原文输入对抗训练后的生成网络,输出该原文的摘要。本发明无需人工标记的原文‑摘要配对数据就可以进行训练与学习,大大降低了数据获取的成本。 | ||
搜索关键词: | 基于 监督 学习 文本 自动 摘要 方法 系统 设备 介质 | ||
【主权项】:
1.一种基于无监督学习的文本自动摘要方法,其特征在于,所述方法包括:获取训练集,对训练集中的原文与摘要分别进行随机打乱,得到原文集合与摘要集合,并获取文本分类的数据集;搭建生成网络、分类判别网络以及真实性判别网络;采用原文集合对生成网络进行预训练;采用文本分类的数据集对分类判别网络进行预训练;采用摘要集合和预训练完成的生成网络输出的文本对真实性判别网络进行预训练;将生成网络与分类判别网络、真实性判别网络进行对抗训练;将待处理的原文输入对抗训练后的生成网络,输出该原文的摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910211374.0/,转载请声明来源钻瓜专利网。