[发明专利]一种长篇章结构化文本摘要提取方法在审
申请号: | 201910957415.0 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110781290A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 杨理想;王云甘;周亚;黄家君;徐慧 | 申请(专利权)人: | 南京摄星智能科技有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/205;G06F40/253 |
代理公司: | 32341 南京中律知识产权代理事务所(普通合伙) | 代理人: | 沈振涛 |
地址: | 210000 江苏省南京市经济*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的长篇章结构化文本摘要提取方法,采用动态词嵌入方法可以根据周围单词动态地获取词向量,解决了文本中的多义词问题;采用篇章结构分析,根据句间的关系识别结果合理划分段落,让计算机从全局角度理解文本;采用基于模型和规则的摘要提取是在篇章结构分析的基础上对每一段进行摘要提取的,既解决了传统长文本摘要直接截取的问题;又解决了多领域文本摘要提取问题。 | ||
搜索关键词: | 摘要提取 篇章结构分析 文本 关系识别 领域文本 篇章结构 长文本 词向量 多义词 截取 单词 嵌入 计算机 全局 | ||
【主权项】:
1.一种长篇章结构化文本摘要提取方法,其特征在于:输入长文本信息,摘要提取步骤为:/n(1)转化为数值信息/n对输入的长文本信息按标点符号进行分句处理,对每一句采用Bert Word Embedding动态词嵌入处理转换成该句的向量矩阵,即计算机学习的数值信息;/n(2)篇章结构分析/n对每两句进行隐式篇章关系分析,即将每两个相邻子句放入两个双向GRU模型中进行处理,对两个模型的隐藏层信息进行拼接,将拼接后的结果放入多层感知机中进行分类,得到预测的类别概率,取概率最高的类别标签作为对应标签,并依据识别的标签类别对长文本进行合理分段;/n(3)摘要提取/n按照基于模型和规则两种方式对步骤(2)中分好的每个段落进行摘要提取,最终的摘要结果输出是融合了这两种方式的输出结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京摄星智能科技有限公司,未经南京摄星智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910957415.0/,转载请声明来源钻瓜专利网。