[发明专利]一种长篇章结构化文本摘要提取方法在审

申请号：	201910957415.0	申请日：	2019-10-10
公开（公告）号：	CN110781290A	公开（公告）日：	2020-02-11
发明（设计）人：	杨理想;王云甘;周亚;黄家君;徐慧	申请（专利权）人：	南京摄星智能科技有限公司
主分类号：	G06F16/34	分类号：	G06F16/34;G06F40/205;G06F40/253
代理公司：	32341 南京中律知识产权代理事务所(普通合伙)	代理人：	沈振涛
地址：	210000 江苏省南京市经济***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供的长篇章结构化文本摘要提取方法，采用动态词嵌入方法可以根据周围单词动态地获取词向量，解决了文本中的多义词问题；采用篇章结构分析，根据句间的关系识别结果合理划分段落，让计算机从全局角度理解文本；采用基于模型和规则的摘要提取是在篇章结构分析的基础上对每一段进行摘要提取的，既解决了传统长文本摘要直接截取的问题；又解决了多领域文本摘要提取问题。
搜索关键词：	摘要提取篇章结构分析文本关系识别领域文本篇章结构长文本词向量多义词截取单词嵌入计算机全局
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种长篇章结构化文本摘要提取方法，其特征在于：输入长文本信息，摘要提取步骤为：/n(1)转化为数值信息/n对输入的长文本信息按标点符号进行分句处理，对每一句采用Bert Word Embedding动态词嵌入处理转换成该句的向量矩阵，即计算机学习的数值信息；/n(2)篇章结构分析/n对每两句进行隐式篇章关系分析，即将每两个相邻子句放入两个双向GRU模型中进行处理，对两个模型的隐藏层信息进行拼接，将拼接后的结果放入多层感知机中进行分类，得到预测的类别概率，取概率最高的类别标签作为对应标签，并依据识别的标签类别对长文本进行合理分段；/n(3)摘要提取/n按照基于模型和规则两种方式对步骤(2)中分好的每个段落进行摘要提取，最终的摘要结果输出是融合了这两种方式的输出结果。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京摄星智能科技有限公司，未经南京摄星智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910957415.0/，转载请声明来源钻瓜专利网。

上一篇：一种保留非结构化文本语义的文本可视化方法
下一篇：一种文本摘要提取方法、装置、服务器及可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种长篇章结构化文本摘要提取方法在审

专利文献下载