[发明专利]新闻摘要生成方法、装置、设备及计算机可读介质有效
申请号: | 201810694244.2 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109033074B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 徐伟;刘家辰;肖欣延;吕雅娟;佘俏俏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 摘要 生成 方法 装置 设备 计算机 可读 介质 | ||
1.一种新闻摘要生成方法,其特征在于,包括:
获取事件类新闻中的事件要素片段,其中,所述事件要素片段包括所述事件类新闻的时间要素、地点要素、人物要素和事件内容要素中的至少一项;
基于所述事件要素片段生成所述事件类新闻的摘要,所述摘要包括报头句、原因句以及意义句;
其中,所述获取事件类新闻中的事件要素片段的步骤包括:
确定所述事件类新闻的有效正文;
从所述有效正文中抽取所述事件要素片段;
其中,所述从所述有效正文中抽取所述事件要素片段的步骤,包括:
根据句子与各报头句特征的匹配性,获取所述句子对应于所述各报头句特征的分数;
将所述对应于所述各报头句特征的分数进行累加,以确定所述有效正文的每个句子的报头句匹配分数;
将具有最高报头句匹配分数的句子作为报头句;
其中,在所述报头句特征为正向特征的情况下,所述报头句匹配分数为正数;在所述报头句特征为负向特征的情况下,所述报头句匹配分数为负数;
其中,所述基于所述事件要素片段生成所述事件类新闻的摘要的步骤包括:
将所述报头句作为所述摘要的首句;
当原因句中具有原因的触发词,以及所述原因句和所述报头句的字数总和没有超过摘要字数限制时,将所述原因句添加至所述报头句的后面;
当意义句中具有意义的触发词,以及所述报头句、所述原因句和所述意义句的字数总和没有超过摘要字数限制时,将所述意义句添加至所述原因句的后面。
2.根据权利要求1所述的方法,其特征在于,所述从所述有效正文中抽取所述事件要素片段的步骤,包括:
从所述有效正文的指定段落中抽取具有报头模式的句子作为报头句。
3.根据权利要求2所述的方法,其特征在于,所述从所述有效正文中抽取所述事件要素片段的步骤还包括:
根据句子与各原因句特征的匹配性,获得所述有效正文的每个句子的原因句匹配分数,将具有最高原因句匹配分数的句子作为原因句。
4.根据权利要求2或3所述的方法,其特征在于,所述从所述有效正文中抽取所述事件要素片段的步骤还包括:
根据句子与各意义句特征的匹配性,获得所述有效正文的每个句子的意义句匹配分数,将具有最高意义句匹配分数的句子作为意义句。
5.一种新闻摘要生成装置,其特征在于,包括:
事件要素片段获取模块,用于获取事件类新闻中的事件要素片段,其中,所述事件要素片段包括所述事件类新闻的时间要素、地点要素、人物要素和事件内容要素中的至少一项;
摘要生成模块,用于基于所述事件要素片段生成所述事件类新闻的摘要,所述摘要包括报头句、原因句以及意义句;
其中,所述事件要素片段获取模块包括:
有效正文确定单元,用于确定所述事件类新闻的有效正文;
事件要素片段抽取单元,用于从所述有效正文中抽取所述事件要素片段;
其中,所述事件要素片段抽取单元进一步用于:
根据句子与各报头句特征的匹配性,获取所述句子对应于所述各报头句特征的分数;
将所述对应于所述各报头句特征的分数进行累加,以确定所述有效正文的每个句子的报头句匹配分数;
将具有最高报头句匹配分数的句子作为报头句;
其中,在所述报头句特征为正向特征的情况下,所述报头句匹配分数为正数;在所述报头句特征为负向特征的情况下,所述报头句匹配分数为负数;
其中,所述摘要生成模块进一步用于:
将所述报头句作为所述摘要的首句;
当原因句中具有原因的触发词,以及所述原因句和所述报头句的字数总和没有超过摘要字数限制时,将所述原因句添加至所述报头句的后面;
当意义句中具有意义的触发词,以及所述报头句、所述原因句和所述意义句的字数总和没有超过摘要字数限制时,将所述意义句添加至所述原因句的后面。
6.根据权利要求5所述的装置,其特征在于,所述事件要素片段抽取单元包括:
报头句确定子单元,用于从所述有效正文的指定段落中抽取具有报头模式的句子作为报头句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810694244.2/1.html,转载请声明来源钻瓜专利网。