[发明专利]结合NBA赛事知识图谱的NBA篮球新闻自动生成方法有效
申请号: | 201910574961.6 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110309320B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 俞定国;廖龙飞 | 申请(专利权)人: | 浙江传媒学院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结合NBA赛事知识图谱的NBA篮球新闻自动生成方法,包括:对网络爬取的NBA文字直播文本数据预处理,去除爬虫网页标签,并且去除文字文本中的停用词,然后以五元组进行表示;根据提出的分段算法,对预处理后的文字直播数据进行数据分段,获得比赛发展趋势;根据提出的篮球赛事特殊事件的定义,进行特殊事件提取;定义篮球新闻描述模板;将数据分段结果、特殊事件提取结果和对应的新闻描述模板结合,生成新闻初稿;结合知识图谱,生成比赛背景信息,得到新闻终稿;由此,实现了NBA赛事新闻的自动生成,提高了生成的NBA赛事新闻的质量,并且能更好地对生成的新闻内容进行把控。 | ||
搜索关键词: | 结合 nba 赛事 知识 图谱 篮球 新闻 自动 生成 方法 | ||
【主权项】:
1.一种结合NBA赛事知识图谱的NBA篮球新闻自动生成方法,其特征在于,包括以下步骤:1)通过网络爬取NBA文字直播文本数据,去除爬虫网页标签,并且去除文字文本中的停用词,将得到的文本数据以五元组进行表示,得到多个以五元组表示的文本数据(简称五元组集合),每节比赛对应多个以五元组表示的文本数据;2)将步骤1)得到的多个以五元组表示的文本数据进行分段,获得比赛发展趋势;3)从步骤1)得到的多个以五元组表示的文本数据中发生的事件event总结篮球赛事特殊事件,结合步骤2)得到的分段,进行特殊事件提取,得到特殊事件的五元组;4)根据步骤2)得到的各节的比赛趋势总结结合步骤3)得到的特殊事件的五元组填入新闻描述模板,生成篮球赛事新闻初稿;5)根据NBA赛事知识图谱,查询获取比赛背景信息,结合篮球赛事新闻初稿,自动生成NBA篮球新闻。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江传媒学院,未经浙江传媒学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910574961.6/,转载请声明来源钻瓜专利网。