[发明专利]一种基于智能机器人的新闻稿生成方法在审
申请号: | 201810251918.1 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108470064A | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 敖冰峰;杨宏帅 | 申请(专利权)人: | 黑龙江省经济管理干部学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 孙莉莉 |
地址: | 150080 黑*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能机器人 实体机器人 数据抓取 条件检索 新闻播报 新闻检索 语音交互 语音识别 自动抽取 撰写 整合 机器人 | ||
本发明提出了一种基于智能机器人的新闻稿生成方法,所述方法包括数据抓取,热点人物、公司和事件的自动抽取、语音识别、新闻检索和新闻稿自动撰写。本发明将各种功能与实体机器人整合形成一个可以与用户进行语音交互、条件检索、自动新闻撰写和新闻播报的家庭新闻机器人管家。
技术领域
本发明属于无界传媒智能新闻机器人技术领域,特别是涉及一种基于智能机器人的新闻稿生成方法。
背景技术
继移动互联网之后,人工智能浪潮已开始掀起,迅速进入机遇期。今年5、6月,国务院连续印发了《中国制造2025》和《关于积极推进互联网+行动的指导意见》两个国家战略层面的文件,将我国智能产业推入快速发展的轨道。在“2015第五届中国智能产业高峰论坛”上,多位院士、专家解读了人工智能、互联网和智能制造的趋势和技术,人工智能技术将为基于互联网和移动互联网等领域的创新应用提供核心技术。
人工智能与媒体如何融合?互联网上有海量的信息,如何从浩瀚的资讯中找出最可能受关注的数据?如何从数据中提取观点?如何通过文字展示情感偏向?如何根据线索写出新闻报道?利用大数据分析、深度学习让机器自动撰写新闻,已经成为目前亟待解决的技术问题。
发明内容
本发明为了解决现有的技术问题,提出了基于智能机器人的新闻稿生成方法。
本发明的目的通过以下技术方案实现:一种基于智能机器人的新闻稿生成方法,所述方法包括以下步骤:
步骤1、智能机器人对主流新闻网站的新闻板块内容进行搜索与数据抓取;
步骤2、对抓取的数据进行挖掘,提取出人物、公司和事件;利用文本分析技术对所述人物、公司和事件进行分析,构建热点识别模型,识别出热点人物、公司和事件;
步骤3、对所述热点人物、公司和事件进行分类和排名,评选出每周最热的人物、公司和事件,推荐给智能机器人;
步骤4、被采访用户发出语音指令,智能机器人获取语音识别出用户关注的新闻命令,进行大数据分析检索,检索出符合特征新闻,根据评选出的每周最热的人物、公司和事件进行特征匹配优先级判定,筛选出优先级最高的新闻,进行文字语音合成并采访播报,从而形成采访记录语音;
步骤5、基于规则化大数据进行综合处理与转换,形成分类新闻原始数据集合,通过构建句子、段落和篇章级语料库模板,建立具有综合能力特征的新闻合成模板和语料合成模型;
步骤6、建立采访记录语音所合成的文字与新闻合成模板模糊匹配模型,采用多种数据合成、语料合成、数据替换、模糊比较与趋势-历史构建技术和规则化DOM文本生成技术,自动撰写适合特定主题的新闻稿件。
进一步地,所述综合能力特征包括充分融合规则数据分析、趋势分析和历史大比较分析。
进一步地,所述步骤4包含第一交流过程和第二交流过程,第一交流过程为被采访用户与智能机器人的自由交流过程,第二交流过程为智能机器人采访交流过程。
进一步地,所述第一交流过程具体为:
步骤4.1、开始交流命令词识别;
步骤4.2、被采访用户进行提问;
步骤4.3、智能机器人获取提问语音,对语音进行识别,将识别后的文字进行存储;
步骤4.4、对存储的文字进行最长公共子序列算法匹配,找到对应的预置问题答案,所述问题答案为语音形式,对所述问题答案进行播放;
步骤4.5、智能机器人识别交流是否结束,如结束,则获取结束交流命令字结束第一交流过程;如未结束则返回步骤4.2。
进一步地,所述第二交流过程具体为:
步骤4.6、开始,播放采访许可询问;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江省经济管理干部学院,未经黑龙江省经济管理干部学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810251918.1/2.html,转载请声明来源钻瓜专利网。