[发明专利]一种网络舆情监控的应答生成方法及系统在审
| 申请号: | 201910577669.X | 申请日: | 2019-06-28 |
| 公开(公告)号: | CN110347898A | 公开(公告)日: | 2019-10-18 |
| 发明(设计)人: | 汤浩;武开智 | 申请(专利权)人: | 北京牡丹电子集团有限责任公司宁安智慧工程中心 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/35;G06F16/36;G06F17/27 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 赵秀斌 |
| 地址: | 157431 黑龙江省牡丹江市*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络舆情 关系词 应答 答复 页面 图谱 文本 句法分析器 爬虫 文本信息 监控 构建 网站 挖掘 | ||
本发明涉及一种网络舆情监控的应答生成方法及系统,包括采用爬虫从指定的行业相关的网站爬取数据,获取与所述行业的舆情事件相关的页面,通过句法分析器挖掘所述页面的文本信息中所包含的用于表示实体的若干个实体词及用于表征所述若干个实体词之间关系的关系词,基于所述实体词及所述关系词,构建所述行业的知识图谱,根据所述页面及所述行业的知识图谱,通过答复模型,生成对应所述页面的答复文本。本发明可提高所生成的答复文本的准确性。
技术领域
本发明涉及网络技术领域,尤其涉及一种网络舆情监控的应答生成方法及系统。
背景技术
微博、论坛、博客等即时通信工具已经成为人们获取信息,进而发表看法、传播信息的重要渠道。借助网络平台,舆情信息迅速传播,引起广泛关注,其传播的速度之快、范围之广、影响力之大,远非传统媒体可比,网络空间的匿名交互性、非时空限制性等特点,使网络舆情这股强大的社会舆论力量,对社会发展和稳定产生一定的冲击和影响。引发舆情危机对政府部门、公众媒体和大型企业来说,对政府部门、公众媒体和大型企业来说,如何加强对网络舆情的及时应对回复,成为网络舆情管理的一大难点。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种网络舆情监控的应答生成方法及系统。
本发明解决上述技术问题的技术方案如下:
一种网络舆情监控的应答生成方法,包括:
采用爬虫从指定的行业相关的网站爬取数据,获取与所述行业的舆情事件相关的页面;
通过句法分析器挖掘所述页面的文本信息中所包含的用于表示实体的若干个实体词及用于表征所述若干个实体词之间关系的关系词;
基于所述实体词及所述关系词,构建所述行业的知识图谱;
根据所述页面及所述行业的知识图谱,通过答复模型,生成对应所述页面的答复文本。
本发明的有益效果是:通过指定爬虫爬取行业相关的网站中的数据,获取行业的舆情事件相关的页面,采用句法分析器挖掘页面中文本信息所包含的实体词和实体词之间的关系词,构建行业的知识图谱,根据页面及行业的知识图谱,通过答复模型,生成答复文本,可提高所生成的答复文本的准确性。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,所述根据所述页面及所述行业的知识图谱,通过答复模型,生成对应所述页面的答复文本,具体包括以下步骤:
依据所述行业的知识图谱分析所述页面,得到所述页面的实体和关系信息;
采用word2vector方法提取所述页面的文本信息中的词语,对所述词语的词性标注,得到词向量和词性向量;
将所述词向量、所述词性向量及所述页面的实体和关系信息输入所述答复模型,得到对应所述页面的答复文本。
进一步地,所述答复模型通过以下步骤进行训练:
获取指定网站中与历史舆情事件相关的页面,人工设置所述页面的标准答复文本;
获取所述页面的词向量和词性向量;
将所述词向量和所述词性向量输入不同参数的所述循环神经网络RNN中,生成多个回复文本;
基于所述页面的标准答复文本及所述多个回复文本,得到所述答复模型。
进一步地,基于所述页面的标准答复文本及所述多个回复文本,得到所述答复模型,具体步骤包括:
分别计算所述生成的回复文本与所述页面的标准答复文本的相似度;
选取所述相似度最高的回复文本作为最优回复文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京牡丹电子集团有限责任公司宁安智慧工程中心,未经北京牡丹电子集团有限责任公司宁安智慧工程中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910577669.X/2.html,转载请声明来源钻瓜专利网。





