[发明专利]一种基于多类特征融合的新兴热点话题检测系统有效
申请号: | 201810170864.6 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108399241B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 廖祥文;陈国龙;殷明刚;杨定达 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/284;G06F40/211;G06N3/04;G06Q50/00;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多类特征融合的新兴热点话题检测系统,包括:数据预处理模块,用于对微博文本进行预处理;分层序列模型,用于训练双向循环神经网络模型,通过使用双向的LSTM网络,训练输入的微博文本;词序列编码层,用于对句子中的各个词语向量化,形成初步的向量表示;句子级别特征求解层,用于对微博句子构建静态特征向量,与该层的神经网络动态特征进行链接,形成微博句子向量表示;话题级别特征求解层,用于对话题构建静态特征向量,与该层的神经网络动态特征进行链接,形成话题的向量表示;话题预测模块,用于对话题进行预测。本发明基于双向长短时期记忆网络架构,加入相应的动态特征和静态特征,提高新兴热点话题检测能力。 | ||
搜索关键词: | 一种 基于 特征 融合 新兴 热点话题 检测 系统 | ||
【主权项】:
1.一种基于多类特征融合的新兴热点话题检测系统,其特征在于,包括:一数据预处理模块,用于对微博文本进行预处理;一分层序列模型,用于训练双向循环神经网络模型,通过使用双向的LSTM网络,训练输入的微博文本;一词序列编码层,用于对句子中的各个词语向量化,形成初步的向量表示;一句子级别特征求解层,用于对微博句子构建静态特征向量,与该层的神经网络动态特征进行链接,形成微博句子向量表示;一话题级别特征求解层,用于对话题构建静态特征向量,与该层的神经网络动态特征进行链接,形成话题的向量表示;一话题预测模块,用于对话题进行预测,经过softmax层输出各个话题是新兴热点话题和非新兴热点话题的概率,并得到预测概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810170864.6/,转载请声明来源钻瓜专利网。