[发明专利]一种文本的话题和情感联合检测方法及装置有效

专利信息
申请号: 201710301293.0 申请日: 2017-05-02
公开(公告)号: CN107273348B 公开(公告)日: 2020-12-18
发明(设计)人: 傅向华;武海瑛 申请(专利权)人: 深圳大学
主分类号: G06F40/30 分类号: G06F40/30;G06F40/289
代理公司: 深圳青年人专利商标代理有限公司 44350 代理人: 吴桂华
地址: 518060 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 话题 情感 联合 检测 方法 装置
【说明书】:

发明适用机器学习技术领域,提供了一种文本的话题和情感联合检测方法及装置,该方法包括:接收待检测的目标文本,使用预设的情感词典计算目标文本中每个词的初始情感倾向,将预先训练得到的词向量设置为目标文本的词向量的初始值,使用预设模型对目标文本进行训练,以得到目标文本中各个情感话题对与词之间的初始分配和各个情感对应的话题向量,将得到的话题向量设置为目标文本的情感对应的话题向量的初始值,根据得到的初始情感倾向、初始值以及初始分配,对目标文本中包括的每篇文档进行扫描,依次对扫描到的每个训练目标词执行预设的话题和情感检测步骤,从而得到目标文本所涉及的话题和情感,提高了获得的目标文本的话题和情感的准确度。

技术领域

本发明属于机器学习技术领域,尤其涉及一种文本的话题和情感联合检测方法及装置。

背景技术

近年来,随着移动互联网的迅猛普及和发展,微博、博客、论坛、微信等大量新兴社会媒体不断涌现,使得用户在个人电脑和移动终端表达意见、分享评论变得越来越便捷,因此越来越多的不同年龄段的用户都积极的参与到产品、服务、新闻等的实体评论中。面对海量的数据,如何有效地对其内容进行组织、整理、挖掘和分析,以准确识别出其中包含的观点信息和情感倾向,对于各个行业的企业及时了解用户诉求,掌握市场态势有着重要的现实意义,同时也是自然语言处理领域研究的热点问题。

联合话题情感混合模型的主要目标是通过对大量的文本集合进行分析、处理,归纳总结并推理出文本所隐含的语义结构和情感倾向,以鉴别其所讨论的话题和情感倾向。现有的大部分联合话题情感分析方法在概率话题模型的基础上进行扩展,以词作为基本属性,将文本表示为词的集合,可有效捕捉文档隐含话题。

然而,一方面,现有提出的联合话题情感分析方法,大多只是从数据本身的属性出发,以词为基本特征,基于词共现统计进行话题概率计算,每个词都被看作是一个单一的实体,各词语、语句之间语义层面的联系考虑较少,难以满足实际应用的需要。一般说来,共现次数越多的词,越有可能被分配在同一话题下。但当语料数较少或文本篇幅较短时,文本特征稀疏并且维度较高,这种单纯依靠词频统计进行话题和情感分配的方法往往会因为语义信息不足而造成情感分布和话题分布的结果不够理想。另一方面,现有的联合话题情感分析方法并没有考虑词语与词语之间的依赖关系,文本中词语与词语之间的依赖关系蕴含了非常丰富的语义信息,这种依赖关系对话题识别和情感分类的效果影响很大,因此,不考虑词语与词语之间的依赖关系时,获取的话题下情感分布的准确度不高。

发明内容

本发明的目的在于提供一种文本的话题和情感联合检测方法及装置,旨在解决现有技术的文本情感和话题联合检测准确率不高的问题。

一方面,本发明提供了一种文本的话题和情感联合检测方法,所述方法包括下述步骤:

接收待检测的目标文本,使用预设的情感词典计算所述待检测的目标文本中每个词的初始情感倾向;

获取预先训练得到的词向量,将所述获取的词向量设置为所述待检测的目标文本的词向量的初始值;

使用预设的联合话题情感混合模型对所述待检测的目标文本进行训练,以得到所述待检测的目标文本中各个情感话题对与词之间的初始分配和所述各个情感对应的话题向量;

将所述得到的所述情感对应的话题向量设置为所述待检测的目标文本的情感对应的话题向量的初始值;

根据所述目标文本中每个词的初始情感倾向、所述词向量和话题向量的初始值以及所述各个情感话题对与词之间的初始分配,对所述目标文本中包括的每篇文档进行扫描,依次对扫描到的每个训练目标词执行预设的话题和情感检测步骤,以得到所述目标文本所涉及的话题和情感。

另一方面,本发明提供了一种文本的话题和情感联合检测装置,所述装置包括:

情感倾向计算单元,用于接收待检测的目标文本,使用预设的情感词典计算所述待检测的目标文本中每个词的初始情感倾向;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710301293.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top