[发明专利]评论信息中的情感信息确定方法及装置在审
| 申请号: | 202211606643.1 | 申请日: | 2022-12-12 |
| 公开(公告)号: | CN115935979A | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 刘健;魏丫丫;徐蕾;仲籽彦;韩飞 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/253;G06F40/268;G06F18/241 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 董文倩 |
| 地址: | 100033*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 评论 信息 中的 情感 确定 方法 装置 | ||
本申请公开了一种评论信息中的情感信息确定方法及装置。其中,该方法包括:获取目标业务的评价文本进行分词处理,得到多个词向量;根据多个词向量对应的分词在评价文本的出现频次确定多个词向量的权重,并依据多个词向量的权重和多个词向量对应的分词在评价文本中情感主题出现的概率确定多个词向量的主题分布矩阵,主题分布矩阵用于表示多个词向量与情感主题的关系;对主题分布矩阵中的情感词对应的词性情感值进行标注,根据情感词的前后文和词性情感值,确定情感词的目标情感值,词性情感值用于表示词向量对应的词语情感倾向,目标情感值用于表示情感词的情感强度;将多个词向量中情感词的目标情感值按照评论时间和主题进行分类,得到情感信息。
技术领域
本申请涉及大数据分析领域,具体而言,涉及一种评论信息中的情感信息确定方法及装置。
背景技术
移动互联网时代,用户对运营商提供服务的评价,往往通过互联网平台表达各自看法,形成服务评价舆情信息。现有的舆情分析技术,仅是通过用户预设的关键字信息,在数据库中进行匹配查找,得到对应的舆情信息,该种匹配查找的方式,过于局限,会使得用户检测到的舆情信息不全面,存在漏监控的事情发生。同时,单一的通过关键字去对舆情进行监测,数据统计维度单一,对于深度的舆情信息的监控不足。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种评论信息中的情感信息及装置,以至少解决由于单一的通过关键字确定评价信息中的情感信息导致获取到的情感信息准确性低的技术问题。
根据本申请实施例的一个方面,提供了一种评论信息中的情感信息确定方法,包括:获取目标业务的评论信息,并对评论信息中的评价文本进行分词处理,得到多个词向量;根据多个词向量对应的分词在评价文本的出现频次确定多个词向量的权重,并依据多个词向量的权重和多个词向量对应的分词在评价文本中每个情感主题下出现的概率确定多个词向量的主题分布矩阵,主题分布矩阵用于表示多个词向量与情感主题的关系;利用预先构建的情感词典对主题分布矩阵中的情感词对应的词性情感值进行标注,并根据情感词的前后文和词性情感值,确定情感词的目标情感值,词性情感值用于表示词向量对应的词语情感倾向,目标情感值用于表示情感词的情感强度;将多个词向量中情感词的目标情感值按照评论时间和主题进行分类,得到评论信息中的情感信息。
可选地,根据多个词向量对应的分词在评价文本中出现的频次确定多个词向量的权重,包括:确定每个词向量对应的分词在评价文本中的出现频次;确定评价文本对应的词语集中所有词的出现频次平均数;基于每个词向量对应的分词在评价文本中的出现频次和出现频次平均数确定每个词向量的表征值;根据每个词向量的表征值和每个词向量对应的分词在评价文本中的出现频次确定述多个词向量的权重。
可选地,依据多个词向量的权重和多个词向量对应的分词在评论信息中每个情感主题下出现的概率确定多个词向量的主题分布矩阵,包括:基于每个词向量对应的分词在评价文本中的出现频次和多个词向量的总数确定每个词向量对应的分词在评价文本中的第一出现概率;确定每个词向量在每个主题下的第二出现概率;基于第一出现概率、第二出现概率和每个词向量的权重确定主题分布矩阵中的元素,主题分布矩阵中的元素表示多个词向量所属的情感主题。
可选地,利用预先构建的情感词典对主题分布矩阵中的情感词对应的词性情感值进行标注,包括:将主题分布矩阵中的所有情感词与情感词典进行匹配;将所有情感词中匹配为正面情感词的情感词标注词性情感值为第一数值,匹配为负面情感词的情感词标注词性情感值为第二数值,匹配为中性情感词的情感词标注词性情感值为第三数值。
可选地,根据情感词的前后文和词性情感值,确定情感词的目标情感值,包括:从情感词典中确定目标句子中情感词后的标点符号对应的第一情感值;从情感词典中确定目标句子中情感词前的程度副词对应的第二情感值;确定目标句子中情感词前存在的否定词数量,并根据否定词数量确定第三情感值,其中,目标句子表示情感词所在的句子;根据词性情感值、第一情感值、第二情感值以及第三情感值确定目标情感值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211606643.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





