[发明专利]一种面向推荐服务的情感分析方法有效
申请号: | 201810049911.1 | 申请日: | 2018-01-18 |
公开(公告)号: | CN110119443B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 盛益强;王星凯;赵震宇 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F16/36 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 推荐 服务 情感 分析 方法 | ||
1.一种面向推荐服务的情感分析方法,其特征在于,该方法具体包括:
步骤1)推荐服务系统收集包括文本声调或语音音调在内的用户情感语料,并对所述用户情感语料进行处理,获得文本分类第一语料和第二语料;
所述步骤1)具体包括:采用分词工具对所述用户情感语料进行两次处理:第一,直接对所述用户情感语料进行切分,保留所有词汇,去除标点符号,将包含汉语的语料作为文本分类第一语料;第二,将文本分类第一语料进行分词后,过滤所有标点符号和无意义的特殊词,只保留含有语义信息的词,作为第二语料;其中,所述无意义的特殊词包括:时间词、量词、介词、助词、叹词、语气词和拟声词;
步骤2)采用卡方统计的方法,从第二语料中选出一部分词来构建同义词替换词库,并通过该同义词替换词库来扩展文本分类第一语料;
步骤3)采用转换工具,将步骤2)中扩展后的文本分类第一语料转换成带声调的拼音语料,并构建字母表对该拼音语料使用独热编码进行ONE-HOT量化,输入基于卷积神经网络搭建好的分类器中进行分类,通过结合推荐算法和情感分类结果建模,为用户提供推荐服务。
2.根据权利要求1所述的情感分析方法,其特征在于,所述步骤1)具体包括:采用结巴分词,对语料采取了两次处理;第一,使用结巴分词的精确模式,保留所有词汇,去除标点符号,将包含汉语的语料作为文本分类第一语料;第二,采用结巴分词和自然语言处理与信息检索汉语分词系统兼容的标记法,将文本分类第一语料进行分词后,标注句子中每个词的词性,过滤所有标点符号,和无意义的特殊词只保留含有语义信息的词,作为第二语料。
3.根据权利要求1所述的情感分析方法,其特征在于,所述步骤2)具体包括:利用卡方统计的方法,从第二语料中选取Top-N个关键词构建同义词词库;其中,N的大小由第二语料的词语数目来决定;其中,所述卡方统计方法是用来衡量两个变量间的相关性,具体为:在文本分类的问题特征选择阶段,主要判断一个特征词和一个类别之间是否相互独立;如果一个特征词和一个分类的类别之间相互独立,则该特征词对于该分类的类别没有表征作用,无法通过该特征词对文本进行分类;如果一个特征词和一个分类的类别之间不相互独立,则该特征词对于该类别有表征作用,进而通过该特征词对文本进行分类;
通过开方检验方法判断某个特征词与某个分类的类别是否相关,具体为:通过计算,开方值越大,则对原假设的偏离就越大;其中,将特征词与某个分类的类别不相关作为原假设;计算实际情况与原假设的开方误差,误差越大,则该特征词和该分类的类别的相关度越高,则某个特征词t和某个分类的类别c的开方值的计算公式(1)如下:
其中,A是属于该分类的类别且包含该特征词的文档数,B是不属于该分类的类别但包含该特征词的文档数,C是属于该分类的类别但不包含该特征词的文档数,D是不属于该分类的类别也不包含该特征词的文档数。
4.根据权利要求3所述的情感分析方法,其特征在于,所述步骤2)采用同义词增强方法,扩展文本分类第一语料,具体包括:构建一个哈希映射的集合M,将同义词词库中的Top-N个关键词作为Value,从哈工大同义词词林中找出该关键词对应的同义词作为key;如果文本分类第一语料中的文本包含了集合M中的key,将集合M中相应的Value添加到该文本对应的特征词后面。
5.根据权利要求1所述的情感分析方法,其特征在于,所述步骤3)包括:采用汉字拼音转换工具实现将文本分类第一语料转换为带声调的语料;由于对带声调的语料使用独热编码进行量化,因此,需要构建带声调的字母表,将所述带声调的语料分为训练集、验证集和测试集,再分别将训练集、验证集和测试集输入基于卷积神经网络搭建好的分类器中,并通过全连接层来完成正负情感的映射。
6.根据权利要求5所述的情感分析方法,其特征在于,所述步骤3)进一步包括:以基于用户的协同过滤推荐算法为基础,同时考虑到用户的情感倾向,把情感分类的结果加入到推荐系统中,为用户提供推荐服务。
7.根据权利要求1所述的情感分析方法,其特征在于,所述推荐服务系统包括电影推荐服务系统和酒店推荐服务系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810049911.1/1.html,转载请声明来源钻瓜专利网。