[发明专利]基于主体模型的网上评论情感分类方法有效

申请号：	201410389465.0	申请日：	2014-08-08
公开（公告）号：	CN104199845B	公开（公告）日：	2018-05-29
发明（设计）人：	姜明;王建;陈婵;王兴起;张旻;汤景凡;胡宏宇	申请（专利权）人：	杭州电子科技大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06F17/27
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	黄前泽
地址：	310018 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于主体模型的网上评论情感分类方法。本发明首先提取网站的评论。其次使用中文分词包对评论进行分词，去除人称代词、助词、数字、字母以及标点符号。然后选定各个模型参数以及需要进行分类的情感数，并进行建立模型。最后将建立的模型应用于评论的情感分类，根据情感分布来判断每篇文档的情感值。本发明代替了人力来进行评论的情感分类，解放了双手，并且效率更高，更快。
搜索关键词：	情感分类网上评论主体模型评论标点符号建立模型模型参数模型应用人称代词中文分词分词网站文档去除双手分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于主体模型的网上评论情感分类方法，其特征在于包括如下步骤：步骤(1)提取网站的评论，具体是：分析某门户网站以及某购物网站网页源代码，利用正则表达式获取评论栏，记录该评论属于哪一类别，并按照每类每条评论一个文本文件存储；步骤(2)使用中文分词包对评论进行分词，具体是：选定中文分词包以及分词方法，选定要求是尽可能的保持原文的语义环境，这里使用的是最大粒度细分的方法；步骤(3)去除人称代词、助词、数字、字母以及标点符号；步骤(4)选定各个模型参数以及需要进行分类的情感数，具体是：4-1、选定模型的超参数α，γ，将其设置为1；4-2、设定模型参数T，即主题的数目；4-3、设置另外一个超参数β，β设置为T/50；4-4、设置情感数S，要分类的情感有两种，即正面和负面，所以S为2；步骤(5)建立模型，具体是：本模型在主题模型的基础上加入了情感因素的考量；按照自然语言的表达习惯，假设一句话只表达一个情感值，故对句子进行情感标签采样，建立文档-句子-情感关系；同样的，每句话也只表达一个主题，对句子进行主题采样，建立文档-句子-主题关系；步骤(6)将步骤(5)中建立的模型应用于评论的情感分类，具体是：根据预处理的网上评论，也就是文档生成过程的最终结果—-主题情感词，逆向工程，求出在文档生成过程中发挥重要作用的三个概率分布变量，主题分布θ，情感分布П和主题-情感词分布Ψ，然后根据情感分布П来判断每篇文档的情感值；使用Gibbs sampling算法来估计分布变量θ，Ψ，П，马卡洛夫链的每次转移中，第i个句子的情感标签和主题标签是根据以下的条件概率来抽取的： P ( z i = t , s i = j | S - i , Z - i , W ) &Proportional; C o u n t ( s , t ) - i + α C o u n t ( s ) - i + T α Γ ( C o u n t ( s , t ) + β ) Γ ( C o u n t ( s , t ) + V β + m i ) Π w = 1 V Γ ( C o u n t ( s , t ) + β + m i ) Γ ( C o u n t ( s , <

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410389465.0/，转载请声明来源钻瓜专利网。

上一篇：通过黄页信息提取电话号码的方法及云端服务器
下一篇：一种基于社会网络交互数据的服务排序及推荐方法与系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于主体模型的网上评论情感分类方法有效

专利文献下载