[发明专利]面向微博的情感实体搜索系统有效
申请号: | 201310461443.6 | 申请日: | 2013-09-29 |
公开(公告)号: | CN103544242A | 公开(公告)日: | 2014-01-29 |
发明(设计)人: | 郝志峰;温雯;蔡瑞初;杜慎芝;陆印章;程杰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 情感 实体 搜索 系统 | ||
1.一种面向微博的情感实体搜索系统,其特征在于包括以下5个模块:
1)用户接口,用于系统与用户的交互,用户可以通过该模块提交查询请求并获得反馈结果;
2)查询扩展模块,用于对微博语料数据进行词语关系挖掘,并结合WordNet本体库建立加权词语关系图;
3)查询处理模块,用于将用户查询请求转换为索引库所能接受的查询关键词及查询语句,并基于模块2)构建的词语关系图进行查询扩展;
4)情感信息挖掘模块,用于对微博语料库进行情感挖掘,并生成情感实体及情感极性的判定规则;
5)情感信息判定及索引建立模块,用于对微博数据进行情感实体和情感极性的判定,建立情感信息索引,并进行存储;
6)倒排索引建立模块,用于对微博文本信息建立倒排索引,并进行存储。
2.根据权利要求1所述的面向微博的情感实体搜索系统,其特征在于上述模块1)中采用以下步骤实现查询扩展:
11)对微博语料库中的数据进行相关规则挖掘,输出相关规则挖掘所得到的相关词集;
12)结合11)所获得的频繁项及和WordNet本体库,构建加权词语关系图。
3.根据权利要求1所述的面向微博的情感实体搜索系统,其特征在于上述步骤11)中采用Eclat算法挖掘微博语料库的频繁项集并生成相关词集,并将相关词集和WordNet本体图通过映射或插入等形式形成加权词语关系图;
上述构建加权词语关系图时,节点权重的计算方法为:
f(d)=deg(d)=deg+(d)+deg-(d),
其中deg(d)、deg+(d)、deg-(d)分别表示结点的度、出度和入度;边权重的计算方法为:
其中lift(di→dj)是根据Eclat算法所得的di,dj的相关度。
4.根据权利要求1所述的面向微博的情感实体搜索系统,其特征在于上述模块3)中采用以下步骤实现查询处理:
31)接收用户输入的查询词或语句;
32)对用户的输入进行分词、去停用词和确定中心词的处理,得到一个或多个中心词;
33)将中心词在由本体和规则词构造的加权词语关系图库中选取适当的扩展词,并对扩展词进行权重计算;
34)然后选取权重大的前p个词语加入到查询词集合,并将扩展词集合输入至查询接口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310461443.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:洗衣液组合物
- 下一篇:用于生产具有光反射特性的制品的聚合物组合物