[发明专利]评价参数的生成方法以及基于评价参数的信息搜索方法无效

专利信息
申请号: 201110371870.6 申请日: 2011-11-21
公开(公告)号: CN103123633A 公开(公告)日: 2013-05-29
发明(设计)人: 杭鼎 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 赵娟
地址: 英属开曼群岛大开*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 评价 参数 生成 方法 以及 基于 信息 搜索
【权利要求书】:

1.一种评价参数的生成方法,其特征在于,包括:

接收用户输入的评价信息;

对所述评价信息进行文本分析,判断所述评价信息为主观性文本或为客观性文本;

若为主观性文本,则根据所述评价信息生成评价参数。

2.根据权利要求1所述的方法,其特征在于,还包括:

若所述评价信息为客观性文本,则过滤所述评价信息;

或者,针对所述评价信息添加客观性文本的标记信息。

3.根据权利要求1或2所述的方法,其特征在于,所述对评价信息进行文本分析,判断所述评价信息是否为主观性文本的步骤包括:

采用第一分类器训练生成主客观文本分类库文件;

对所述评价信息进行分词;

对分词后的每个词进行词性标注,获取所述评价信息的词性搭配特征;

根据所述评价信息的词性搭配特征统计该评价信息的第一特征向量;

由第一分类器根据所述评价信息的第一特征向量以及主客观文本分类库文件,判断当前评价信息为主观性文本或为客观性文本。

4.根据权利要求3所述的方法,其特征在于,所述采用第一分类器训练生成主客观文本分类库文件的子步骤包括:

采集主观性文本语料和客观性文本语料;

针对所述主观性文本语料和客观性文本语料进行批量分词;

对分词后的每个词进行词性标注;

根据所述词性标注的结果统计词性搭配特征,并从所述词性搭配特征中选取预设数量的分类用的词性搭配特征;

采用所述分类用的词性搭配特征,对主观性文本语料和客观性文本语料分别计算特征向量,生成主观性文本语料的特征向量集合,以及,客观性文本语料的特征向量集合;

采用第一分类器对所述主观性文本语料的特征向量集合,以及,客观性文本语料的特征向量集合进行学习训练,获得主客观文本分类库文件。

5.根据权利要求4所述的方法,其特征在于,所述对评价信息进行文本分析,判断所述评价信息是否为主观性文本的步骤,还包括:

根据所述评价信息的词性搭配特征判断当前评价信息是否具有预设的主观性文本特征,若是,则直接判定当前评价信息为主观性文本。

6.根据权利要求4或5所述的方法,其特征在于,所述词性搭配特征为二元词性搭配特征,所述根据评价信息的词性搭配特征统计该评价信息的第一特征向量的子步骤包括:

将所述评价信息的词性搭配特征与分类用的二元词性搭配特征进行匹配,根据匹配结果组织当前评价信息的特征向量字符串或特征向量表。

7.根据权利要求1或2或3或4或5所述的方法,其特征在于,所述根据评价信息生成评价参数的步骤包括:

采用第二分类器训练生成评价参数分类库文件;

获取所述评价信息的词搭配特征,并根据所述词搭配特征计算该评价信息的第二特征向量;

由第二分类器根据所述第二特征向量和评价参数分类库文件,确定当前评价信息的评价参数。

8.根据权利要求7所述的方法,其特征在于,所述评价参数包括好评、中评及差评,所述采用第二分类器训练生成评价参数分类库文件的子步骤包括:

采集好评词及差评词语料,统计出好评词表、好评词搭配表,以及,差评词表、差评词搭配表;

分别计算所述好评词表、好评词搭配表,以及,差评词表、差评词搭配表中各字、各词和/或各词搭配的特征向量,生成评价词语料的特征向量集合;

采用第二分类器对所述评价词语料的特征向量集合进行学习训练,获得评价参数分类库文件。

9.根据权利要求8所述的方法,其特征在于,所述由第二分类器根据所述第二特征向量和评价参数分类库文件,确定当前评价信息的评价参数的子步骤包括:

由第二分类器根据所述第二特征向量和评价参数分类库文件计算分值;

若所述分值大于第一阈值,则确定当前评价参数为好评;

若所述分值小于第二阈值,则确定当前评价参数为差评;

若所述分值在所述第一阈值与第二阈值之间,则确定当前评价参数为中评。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110371870.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top