[发明专利]评价参数的生成方法以及基于评价参数的信息搜索方法无效
申请号: | 201110371870.6 | 申请日: | 2011-11-21 |
公开(公告)号: | CN103123633A | 公开(公告)日: | 2013-05-29 |
发明(设计)人: | 杭鼎 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评价 参数 生成 方法 以及 基于 信息 搜索 | ||
技术领域
本申请涉及文本分析的技术领域,特别是涉及一种评价参数的生成方法,一种评价参数的生成系统,一种基于评价参数的信息搜索方法,以及,一种基于评价参数的信息搜索系统。
背景技术
在交易平台,尤其是C2C、B2C模式的电子商务网站中,为有利地监管卖家的商业行为,通常会设置评价系统,由买家基于该评价系统针对每次的交易行为给卖家进行手动评价。例如,当买家与卖家完成一笔交易后,买家按照评价系统提供的“好评”、“中评”与“差评”的参数选项,选择其中一个评价参数,并给出相应的说明。或如,买家按照电子商务网站中设置的评价参数选项,比如,商品质量、卖家服务态度、物流速度等,选择其相应级别进行打分,根据分数对应到关联的评价参数,并给出相应说明。
这种现有的由买家进行手动评价的方式目前产生出诸多弊端,比如,某些买家在卖家的胁迫下给出好评的评价参数,但在说明栏内给出商品质量恶劣,服务态度差,物流慢的说明信息,这些与事实不符的评价参数,还将进一步影响到搜索结果的准确性,例如,一些不好的商品信息不会受到说明栏中说明信息的影响,也会基于其所获得的好评的评价参数,与真实的好评的商品信息一同排在搜索结果的前列,导致用户需要时间和精力去分辨,甚至需要重新搜索等,这不但加重了访问服务器的负担,而且浪费了网络资源。而且,随着电子商务的普及,买家仅仅按照预设的评价参数选项对交易进行评价显然无法满足用户的需求。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种评价参数的生成机制,用以客观、真实地反映评价信息,提高卖家监管的有效性,提升买家的使用体验,并减轻访问服务器的负担,减少网络资源的占用。
发明内容
本申请的目的是提供一种评价参数的生成方法和系统,用以客观、真实地反映评价信息,提高卖家监管的有效性,提升买家的使用体验。
本申请的又一目的是提供一种基于评价参数的信息搜索方法和系统,用以减轻访问服务器的负担,减少网络资源的占用。
为了解决上述问题,本申请公开了一种评价参数的生成方法,包括:
接收用户输入的评价信息;
对所述评价信息进行文本分析,判断所述评价信息为主观性文本或为客观性文本;
若为主观性文本,则根据所述评价信息生成评价参数。
优选的,所述的方法,还包括:
若所述评价信息为客观性文本,则过滤所述评价信息;
或者,针对所述评价信息添加客观性文本的标记信息。
优选的,所述对评价信息进行文本分析,判断所述评价信息是否为主观性文本的步骤包括:
采用第一分类器训练生成主客观文本分类库文件;
对所述评价信息进行分词;
对分词后的每个词进行词性标注,获取所述评价信息的词性搭配特征;
根据所述评价信息的词性搭配特征统计该评价信息的第一特征向量;
由第一分类器根据所述评价信息的第一特征向量以及主客观文本分类库文件,判断当前评价信息为主观性文本或为客观性文本。
优选的,所述采用第一分类器训练生成主客观文本分类库文件的子步骤包括:
采集主观性文本语料和客观性文本语料;
针对所述主观性文本语料和客观性文本语料进行批量分词;
对分词后的每个词进行词性标注;
根据所述词性标注的结果统计词性搭配特征,并从所述词性搭配特征中选取预设数量的分类用的词性搭配特征;
采用所述分类用的词性搭配特征,对主观性文本语料和客观性文本语料分别计算特征向量,生成主观性文本语料的特征向量集合,以及,客观性文本语料的特征向量集合;
采用第一分类器对所述主观性文本语料的特征向量集合,以及,客观性文本语料的特征向量集合进行学习训练,获得主客观文本分类库文件。
优选的,所述对评价信息进行文本分析,判断所述评价信息是否为主观性文本的步骤,还包括:
根据所述评价信息的词性搭配特征判断当前评价信息是否具有预设的主观性文本特征,若是,则直接判定当前评价信息为主观性文本。
优选的,所述词性搭配特征为二元词性搭配特征,所述根据评价信息的词性搭配特征统计该评价信息的第一特征向量的子步骤包括:
将所述评价信息的词性搭配特征与分类用的二元词性搭配特征进行匹配,根据匹配结果组织当前评价信息的特征向量字符串或特征向量表。
优选的,所述根据评价信息生成评价参数的步骤包括:
采用第二分类器训练生成评价参数分类库文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110371870.6/2.html,转载请声明来源钻瓜专利网。