[发明专利]一种自动识别分类广告类型的广告分类方法无效

专利信息
申请号: 200610028305.9 申请日: 2006-06-29
公开(公告)号: CN101097570A 公开(公告)日: 2008-01-02
发明(设计)人: 陈壮坚;徐丽 申请(专利权)人: 上海唯客网广告传播有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06Q30/00
代理公司: 上海申汇专利代理有限公司 代理人: 翁若莹
地址: 200063上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动识别 分类广告 类型 广告 分类 方法
【说明书】:

技术领域

发明涉及一种自动识别分类广告类型的广告分类方法,使用本方法后,用户办理广告时可以不需要选择分类广告的类型,属于广告分类方法技术领域。

背景技术

分类广告是近几年才发展起来的新型广告,对于分类广告中产生的一些问题并没有很及时的解决,在分类广告的办理中,很多还是沿用了传统的工商广告的办理方法,但是由于广告类型的不同,传统的方法已经不再适用。在分类广告的办理中,最突出的问题就是广告的类型选择。分类广告的类型比较多,更新比较快,用户在办理广告时不一定能清楚了解自己办理的广告属于哪一种类型,在这种情况下,如果选择错误的分类,会导致广告的效力,减弱甚至广告失效。

目前的广告分类还是主要依靠人工来判别,如图1所示,为人工分类方法流程结构示意图,用户在客户端办理分类广告时,需要根据自己的经验来判断要办理的广告属于哪一种类型,然后再录入广告的标题和内容,最后提交到数据库中。例如用户办理一则广告的内容为“写字楼出租”,根据经验来判断,这则广告属于房屋租赁这个类型。

这种凭借主观判断的分类方法对于广告类型不多,使用的广告类型较常见的时候不易发生错误,例如常用的广告类型有招聘求职、房屋租赁等等。今后,分类广告的类型将会越来越多,广告的分类会越来越细,届时人工判断的准确率就会降低。

发明内容

本发明的目的是发明一种能够根据用户提交的广告标题和内容自动判断广告的类型,并提高分类准确率的自动识别分类广告类型的广告分类方法。

为实现以上目的,本发明的技术方案是提供一种自动识别分类广告类型的广告分类方法,其特征在于,用JAVA语言编制程序,使用mysql作为数据库,运行在计算机内,并把KNN算法引入到基于空间向量模型的线性分类器,以便一次性的对关键词相似的广告进行自动分类,该分类方法在计算机内执行时依次含有以下步骤:

一、在学习阶段:

步骤1:输入广告类型集;建立广告类型数据库,将每一种广告类型添加到数据库中,建成原始的广告类型集;广告类型数据库中建立两张数据表,一张表为广告类型表,一张为关键词表。

步骤2:确定采用的属性单位以及线性分类器类型,本方法中采用的分类器为基于改进空间向量模型的线性分类器;

步骤3:对广告类型集进行预处理,预处理包括中文语句的切分或者英文的stemming操作、同义词合并等;

步骤4:属性抽取:对广告类型集进行索引,得到原始属性集以及各广告类型的频度向量,广告类型用D表示,属性频度用t表示,指出现在广告类型中且能够代表该类型的基本语言单位,主要是由词或者短语构成,广告类型可以用属性频度的集合表示为D(T1,T2,…,Tn),其中Tk是属性频度,1<=k<=N;

步骤5:对原始属性集采用现有降维操作,即频度、权重,得到属性集,降维最基本的思想,就是利用迭代的方法,在降维空间中定位特征向量,使得它们之间的距离和相异性被尽可能多地保留下来,为了达到这个目的,在迭代中需要不断减小下面的平方误差度量:

p=∑[d*(xi,xj)-f(d(xi,xj))]2,式中,

xi,xj是任意的不同样本对(i≠j),d(xi,xj)是xi和xj之间的原始的相异程度,d*(xi,xj)是低维空间中转换后的相异程度,f是一个单调变换函数;

步骤6:以类型为单位,合并各广告的频度向量,得到类型的轮廓描述频度向量;

步骤7:对含有n个属性值的广告类型而言,通常会给每个属性赋予一定的权重表示其重要程度,即D=D(T1,W1;T2,W2;…,Tn,Wn),简记为D=D(W1,W2,…,Wn),为广告类型D的向量表示,其中Wk是Tk的权重,1<=k<=N,权重的计算方法使用特征频度-逆文档频度(TF*IDF)权重计算方法,TF*IDF方法使用词汇的出现频率来近似代表其重要程度,公式为

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海唯客网广告传播有限公司,未经上海唯客网广告传播有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200610028305.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top