[发明专利]用于对文本进行分类的方法有效
| 申请号: | 201380024544.5 | 申请日: | 2013-05-15 |
| 公开(公告)号: | CN104285224B | 公开(公告)日: | 2018-11-16 |
| 发明(设计)人: | J·R·赫尔歇;J·勒鲁克斯 | 申请(专利权)人: | 三菱电机株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 通过根据文本确定文本特征并将文本特征变换为主题特征来对该文本进行分类。使用判别主题模型针对每一个主题特征来确定分数。该模型包括对主题特征进行操作的分类器,其中,通过变换根据文本特征来确定主题特征,并且变换被优化以最大化相对于不正确的类的分数的正确的类的分数。接着,选择针对文本具有最高分数的类标签。在按层次结构组织类的情况下,判别主题模型适用于根据前面的级别调节的每一个级别的类,并且跨级别组合分数以评估最高得分的类标签。 | ||
| 搜索关键词: | 用于 文本 进行 分类 方法 | ||
【主权项】:
1.一种用于对文本进行分类的方法,该方法包括以下步骤:根据所述文本来确定文本特征;将所述文本特征变换为主题特征;根据所述主题特征来确定分数,其中,所述根据所述文本来确定文本特征的步骤使用下述模型,其中,所述模型是包括对所述主题特征进行操作的分类器的判别主题模型,并且所述将所述文本特征变换为主题特征的步骤被优化以最大化相对于不正确的类的分数的正确的类的分数;以及选择针对所述文本具有最高分数的一组类标签,所述文本特征是fj,k(x,y),所述变换是根据下式进行的:gl,k(x,y)=hl(f1,k(x,y),...,fJ,k(x,y)),其中,j是j=1,……,J的特征类型的索引,k是与所述特征相关联的类的索引,x是所述文本,y是所述类标签的假设,并且hl(.)是对所述文本特征进行变换的函数,并且l是所述主题特征的索引,gl,k(x,y)是所述主题特征,其中,在处理器中执行所述步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380024544.5/,转载请声明来源钻瓜专利网。
- 上一篇:混凝土水槽自动生产线
- 下一篇:一种弧形木线条加工装置及其加工方法





