[发明专利]文本分类参数生成器和使用所生成参数的文本分类器无效

专利信息
申请号: 01145408.3 申请日: 2001-12-28
公开(公告)号: CN1363899A 公开(公告)日: 2002-08-14
发明(设计)人: 福重贵雄;菅野祐司;饭冢泰树;玉利公一 申请(专利权)人: 松下电器产业株式会社
主分类号: G06F17/30 分类号: G06F17/30;G06F17/21
代理公司: 上海专利商标事务所 代理人: 赵国华
地址: 日本国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种参数集生成方法及系统,用于确定给定文档是否属于多个预定类别中指定的一个类别。评估样本选择屏使操作员能够交互输入用于选择要对所计算隶属分数进行评估的文档的各种命令参数。响应命令参数其中一个的输入,将对文档选择有用的信息以可视方式显示给操作员。评估值输入屏示出所选择文档,并允许操作员对每个显示的所选择文档输入一评估值。所输入的评估值反映给指定类别的基准向量。
搜索关键词: 文本 分类 参数 生成器 使用 生成
【主权项】:
1.一种参数集生成系统,用于确定给定文档是否属于多个预定类别中指定的一个类别,其特征在于,该系统包括:文档集,每个文档具有识别符(ID);包含每个文档记录的文档数据集,所述记录包含所述文档的文档ID以及在预定向量空间中表示所述文档特征的特征向量;包含每个类别记录的类别数据集,所述记录包含所述类别的类别ID、类别名称以及所述参数集,所述参数包括在所述预定向量空间中表示所述类别特征的基准向量以及所述类别的阈值;用于通过用文档的所述特征向量、所述基准向量以及与所述指定类别相关联的所述阈值,对每个文档计算隶属分数的装置,所述隶属分数表示文档是否属于所述指定类别;支持操作员输入用于选择文档的各种命令参数、用于对所述选择文档评估所计算的隶属分数的装置;根据所述命令参数其中一个命令参数的输入,向所述操作员可视地显示对于文档的所述选择有用的信息的装置;用于显示所选择文档以及允许所述操作员评估每个显示的所选择文档的所述隶属分数,即对此设定一经过评估的隶属分数的评估装置;用于若对于每个所述预定类别的每个文档存在所述经过评估的隶属分数便存储所述经过评估的隶属分数的装置;以及用于通过利用所述存储装置中各个文档若有的所述经评估的隶属分数来更新所述指定类别的所述基准向量的装置,所述经计算的文档隶属分数未就所述指定类别以及所述文档数据集中包含的特征向量进行过评估。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/01145408.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top