[发明专利]用于数据点的多项式的集群在审

专利信息
申请号: 201380079252.1 申请日: 2013-07-31
公开(公告)号: CN105637473A 公开(公告)日: 2016-06-01
发明(设计)人: 大卫·莱哈维;沙吉·沙因;阿米尔·格洛伯松;沙伊·沙莱夫-施瓦茨;罗伊·利夫尼 申请(专利权)人: 慧与发展有限责任合伙企业;耶路撒冷股份有限公司希伯来大学伊萨姆研究开发公司
主分类号: G06F7/08 分类号: G06F7/08
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 康泉;宋志强
地址: 美国德*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 据点 多项式 集群
【说明书】:

背景技术

在各种数据分类技术中,在训练阶段中处理欧几里得空间中的标记数据点的集合, 以确定将空间划分为各种类。标记点可代表诸如扫描的文件的非数值对象的特征。一 旦类得以确定,可基于在训练阶段期间构建的分类模型来分类新的点集合。可对训练 进行监督或不对训练进行监督。

附图说明

现在将参照附图以详细描述各种例示性的原理,附图中:

图1示出了各种类的示例;

图2示出了根据一种实施方式的系统的示例;

图3示出了根据一种实施方式的系统的另一示例;

图4示出了根据一种实施方式的系统的又一示例;

图5示出了根据例示性示例的方法;

图6示出了根据各种实施方式的多个数据点以及这些数据点中的一个点的邻 域(neighborhood)的示例;

图7示出了根据例示性示例的另一方法;

图8示出了根据例示性示例的、实施图7示出的方法的一部分的方法;

图9示出了根据例示性示例的另一方法;

图10示出了根据例示性示例的、实施图9示出的方法的一部分的方法。

具体实施方式

根据各种实施方式,从非数值数据中提取数字以使得计算装置可进一步分析 所提取的数值数据并/或对数据执行期望类型的操作。所提取的数值数据可被称为 “数据点”或“坐标”。一种用于分析从非数值数据中提取的数值数据的技术包 括:确定感兴趣的每个类的多项式的唯一集合,然后在数据点的一个集合上对多 项式求值。对于给定的数据点集合,类中的一个的多项式可求值为0或近似为0。 此类多项式被称为“近零(approximately-zero)多项式”。该数据点则被认为属于 与那些特定多项式对应的类。

在此,对于确定多项式是否求值为0包括确定多项式是否求值为近似为0(例 如,在公差参数以内)进行所有参考。

可对许多类型的非数值数据(也被称为数据特征)进行测量。例如,在字母 数字字符识别的情况下,可对扫描文件中遇到的每个字母数字字符进行多种不同 的测量。此类测量的示例包括构成字符的线条的平均斜度、字符的最宽部分的测 量、字符的最高部分的测量等。目标是确定每个可能的字母数字字符的合适的多 项式集合。由此,大写字母A具有多项式的唯一集合,B具有其自己的多项式的 唯一集合,以此类推。每个多项式具有次数n(n可为1、2、3等等),并且可使 用测量值中的一些或全部作为输出。

图1例示了三个类的示例-类A、类B和类C。多项式的唯一集合已被确定 为对应于每个类。还示出了数据点。数据点可实际上包括多个数据值。目标是确 定数据点属于哪个类。该确定是通过将数据点插入至每个类的多项式中并且确定 哪个多项式集合求值为接近0而完成的。与求值为接近0的多项式集合对应的类 是被确定为数据点所对应的类。

图1描绘的类可对应于字母表中的字母。例如,对于字母A,如果将测量值 (数据点或坐标)插入至字母A的多项式中,则该多项式求值为0或接近0,而 其他字母的多项式求值为不是0或不近似于0。因此,系统遇到文件中的字符,进 行各种测量,将那些数据点(或其中的至少一些)插入至各种字母的每个多项式 中,并且确定哪个字符的多项式求值为0。与那个多项式对应的字符是系统已遇到 的字符。

然而,分析的部分是确定哪些多项式用于每个字母数字字符。被称为近似消 逝理想(AVI:ApproximateVanishingIdeal)的一类技术可用于确定用于每个类的 多项式。词语“消逝”指的是这样的事实:对于正确的输入坐标集合,多项式求 值为0。“近似”意味着,为了分类的目的,只需要多项式求值为近似于0。然而, 许多这些技术是不稳定的。缺少稳定性意味着多项式在面对噪声时无法良好地运 行。例如,即使已对字母A进行了测量,如果字母A存在一些变形或者字母周围 存在多余像素,则(一个或多个)字母A的多项式可能根本不会消逝至0。一些 AVI技术是基于旋转技术的,旋转技术较快,但固有地不稳定。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧与发展有限责任合伙企业;耶路撒冷股份有限公司希伯来大学伊萨姆研究开发公司,未经慧与发展有限责任合伙企业;耶路撒冷股份有限公司希伯来大学伊萨姆研究开发公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380079252.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top