[发明专利]一种超大规模晶圆缺陷数据的特征提取方法有效

申请号：	202010955780.0	申请日：	2020-09-11
公开（公告）号：	CN112200219B	公开（公告）日：	2022-04-19
发明（设计）人：	倪东;王皓玥	申请（专利权）人：	浙江大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06T7/00
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	刘静
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种超大规模缺陷数据特征提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种超大规模晶圆缺陷数据的特征提取方法，其特征在于，包括以下步骤：

步骤一：基于分布式计算平台对历史晶圆缺陷数据进行叠加，并通过对各个维度的数据进行排序、等深划分以及合并密度相似区间，从中提取可变采样网格；

步骤二：对输入的超大规模晶圆缺陷数据根据提取的可变网格计算各个网格的采样密度，从而进行基于密度的采样，在保留数据完整分布的前提下尽可能地减少数据量；

步骤三：对采样后的晶圆缺陷数据进行基于自适应的密度聚类方法的聚类；聚类完成后统计子簇的数量，以及各个子簇的期望、方差；

步骤四：采用高斯混合模型提取晶圆缺陷数据的概率分布特征；将自适应的密度聚类后得到的结果作为初值输入EM算法迭代拟合高斯混合模型分布，当达到设定的迭代阈值，保留概率密度分布参数单高斯组件数K、单高斯权重α_k、单高斯期望u_k、单高斯方差Σ_k作为超大规模晶圆缺陷数据的概率分布特征。

2.根据权利要求1所述的一种超大规模晶圆缺陷数据的特征提取方法，其特征在于，所述的步骤一具体为：对历史晶圆缺陷数据进行叠加，从中提取通用的可变采样网格；在提取晶圆缺陷数据的可变网格中，首先对历史晶圆缺陷数据的各个维度的缺陷数据点进行排序以及等深划分，然后通过比较划分后各相邻区间段的相似性，对密度相似的相邻区间段执行合并操作；由于各区间段包含相同数量的数据点，用区间段的长度|I_ij|来衡量其密度，其中I_ij表示第i维上的第j个区间段；同时引入参数ε定量表示相邻区间段的密度相似性，由公式(1)表示：

如果某两个相邻区间段的密度相似性值ε大于阈值T(0≤T≤1)，表示这两个相邻区间段密度相似，则可以进行合并。

3.根据权利要求1所述的一种超大规模晶圆缺陷数据的特征提取方法，其特征在于，所述的步骤一中，基于Spark分布式计算平台进行计算，并将大规模晶圆缺陷数据存储在HDFS分布式文件系统中。

4.根据权利要求1所述的一种超大规模晶圆缺陷数据的特征提取方法，其特征在于，所述的步骤二具体为：基于可变网格的密度采样是一种不等概率采样，密度不同的网格中具有不同的采样概率，具体计算方法由公式(2)表示：

其中，f(n_m)表示密度为n_m网格的采样概率函数，n_m为某个网格单元的密度，|G|为网格单元的总数，n为所有网格单元中所抽取样本量的总和，e为常量；当e＝0时，各网格单元的采样概率函数相同，抽样结果与简单随机抽样结果相同；当e＝1时，在各网格单元内将抽取相同数量的数据点。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010955780.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种可适应舞台位置变化的平面十字整体舞台基础
下一篇：一种可调角度的接地操作杆

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种超大规模晶圆缺陷数据的特征提取方法有效

专利文献下载