[发明专利]一种设计资源关联方法在审
申请号: | 202210557335.8 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114997288A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 于树松;郭保琪;刘晓菲;石硕;丁香乾;杨宁;刘国敬;牛迪 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 王笑 |
地址: | 266100 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设计 资源 关联 方法 | ||
1.一种设计资源关联方法,其特征在于,包括:
对众包设计资源构建多级语义模型;
将多级语义模型的语义链映射到语义空间;
将向量内积最大等价为欧式距离最小,在语义空间中对设计资源语义文本进行层次化聚类;
基于层次化聚类结果对设计资源进行关联;
其中,构建多级语义模型包括:
(1))遍历设计资源找到核心动谓词,以检测到的广义动宾关系得到一级语义;所述广义动宾关系包括直接宾语关系、间接宾语关系、前置宾语关系、核心动谓词与其支配的名词短语为状中关系、核心动谓词与其支配的名词短语为主谓关系、当核心动谓词的宾语缺失时以定中关系表达的修饰词;
(2)对一级语义中的谓词中心词和宾语中心词检测其修饰成分得到二级语义;
(3)对二级语义的中心词检测其修饰成分得到三级语义;
(4)将检测到的高于三级的语义成分补全到其隶属的中心词上。
2.根据权利要求1所述的设计资源关联方法,其特征在于,对众包设计资源构建多级语义模型,具体为:
步骤1、将众包设计资源短句进行词分隔和词性标注;
步骤2、将步骤1处理后的短句切分为多个独立短句;
步骤3、针对每个独立短句进行以下处理:
1)依存关系分析;
2)以并列关系和独立结构提取独立短句中的独立功能成分;
3)针对每个独立功能成分构建多级语义模型。
3.根据权利要求2所述的设计资源关联方法,其特征在于,以并列关系和独立结构关系提取独立短句中的独立功能成分,包括:
(1)当检测到的并列关系位于广义宾语修饰区域时,以核心动谓词为基础同等划分为两个独立功能成分;
(2)当检测到的并列关系位于核心动谓词之间时,同等划分为两个独立功能成分;
(3)当并列关系和独立结构同时存在时,若独立结构是动词性谓语且存在并列关系时,以所述独立结构的动词性谓语为基础同等划分为两个独立功能成分;若独立结构非动词性谓语时,不建立独立功能成分。
4.根据权利要求2所述的设计资源关联方法,其特征在于,针对每个独立功能成分构建多级语义模型,包括:
当检测到一级语义不存在核心宾语时,将其修饰部分视为其宾语,构建到一级语义中。
5.根据权利要求1所述的设计资源关联方法,其特征在于,将多级语义模型的语义链映射到语义空间采用映射模型实现,所述映射模型由嵌入层、中文BERT模型层和平均池化层构成;
所述嵌入层进行词向量和位置向量的嵌入操作,通过相加得到复合形式的嵌入矩阵;其中,词向量的嵌入操作中采用停止符“[STOP]”对输入序列进行掩码操作。
6.根据权利要求1所述的设计资源关联方法,其特征在于,将向量内积最大等价为欧式距离最小,包括:
预设一个值U<1,U为可调的超参数,0.8≤U≤1,计算x为语义向量;S是语义向量集合;
对每个语义向量Xi∈S都除以V,得到
对任一语义向量引入两种变换方法:
变换P(x)追加m项和变换Q(x)追加m个“1/2”,即
以及能得到
基于上面三个展开项,得到
左边代表原有的向量内积最大化,右边代表欧式距离最小化;
这样当进行任意向量q和xi的相似度比较时,为固定项,当m较大时可看出即得到
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210557335.8/1.html,转载请声明来源钻瓜专利网。