[发明专利]一种分类标签更新方法及系统有效
| 申请号: | 202211238893.4 | 申请日: | 2022-10-11 |
| 公开(公告)号: | CN115310564B | 公开(公告)日: | 2023-01-13 |
| 发明(设计)人: | 靳雯;赵洲洋;石江枫;王全修;于伟;王明超 | 申请(专利权)人: | 北京睿企信息科技有限公司;日照睿安信息科技有限公司 |
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/22;G06F18/23213;G06F40/289;G06F40/284 |
| 代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 李慧敏 |
| 地址: | 100013 北京市东*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 分类 标签 更新 方法 系统 | ||
1.一种分类标签更新方法,其特征在于,该方法包括:
S100,获取用户指定的L个待匹配的分类标签{D1,D2,…,Di,…,DL},其中,Di为第i个待匹配的分类标签,i的取值范围为1到L,L为待匹配的分类标签的数量;所述Di包括N个文本条目;Di具有J个关键词词向量{Di1,Di2,…,Dij,…,DiJ},其中,Dij为Di中的第j个关键词词向量,j的取值范围为1到J,J为Di中关键词词向量的数量;
S200,获取用户指定的第m个待更新的分类标签中的第q个文本条目Umq,获取Umq的R个词向量集合Vmq={Vmq1,Vmq2,…,Vmqr…,VmqR},其中,Vmqr为Vmq中的第r个词向量,Vmqr与Dij的向量维度相同,R为Vmq中词向量的数量;
S300,计算Vmq分别与每个待匹配的分类标签中所有关键词词向量之间的综合相似度SIM={SIM1,SIM2,…,SIMi,…,SIML},其中,SIMi为Vmq与Di之间的综合相似度,SIMi为Vmq中R个词向量与Di中J个关键词词向量之间的向量相似度的加权求和;
S400,获取SIM中的最大值,在最大值大于相似度阈值时,将第m个待更新的分类标签中第q个文本条目的分类标签更新为最大值对应的分类标签。
2.根据权利要求1所述的更新方法,其特征在于,所述S100包括:
S110,根据第i个待匹配的分类标签Di索引所有的相应文本条目,得到待匹配的N个文本条目集合Wi={Wi1,Wi2,…,WiN},其中N为Wi中文本条目的数量;
S120,对Wi进行分词得到X个词,对X个词中的常用词、数字和标点进行过滤得到M个词;将M个词分别转为词向量得到M个词向量集合Vi={Vi1,Vi2,…,ViM},其中M为Vi中词向量的数量;
S130,对Vi进行聚类得到Y个簇,提取Y个簇中的词向量,得到Di的J个关键词词向量{Di1,Di2,…,Dij,…,DiJ}。
3.根据权利要求2所述的更新方法,其特征在于,S130中的聚类采用K-means聚类算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿企信息科技有限公司;日照睿安信息科技有限公司,未经北京睿企信息科技有限公司;日照睿安信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211238893.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种矿山输运装置
- 下一篇:多功能滤芯及其制备方法





