[发明专利]一种app分类系统有效
申请号: | 202110197951.2 | 申请日: | 2021-02-22 |
公开(公告)号: | CN113010671B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 俞锋锋;吕繁荣;陈津来;姚建明;李柳音 | 申请(专利权)人: | 杭州西湖数据智能研究院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 app 分类 系统 | ||
1.一种app分类系统,其特征在于,
包括预设的第一数据库、第二数据库、第一向量生成模型、第二向量生成模型、分类模型、处理器和存储有计算机程序的存储器,其中,所述第一数据库中存储有多条app的描述信息记录,所述app的描述信息记录包括app id和对应的app描述信息,所述app描述信息为文本信息;所述第二数据库中存储有多条app安装序列,所述app安装序列基于对应的设备上安装的app的id按照安装时间先后顺序排序得到;所述app id是app的唯一id,同一app在所述第一数据库和第二数据库中的app id相同;所述第一向量生成模型生成预设M维度的第一向量,所述二向量生成模型生成预设N维度的第二向量,当所述计算机程序被处理器执行时,实现以下步骤:
步骤S1、获取待分类app id,基于所述待分类app id并行执行步骤S2和步骤S3;
步骤S2、基于所述待分类app id判断所述第一数据库中是否存在对应的描述信息,若存在,将待分类app id对应的描述信息输入所述第一向量生成模型中生成待处理第一向量,否则,直接生成每一维度均为0的待处理第一向量;
步骤S3、基于所述待分类app id从所述第二数据库中随机获取预设X个app安装序列,将所述X个app安装序列输入所述第二向量生成模型中生成待处理第二向量;
步骤S4、将所述待处理第一向量和待处理第二向量拼接生成待处理输入向量;
步骤S5、将所述待处理输入向量输入所述分类模型中,输出待分类app id对应的app类别。
2.根据权利要求1所述的系统,其特征在于,
还包括训练样本数据集,包括多个已标注app类别的app id训练样本,当所述计算机程序被处理器执行时,还实现步骤S10、训练得到所述分类模型,具体包括:
步骤S101、从所述训练样本数据集中获取A个训练样本,从所述第一数据库中获取A个训练样本对应的描述信息,将每一训练样本对应的描述信息输入第一向量生成模型中得到对应的第一向量;
步骤S102、从所述训练样本数据集中获取B个训练样本,从所述第二数据库中获取预设Y个app安装序列,并将所述Y个app安装序列输入所述第二向量生成模型中获取B个训练样本中每一训练样本对应的第二向量,其中,B大于A,且所述B个训练样本中包括所述A个训练样本;
步骤S103、判断所述B个训练样本中每一训练样本是否存在对应的第一向量,若存在,则将训练样本对应的第一向量和第二向量拼接生成训练样本对应的输入向量,若不存在,则为训练样本生成每一维度均为0的第一向量并与对应的第二向量拼接,生成训练样本对应的输入向量;
步骤S104、每一训练样本对应的预设的R维度分类向量的实际app别对应的维度设置为1,其它维度设置为0,得到每一训练样本对应的实际分类向量,将B个训练样本对应的输入向量输入预设的分类模型中,得到每一训练样本对应的预测分类向量;
步骤S105、基于B个训练样本对应的预测分类向量和实际分类向量计算损失函数,并基于损失函数判断当前分类模型是否达到预设精度,若达到,则结束训练,否则,基于当前损失函数调整分类模型的模型参数,并返回步骤S101。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州西湖数据智能研究院,未经杭州西湖数据智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110197951.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有粪便提示功能的婴儿纸尿裤
- 下一篇:多模态视频检索系统