[发明专利]基于规则匹配和深度学习的用户质检需求分类方法及系统有效
申请号: | 202110689564.0 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113254596B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 滕召胜;龚冬成;杨智君;唐求;刘涛;吴娟;林海军;朱坤志;何民军;杨唐胜;欧阳博;成达 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/216;G06F40/242;G06F40/289;G06F40/30;G06N3/04;G06K9/62;G06N3/08 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 谭武艺 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 规则 匹配 深度 学习 用户 质检 需求 分类 方法 系统 | ||
1.一种基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,包括:
1)对待分类文本与各个行业的专有名词词典进行匹配,并计算与各个行业对应的行业标签之间匹配的行业概率Pi,选择值最大的行业概率Pi记为最大行业概率值P;所述待分类文本为待检测样品名称增强的待分类文本,所述待检测样品名称增强是指待分类文本中待检测样品名称的出现频率为两次以上;
2)若最大行业概率值P大于等于预设阈值G,则将最大行业概率值P对应的行业标签作为分类结果输出;否则,跳转执行下一步;
3)对待分类文本利用深度学习模型预测行业标签并计算预测的行业概率值H;针对最大行业概率值P、预测的行业概率值H两者,选择其中概率较大者所对应的行业标签作为最终的分类结果输出;
步骤1)包括:
1.1)首先提取待分类文本中的待检测样品名称和检测内容,然后分别将待检测样品名称和检测内容与各个行业的专有名词词典中的待检测样品名称和检测内容的专有词汇进行匹配,从而得到待检测样品名称的匹配状态s以及检测内容匹配的单词个数n;
1.2)根据待检测样品名称的匹配状态s以及检测内容匹配的单词个数n计算与各个行业对应的行业标签之间匹配的行业概率值Pi;其中,行业概率值Pi的计算函数表达式为:
Pi=a1*s+ a2*n,
上式中,a1为待检测样品名称的权重,a2为每匹配一个词汇权重值增加的权重,s为待检测样品名称的匹配状态,待检测样品名称的匹配状态取值为0或1,0表示不匹配,1表示匹配,n为检测内容匹配的单词个数,其中a2*n在超过上限值时取上限值;
1.3)选择值最大的行业概率值Pi记为最大行业概率值P。
2.根据权利要求1所述的基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,步骤1)之前还包括构建各个行业的专有名词词典的步骤:首先对各个行业的质检需求中的待检测样品名称和检测内容进行汇总,然后进行分词、去停用词和去重复词处理,最终得到各个行业的专有名词词典。
3.根据权利要求1所述的基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,所述待分类文本的组合形式为A+A+B,其中A为待检测样品名称,B为检测内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110689564.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗菌肽HT11及其衍生物和应用
- 下一篇:基于货物量的人力资源配置方法