[发明专利]多标签识别方法、装置、电子设备及存储介质在审

申请号：	202210027793.0	申请日：	2022-01-11
公开（公告）号：	CN114358007A	公开（公告）日：	2022-04-15
发明（设计）人：	舒畅;陈又新	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F40/289	分类号：	G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	廖慧贤
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	标签识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及人工智能技术领域，本申请实施例提供了一种多标签识别方法、装置、电子设备及存储介质。该方法包括：对用户基础数据进行归一化处理，得到用户基础特征；通过图卷积模型对用户行为数据进行特征提取，得到行为特征矩阵；对用户评论数据进行分词处理，得到评论文本词段向量；将评论文本词段向量输入至对比学习模型以使评论文本词段向量与参考词嵌入矩阵进行矩阵相乘，得到评论词嵌入向量；对用户基础特征、行为特征矩阵及评论词嵌入向量进行融合处理得到标准画像特征向量；通过标签识别模型对标准画像特征向量进行标签识别处理，得到画像标签的概率值；根据概率值，得到目标画像标签。本申请实施例提高了用户画像标签的识别准确性。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种多标签识别方法、装置、电子设备及存储介质。

背景技术

目前，在对互联网用户进行画像标签时，常常采用人工标注或者机器学习的方式来对画像标签进行识别和分类。当采用人工标注方式时，往往需要经过长时间的标记处理，且出错率较高，影响识别准确性；而当采用机器学习的方式对多标签画像进行识别时，往往需要针对不同的标签类别，分别训练分类器，往往需要花费较多的时间进行模型训练，影响识别效率。因此，如何提供一种多标签识别方法，能够提高用户画像标签的识别准确性及识别效率，成为了亟待解决的技术问题。

发明内容

本申请实施例的主要目的在于提出一种多标签识别方法、装置、电子设备及存储介质，旨在提高用户画像标签的识别准确性及识别效率。

为实现上述目的，本申请实施例的第一方面提出了一种多标签识别方法，所述方法包括：

获取原始数据，其中，所述原始数据包括用户基础数据、用户行为数据以及用户评论数据；

对所述用户基础数据进行归一化处理，得到用户基础特征；

通过预先训练的图卷积模型对所述用户行为数据进行特征提取，得到行为特征矩阵；

对所述用户评论数据进行分词处理，得到评论文本词段向量；

将所述评论文本词段向量输入至预先训练的对比学习模型中，以使所述评论文本词段向量与所述对比学习模型中的参考词嵌入矩阵进行矩阵相乘，得到评论词嵌入向量；

对所述用户基础特征、所述行为特征矩阵以及所述评论词嵌入向量进行融合处理，得到标准画像特征向量；

通过预先训练的标签识别模型对所述标准画像特征向量进行标签识别处理，得到每一预设画像标签的概率值；

根据所述概率值与预设概率阈值的大小关系，得到目标画像标签。

在一些实施例，所述通过预先训练的图卷积模型对所述用户行为数据进行特征提取，得到行为特征矩阵的步骤，包括：