[发明专利]对象识别方法、装置、电子设备及计算机可读存储介质在审
申请号: | 201811152505.4 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109614481A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 张林江 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G06Q30/06 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 钟文芳;宋海龙 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本信息 计算机可读存储介质 电子设备 对象识别 分词处理 生成模型 词向量 训练结果 变种 词库 预设 | ||
本公开实施例公开了一种对象识别方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;利用第一预设词库识别所述相关文本信息中出现的第一新词;在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。本公开实施例能够从相关文本信息识别出未知对象的变种关键词,进而能够正确识别出未知对象。
技术领域
本公开涉及计算机技术领域,具体涉及一种对象识别方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,各种各样的应用平台应运而生,同时也出现了不少不发分子利用互联网技术的一些漏洞规则进行一些违法犯罪活动。例如,目前现金贷等无抵押贷款十分火爆,引起不法分子利用漏洞规则进行套现等违法犯罪活动。蚂蚁花呗、京东白条等是目前十分普遍的套现产品,其原理是一个虚假卖家发布虚拟商品,买家用花呗支付,商家提成10%。这种虚拟商品在电商平台上十分普遍。为了打击这种现象,传统的方法是通过文字检索识别虚假商品,但是现在很多虚假卖家会进行隐蔽工程,将虚假商品进行伪装,比如改变商品名称,将商品名称变为拼音等其他别名,或者利用图片式文字对虚假商品进行描述。而传统的方式对这类现象无法识别,因此需要一种更好的识别方法来进行虚假商品的识别。
发明内容
本公开实施例提供一种对象识别方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种对象识别方法。
具体的,所述对象识别方法,包括:
获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;
利用第一预设词库识别所述相关文本信息中出现的第一新词;
在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;
将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。
结合第一方面,本公开在第一方面的第一种实现方式中,获取相关文本信息之后,还包括:
对所述相关文本信息进行预处理,并对预处理后的所述相关文本信息进行语义分割。
结合第一方面,本公开在第一方面的第二种实现方式中,所述已知对象和/或未知对象为系统平台上发布的虚拟对象;
所述获取相关文本信息,包括:
获取所述虚拟对象在所述系统平台上的发布内容和/或用户评论;
根据所述发布内容和/或用户评论确定所述相关文本信息。
结合第一方面、第一方面的第一种实现方式或第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别,包括:
根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量;
根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别。
结合第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811152505.4/2.html,转载请声明来源钻瓜专利网。