[发明专利]短文本分类方法、系统、计算机设备和可读存储介质在审
申请号: | 202111338583.5 | 申请日: | 2021-11-12 |
公开(公告)号: | CN114090773A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 刘伟硕 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/279;G06F40/30 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 栾瑜 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及一种短文本分类方法、系统、计算机设备及可读存储介质,其中,该短文本分类方法包括:短文本数据获取步骤,获取待分类的短文本数据;向量编码步骤,通过RoBERTa模型获取短文本数据在模型中每一层的向量表示,并将所述向量表示分别经注意力机制加权、实体向量映射得到所述短文本数据的注意向量及实体识别向量;分类标签获取步骤,拼接所述实体识别向量及所述注意向量后输入拼接向量至一TextCNN模型,所述TextCNN模型输出所述短文本数据的分类标签。通过本申请,通过在短文本分类任务中引入实体识别向量扩充短文本数据的语义信息,解决相关技术中提取短文本语义信息特征难得问题,从而提高短文本分类任务的准确率。 | ||
搜索关键词: | 文本 分类 方法 系统 计算机 设备 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111338583.5/,转载请声明来源钻瓜专利网。