[发明专利]一种基于BERT的多特征细粒度中文短文本情感分类方法在审
| 申请号: | 202210066218.1 | 申请日: | 2022-01-20 |
| 公开(公告)号: | CN114443845A | 公开(公告)日: | 2022-05-06 |
| 发明(设计)人: | 丁晓静;卓胜祥;范华俊;左宁 | 申请(专利权)人: | 序跋网络科技(上海)有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200000 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于BERT的多特征细粒度中文短文本情感分类方法,包含以下步骤:步骤A、多维度特征综合表达:模型的输入有效特征包括4种:独热编码特征、位置编码特征、字形特征、拼音特征;四种特征均有相同的维度大小,进一步求平均后得到一个综合性的特征表达,该特征经过BERT模型后得到最终的特征表达;BERT Transformer叠加了多个多头自注意与前向神经网络模块,本发明加入的字形与拼音特征一定程度上可兼容输入文本中的字形相似或者同音字的错误,即使发生了这类错误也可正确提取相关语义,使模型可自适应于真实世界中的错误文本,提高模型预测的准确度。 | ||
| 搜索关键词: | 一种 基于 bert 特征 细粒度 中文 文本 情感 分类 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于序跋网络科技(上海)有限公司,未经序跋网络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210066218.1/,转载请声明来源钻瓜专利网。





