[发明专利]一种基于多角度的科研项目文本分类装置和方法有效
| 申请号: | 202110923095.4 | 申请日: | 2021-08-12 | 
| 公开(公告)号: | CN113590827B | 公开(公告)日: | 2023-08-01 | 
| 发明(设计)人: | 朱华;尹春林;苏蒙;潘侃;杨政;杨莉 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 | 
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/126;G06F40/30;G06N3/0442;G06N3/0464;G06N3/08 | 
| 代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 | 
| 地址: | 650217 云南省昆*** | 国省代码: | 云南;53 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 角度 科研项目 文本 分类 装置 方法 | ||
1.一种基于多角度的科研项目文本分类装置,其特征在于,包括:预处理模块、特征编码器、交叉注意力机制模块、残差模块和分类器;
所述预处理模块,用于对科研项目文本进行预处理,获得预处理文本,所述预处理文本包括主视图和辅助视图;
所述特征编码器,用于提取所述主视图和所述辅助视图文本字符串的语义特征,以及用于将提取出的所述主视图和所述辅助视图文本字符串的语义特征转化成特征向量,获得主视图特征和辅助视图特征;
所述交叉注意力机制模块,通过将交叉注意力机制用于所述主视图特征和所述辅助视图特征,获得交叉注意力特征;
所述残差模块,用于融合所述交叉注意力特征和所述主视图特征,获得交叉特征;
所述分类器,用于根据预设的项目类别,对所述交叉特征进行分类识别,获得分类结果,所述分类结果为所述科研项目文本属于所述预设的项目类别的概率值。
2.根据权利要求1所述的一种基于多角度的科研项目文本分类装置,其特征在于,所述交叉注意力机制模块根据所述主视图特征获得Query,根据所述辅助视图特征获得Key和Value,再利用放缩点积注意力机制获得交叉注意力特征,所述交叉注意力机制模块的具体计算方法为:
Q=main view query=(main view feature)WQ
K=side view key=(side view feature)WK
V=side view value=(side view feature)WV
式中,main view feature为主视图特征,side view feature为辅助视图特征,Crossview attention为交叉注意力特征,WQ、WK、WV为参数矩阵,dK为Q、K的列数。
3.根据权利要求1所述的一种基于多角度的科研项目文本分类装置,其特征在于,所述分类器包括第一全连接层和第二全连接层,所述第一全连接层使用ReLU激活函数,所述第二全连接层使用Sigmoid的激活函数。
4.根据权利要求3所述的一种基于多角度的科研项目文本分类装置,其特征在于,所述辅助视图的数量大于或者等于1。
5.根据权利要求4所述的一种基于多角度的科研项目文本分类装置,其特征在于,当所述辅助视图的数量为1时,所述分类器的具体计算方法为:
Classifier(cross feature)=Activation(max(0,(cross feature)W1+b1)W2+b2)
式中,cross feature为交叉特征,W1和W2为待学习的参数矩阵;b1和b2为偏置项。
6.根据权利要求4所述的一种基于多角度的科研项目文本分类装置,其特征在于,当所述辅助视图的数量大于1时,所述分类器的具体计算方法为:
Classifier(cross feature1,cross feature2)=Sigmoid(max(0,(cross feature1+cross feature2)W1+b1)W2+b2)
式中,cross feature1为第一交叉特征,cross feature2为第二交叉特征,W1和W2为待学习的参数矩阵,b1和b2为偏置项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110923095.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:排气式燃油滤清器
- 下一篇:一种金属钢管表层毛边去除装置





