[发明专利]一种基于DiTextCNN的中文政务信息的文本分类方法在审
申请号: | 202011238122.6 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112328791A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 吴颖;王琳;孙润元 | 申请(专利权)人: | 济南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06K9/62;G06N3/04 |
代理公司: | 苏州和氏璧知识产权代理事务所(普通合伙) 32390 | 代理人: | 李晓星 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于DiTextCNN的中文政务信息的文本分类方法,该方法包括以下步骤:步骤1:使用中文分词工具将政务数据标题文本信息切分成若干个中文单词;步骤2:将文本信息中的各个中文单词依次通过预训练语言模型进行向量化处理,得到文本信息中的各个中文单词的词向量表示;步骤3:将中文单词的词向量输入DiTextCNN模型的卷积层进行卷积和池化计算,提取局部关键词特征。本发明构思巧妙,DiTextCNN模型的全连接层有两种特征输入,一种是政务数据标题经过卷积层提取的局部关键词特征,另一种是政务数据的来源部门编码得到的one‑hot向量,两种特征拼接得到更加丰富的特征,从而更好地对政务信息进行分类,提升分类精度。 | ||
搜索关键词: | 一种 基于 ditextcnn 中文 政务信息 文本 分类 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011238122.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种病原体微生物宏基因组去宿主方法及试剂盒
- 下一篇:发光基板及显示装置