[发明专利]基于TextCNN模型的心力衰竭文本分类方法、系统及存储介质在审

专利信息
申请号: 202111133708.0 申请日: 2021-09-27
公开(公告)号: CN113849642A 公开(公告)日: 2021-12-28
发明(设计)人: 李灯熬 申请(专利权)人: 太原理工大学
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62;G06N3/04;G06N3/08;G16H10/60
代理公司: 北京一品慧诚知识产权代理有限公司 11762 代理人: 张宇
地址: 030600 山西省*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 textcnn 模型 心力衰竭 文本 分类 方法 系统 存储 介质
【权利要求书】:

1.一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:包括:

S1:收集医学文本数据;

S2:对医学文本数据进行预处理;

S3:将预处理后的文本数据通过Word2vec模型和LDA模型再次进行处理,获取词向量并进行拼接;

S4:将S3中拼接完的词向量放入卷积神经网络TextCNN模型中训练;

S5:输出训练结果。

2.根据权利要求1所述的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述S2的预处理包括:对文本数据去除标点符号、去除非法字符、去除数字及将所有的文本数据进行截断处理,使文本长度保持在256。

3.根据权利要求1所述的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述S3中Word2vec模型通过词的上、下文得到词的向量化表示。

4.根据权利要求3所述的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述Word2vec模型根据CBOW、Skip-gram两种方式获取词的向量化表示。

5.根据权利要求1所述的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述S3通过LDA模型采用词袋模型得到主题词向量集。

6.根据权利要求5所述的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述词袋模型为三层贝叶斯概率模型,包括词、主题和文档三层结构,所述文档到主题、所述主题到词都服从多项式分布。

7.根据权利要求所述6的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述LDA模型的生成过程包括:

对每一篇文档,从主题分布中抽取一个主题;

从被抽到的一个主题中所对应的单词分布中抽取一个单词;

重复抽取一个主题及一个主题中的一个单词,直至遍历文档中的每一个单词。

8.根据权利要求1所述的一种基于TextCNN模型的心力衰竭文本分类方法,其特征在于:所述S4的卷积神经网络TextCNN模型包括:输入层、卷积层、池化层与全连接层。

9.一种基于TextCNN模型的心力衰竭文本分类系统,其特征在于:所述基于TextCNN模型的心力衰竭文本分类系统包括:

存储器,用于存储可执行指令;

处理器,用于运行所述存储器存储的可执行指令时,实现上述权利要求1-8任一项所述的基于TextCNN模型的心力衰竭文本分类方法。

10.一种计算机可读存储介质,存储有可执行指令,其特征在于:所述可执行指令被处理器执行时实现上述权利要求9的基于TextCNN模型的心力衰竭文本分类方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111133708.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top