[发明专利]一种纳米孔单分子感知信号知识表示学习方法在审
申请号: | 202210568004.4 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114974463A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 唐鹏;翁婷;殷博华 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 北京汉迪信和知识产权代理事务所(普通合伙) 16085 | 代理人: | 赵景焕 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纳米 分子 感知 信号 知识 表示 学习方法 | ||
本发明公开一种纳米孔单分子感知信号知识表示学习方法,其为基于实例判别transformer的学习方法,其适用于机器学习和纳米孔单分子感知技术;本发明方法包括:构建基于transformer的纳米孔单分子感知信号知识表示学习神经网络模型;创建纳米孔单分子感知信号数据集并对信号数据进行合适的预处理;设置神经网络模型内各参数初始值,以最小化损失函数为目标训练模型实现针对纳米孔单分子感知信号的实例级判别;将待处理的感知信号输入到训练完成的模型输出信号对应的知识表示。本发明在编码器部分采用了transformer结构,实现了信号在知识表示空间内的稀疏分布,并且其直接从信号数据中挖掘模式信息,可适用于不同类型的下游信号分析任务,通用性和有效性强。
技术领域
本发明属于数据分析与挖掘技术领域,具体涉及一种纳米孔单分子感知信号知识表示学习方法,尤其涉及一种基于实例判别transformer的纳米孔单分子感知信号知识表示学习方法。
背景技术
近年来,纳米孔单分子感知技术因其超高空间分辨率和无标记检测的优势得到广泛地关注,在医疗诊断和生化检测领域具有广阔前景。纳米孔单分子感知技术原理依据是在电压驱动下分子通过纳米孔时产生的阻遏电流变化,这些阻遏电流变化与分子自身结构特征及物化特征有关。通过分析阻遏电流信号即分子过孔行为信息便可间接了解分子结构特征信息。目前主流纳米孔单分子感知信号分析是从电流记录数据中提取信号后针对信号的幅值、时长或其他统计特征进行统计学分析。阻遏电流信号的统计特征限制了对单分子过孔行为进行深入细致地了解。
近年来,研究者开始意识到统计分析的局限性,并针对纳米孔单分子感知信号分析的方法学进行改进。一部分研究结合机器学习算法对阻塞信号进行分类,但训练模型的特征信息仍然是统计特征。比如,Wang等利用信号的均值、方差等统计指标构建特征向量结合Gradient Boost、CART、XGBoost、Random Forest、KNN等多种机器学习的分类算法,实现了对microRNA、siRNA、tRNA和5S rRNA的区分。Liu等基于类似的特征结合KNN、SVM、Decision Trees等机器学习分类算法,实现对Lysozyme、Apo/Holo-myoglobin、ACTR/NCBD等多种蛋白的分类区分。Diaz等基于mean、height、levels、dwelltime四种统计特征结合DNN、CNN、LSTM、XGBoost算法模型,区分识别A、T、C、G四种碱基通过二硫化钼固态纳米孔的信号。另一部分研究经人为设计并提取信号数据中的信息作为特征训练分类模型。比如,Wei等对感知信号进行shapelets提取,并以shapelets作为特征结合交叉熵损失构建分类模型,区分仅具单碱基差异的两种碱基序列过孔信号。Fu等使用EEMD、VMD、ITD结合HilbertTransform提取的时频特征训练ResNet分类模型,实现对两种相似碱基序列信号的区分。
尽管现有技术针对感知信号的分析取得了一定技术成果,但是现有感知信号分析的根本问题在于:在不对信号内隐含的分子过孔行为模式信息直接进行学习挖掘的情况下,很难使用统计特征或人工特征实现对分子过孔行为机制的有效描绘。
发明内容
针对现有技术存在的问题,本发明公开了一种纳米孔单分子感知信号知识表示学习方法,尤其涉及一种基于实例判别transformer的纳米孔单分子感知信号知识表示学习方法,其适用于机器学习和纳米孔单分子感知技术。
依据本发明专利的技术方案,提供一种纳米孔单分子感知信号知识表示学习方法,其为一种基于实例判别transformer的纳米孔单分子感知信号知识表示学习方法,其适用于机器学习和纳米孔单分子感知技术。
进一步地,所述纳米孔单分子感知信号知识表示学习方法包括以下步骤:
步骤一、构建基于transformer的纳米孔单分子感知信号知识表示学习神经网络模型;
步骤二、创建纳米孔单分子感知信号数据集并对信号数据进行合适的预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210568004.4/2.html,转载请声明来源钻瓜专利网。