[发明专利]一种基于Transformer网络和知识蒸馏的无线资源需求预测方法在审
| 申请号: | 202310335507.1 | 申请日: | 2023-03-30 |
| 公开(公告)号: | CN116307234A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 沈仲瀚;赫凯 | 申请(专利权)人: | 湖南华诺科技有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/0631;G06Q50/30;G06F18/214;G06N3/0455;G06N3/096;G06N5/04 |
| 代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 洪丽 |
| 地址: | 410221 湖南省长沙市高*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 transformer 网络 知识 蒸馏 无线 资源 需求预测 方法 | ||
1.一种基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,包括以下步骤:
S1,获取历史基站原始数据,包括数值型指标特征信息、类别型指标特征信息和文本型数据,划分为训练集、验证集和测试集;
S2,分别对训练集、验证集和测试集中的数值型指标特征信息、类别型指标特征信息和文本型数据进行预处理;
S3,建立教师网络模型,采用训练集中的数值型指标特征信息和类别型指标特征信息作为训练数据输入所述教师网络模型进行训练,得到配置最优参数的教师网络模型及其学到的知识;
S4,建立学生网络模型,结合步骤S2中的文本型数据作为网络输入,通过自然语言分析,并采用步骤S3训练好的教师网络,基于知识蒸馏算法将教师网络学到的知识迁移到学生网络,通过不断地反复迭代实验,当学生网络的总损失Lossstudent下降收敛稳定时,得到最终的学生网络模型;
S5,采用步骤S4得到的学生网络模型对无线规划需求库中的站点进行推理,得到对应的需求度;结合基站需求度以及待需求预测区域的地址信息,按照优先级高低顺序输出待需求预测区域内无线基站清单。
2.根据权利要求1所述的基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,所述数值型指标特征信息具体包括站间距、所有无线基站的站间距、同频段无线基站的站间距、同网络无线基站的站间距和覆盖面积值;所述类别型指标特征信息包括:站型、网络类型、场景值、区域类型值、建设类型值、覆盖目标重要程度值、高度维度网络结构值、距离维度网络结构值、网络结构值、需求频段类型值、问题点类型值和问题点关联数量值;所述文本型数据包括基站站点名。
3.根据权利要求1所述的基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,步骤S2中的预处理过程具体包括:对数值型指标特征信息进行归一化处理,对类别型指标特征信息进行独热处理,以及对文本型数据进行分词向量化处理。
4.根据权利要求1所述的基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,步骤S3中,建立的教师网络模型包括两个全连接层块和结果预测全连接层;所述全连接层块包括全连接层、层正则化、激活层和随机失活层;
数值型指标特征信息和类别型指标特征信息作为结构化数据输入全连接层块进行训练,所述结果预测全连接层输出预测结果;采用损失函数Lossteacher优化模型中的参数,直到损失函数Lossteacher稳定下降且收敛,并以在测试集中Lossteacher结果符合预期的教师网络模型配置参数,作为教师网络的参数最优配置。
5.根据权利要求4所述的基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,所述损失函数Lossteacher采用均方误差损失函数:
其中Yi代表真实值,代表教师网络预测值,N则是批次样本数据个数。
6.根据权利要求1所述的基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,步骤S4中,所述学生网络模型包括Transformer编码器模块,GRU网络层和全连接网络层;所述Transformer编码器模块的子层数为2,多头注意力数目为4。
7.根据权利要求1所述的预测方法,其特征在于,学生网络模型的损失函数Lossstudent包含对预测结果的均方误差Losshard,还包含教师网络中的知识迁移的均方误差Losssoft,直到Lossstudent下降稳定收敛,就将其作为学生网络的最优参数配置,如公式(2)所示:
其中Yi代表真实值,代表教师网络预测值,Pi代表教师网络中间层特征值,代表学生网络中间层特征值,N是批次样本数据个数,α和β为权重系数。
8.根据权利要求1所述的基于Transformer网络和知识蒸馏的无线资源需求预测方法,其特征在于,步骤S5中所述结合目标位置信息,按照优先级高低输出目标区域内无线基站数据,具体包括:以这个待预测的目标位置为圆心,D为半径,扩充为一个圆形区域,输出落在这个圆形目标区域内的规划需求库平台无线基站清单,并列出清单中这些无线基站的需求度,输出需求度最高的M个规划需求库平台无线基站。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南华诺科技有限公司,未经湖南华诺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310335507.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





