本发明公开了一种基于强化学习的工业无线传感网中传感器采样调度方法,该方法针对时序工业无线传感网络及边缘计算中传感器采样任务进行调度,包括定义指标Ageof Date Processing(AoDP)作为新鲜度来度量系统状态。本发明通过决策传感器和大小基站之间的接入模式选择和每个传感器的采样频率大小,在满足大小基站的带宽、计算资源最优化分配的前提下,以系统在寻求最小化接收终端系统状态新鲜度(AoDP)的目标,构建基于强化学习和动态规划的联合优化来对无线传感网中的采样任务下的各种不同类型传感器进行上行传输和等待时间的联合决策优化。本发明可以为无线传感网络和工业物联网中时间敏感应用最小化系统新鲜度和采样设备的合理决策提供参考。