[发明专利]基于强化学习的高剂量率近距离放射治疗剂量优化算法在审
| 申请号: | 202210527207.9 | 申请日: | 2022-05-16 |
| 公开(公告)号: | CN115019934A | 公开(公告)日: | 2022-09-06 |
| 发明(设计)人: | 姜杉;普刚;杨志永 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G16H20/40 | 分类号: | G16H20/40;G06N3/04;A61N5/10 |
| 代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 强化 学习 剂量率 近距离 放射 治疗 剂量 优化 算法 | ||
1.基于强化学习的高剂量率近距离放射治疗剂量优化算法,其特征在于,采用结合生物等效均匀剂量EUD和物理剂量约束的目标函数模型以及基于PPO算法的剂量优化网络实现:所述结合生物等效均匀剂量EUD和物理剂量约束的混合目标函数的数学模型为:
min Fhyb=α·FCTV+β·FOAR+λFtime
上式为目标函数的总体表达式,FCTV是针对靶区的目标函数项,FOAR是针对危及器官的目标函数项,Ftime是针对驻留时间梯度的目标函数项,α、β、λ分别是各自对应的权重;
FCTV的计算表达式中,wi是对靶区内每个剂量计算点的惩罚值,NT是靶区内剂量计算点的总数;
上式为靶区剂量计算点惩罚值的计算表达式,dij为第j个驻留点对第i个剂量计算点的剂量率,为驻留时间,Dmin、Dmax分别为对靶区剂量限制的最小值和最大值,Mmin、Mmax分别为权重因子;
FOAR的计算表达式中,为第i个危及器官的处方EUD值,EUDi为第i个危及器官的实际EUD值,Ns,i为第i个危及器官的剂量计算点总数,为权重因子;
EUD的计算表达式中,Di为第i个EUD计算点的剂量,Nk为EUD计算点的总数,σ为生物特性参数;
Ftime的计算表达式中,tm,n为第m个驻留通道上第n个驻留点的驻留时间,N(m)为第m个驻留通道的驻留点总数,Nc为驻留通道总数,Np为驻留点总数,tk为第k个驻留点的驻留时间;
所述基于PPO算法的剂量优化网络包括状态空间s、动作空间a和奖励r;其中,以每个驻留位置的驻留时间作为状态空间,利用数组的形式对其进行存储;动作空间为对各驻留时间的调整动作;奖励以优化目标函数作为评价指标,当目标函数值减小则给予正奖励,当目标函数值增大则给予负奖励,目标函数值不变则不给予奖励,奖励r的表达形式如下:
式中,Fhyb(st)是状态st下的目标函数;为保证优化开始前初始时间t0的设置尽可能接近最终的优化结果,提出如下时间初始化方案:
式中,di,j是第j个驻留点对第i个剂量计算点的剂量率;Np是驻留点总数;N是剂量计算点的总数;Dmin是对靶区剂量限制的最小值,τ是一个放缩因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210527207.9/1.html,转载请声明来源钻瓜专利网。





