摘 要:针对现有基于深度确定性策略梯度(deep deterministic policy gradient, DDPG)算法的再入制导方法计算精度较差,对强扰动条件适应性不足等问题,在DDPG算法训练框架的基础上,提出一种基于长短期记忆-DDPG(试读)...