博士

赵宝林中国海洋大学计算机科学与技术系 博士
深度强化学习,合作型任务多智能体深度强化学习、多任务深度强化学习。使用深度强化学习方法研究合作型任务多智能体深度强化学习算法以及基于策略蒸馏及神经网络参数共享的多任务深度强化学习算法,主要针对高维、连续多智能体状态-动作空间下部分可观测马尔科夫决策过程模型与智能体决策算法研究.
更 多深度强化学习,合作型任务多智能体深度强化学习、多任务深度强化学习。使用深度强化学习方法研究合作型任务多智能体深度强化学习算法以及基于策略蒸馏及神经网络参数共享的多任务深度强化学习算法,主要针对高维、连续多智能体状态-动作空间下部分可观测马尔科夫决策过程模型与智能体决策算法研究.
更 多