计算机论文哪里有?本文构造了一些稀疏表征方法并提出了相应的适用算法。对于以图像输入的问题,我们可以采用分段的深度 Q 学习网络算法,由于卷积神经网络强大的表征能力,深度强化学习在端到端的学习方面始终有着其独特的优势。
第一章 绪论
1.2国内外研究现状
本章从值函数估计以及在线强化学习与稀疏表征两方面对现有的方法进行综述。
1.2.1 值函数估计
传统的值表方法常常受制于维度灾难问题,即大规模或连续的状态动作空间。而求解维度灾难的途径是降低状态和动作空间,采用远小于状态、动作个数的参数对值函数
............