Maximizing the probability of visiting a set infinitely often for a Markov decision process
DUFOUR, François
Institut Polytechnique de Bordeaux [Bordeaux INP]
Institut de Mathématiques de Bordeaux [IMB]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut Polytechnique de Bordeaux [Bordeaux INP]
Institut de Mathématiques de Bordeaux [IMB]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
DUFOUR, François
Institut Polytechnique de Bordeaux [Bordeaux INP]
Institut de Mathématiques de Bordeaux [IMB]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
< Réduire
Institut Polytechnique de Bordeaux [Bordeaux INP]
Institut de Mathématiques de Bordeaux [IMB]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Langue
en
Document de travail - Pré-publication
Origine
Importé de halUnités de recherche