Afficher la notice abrégée

dc.contributor.advisorLy, Olivier
dc.contributor.advisorGimbert, Hugo
dc.contributor.authorHOFER, Ludovic
IDREF: 223405442
dc.contributor.otherLy, Olivier
dc.contributor.otherGimbert, Hugo
dc.contributor.otherChaumette, Serge
dc.contributor.otherIocchi, Luca
dc.contributor.otherGarcia, Frédérick
dc.contributor.otherGenest, Blaise
dc.contributor.otherSimon, Laurent
dc.contributor.otherMouaddib, Abdel-Illah
dc.date2017-11-27
dc.identifier.urihttp://www.theses.fr/2017BORD0770/abes
dc.identifier.uri
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-01684198
dc.identifier.nnt2017BORD0770
dc.description.abstractAfin d'être autonomes, les robots doivent êtres capables de prendre des décisions en fonction des informations qu'ils perçoivent de leur environnement. Cette thèse modélise les problèmes de prise de décision robotique comme des processus de décision markoviens avec un espace d'état et un espace d'action tous deux continus. Ce choix de modélisation permet de représenter les incertitudes sur le résultat des actions appliquées par le robot. Les nouveaux algorithmes d'apprentissage présentés dans cette thèse se focalisent sur l'obtention de stratégies applicables dans un domaine embarqué. Ils sont appliqués à deux problèmes concrets issus de la RoboCup, une compétition robotique internationale annuelle. Dans ces problèmes, des robots humanoïdes doivent décider de la puissance et de la direction de tirs afin de maximiser les chances de marquer et contrôler la commande d'une primitive motrice pour préparer un tir.
dc.description.abstractEnThe autonomy of robots heavily relies on their ability to make decisions based on the information provided by their sensors. In this dissertation, decision-making in robotics is modeled as continuous state and action markov decision process. This choice allows modeling of uncertainty on the results of the actions chosen by the robots. The new learning algorithms proposed in this thesis focus on producing policies which can be used online at a low computational cost. They are applied to real-world problems in the RoboCup context, an international robotic competition held annually. In those problems, humanoid robots have to choose either the direction and power of kicks in order to maximize the probability of scoring a goal or the parameters of a walk engine to move towards a kickable position.
dc.language.isoen
dc.subjectProcessus de décision markovien
dc.subjectRobotique autonome
dc.subjectApprentissage
dc.subject.enMarkov decision process
dc.subject.enAutonomous robotics
dc.subject.enMachine learning
dc.titleAlgorithmes de prise de décision stratégique pour robots autonomes
dc.title.enDecision-making algorithms for autonomous robots
dc.typeThèses de doctorat
dc.contributor.jurypresidentChaumette, Serge
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)
star.origin.linkhttps://www.theses.fr/2017BORD0770
dc.contributor.rapporteurIocchi, Luca
dc.contributor.rapporteurGarcia, Frédérick
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Algorithmes%20de%20prise%20de%20d%C3%A9cision%20strat%C3%A9gique%20pour%20robots%20autonomes&rft.atitle=Algorithmes%20de%20prise%20de%20d%C3%A9cision%20strat%C3%A9gique%20pour%20robots%20autonomes&rft.au=HOFER,%20Ludovic&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée