Planning with Information-Processing Constraints and Model Uncertainty in Markov Decision Processes

Grau-Moya, Jordi; Leibfried, Felix; Genewein, Tim; Braun, Daniel A.

Computer Science > Artificial Intelligence

arXiv:1604.02080 (cs)

[Submitted on 7 Apr 2016]

Title:Planning with Information-Processing Constraints and Model Uncertainty in Markov Decision Processes

Authors:Jordi Grau-Moya, Felix Leibfried, Tim Genewein, Daniel A. Braun

View PDF

Abstract:Information-theoretic principles for learning and acting have been proposed to solve particular classes of Markov Decision Problems. Mathematically, such approaches are governed by a variational free energy principle and allow solving MDP planning problems with information-processing constraints expressed in terms of a Kullback-Leibler divergence with respect to a reference distribution. Here we consider a generalization of such MDP planners by taking model uncertainty into account. As model uncertainty can also be formalized as an information-processing constraint, we can derive a unified solution from a single generalized variational principle. We provide a generalized value iteration scheme together with a convergence proof. As limit cases, this generalized scheme includes standard value iteration with a known model, Bayesian MDP planning, and robust planning. We demonstrate the benefits of this approach in a grid world simulation.

Comments:	16 pages, 3 figures
Subjects:	Artificial Intelligence (cs.AI); Systems and Control (eess.SY)
Cite as:	arXiv:1604.02080 [cs.AI]
	(or arXiv:1604.02080v1 [cs.AI] for this version)
	https://doi.org/10.48550/arXiv.1604.02080

Submission history

From: Jordi Grau-Moya [view email]
[v1] Thu, 7 Apr 2016 17:12:07 UTC (276 KB)

Full-text links:

Access Paper:

view license

Current browse context:

cs.AI

< prev | next >

new | recent | 2016-04

Change to browse by:

cs
cs.SY

References & Citations

DBLP - CS Bibliography

listing | bibtex

Jordi Grau-Moya
Felix Leibfried
Tim Genewein
Daniel A. Braun

export BibTeX citation

Computer Science > Artificial Intelligence

Title:Planning with Information-Processing Constraints and Model Uncertainty in Markov Decision Processes

Submission history

Access Paper:

References & Citations

DBLP - CS Bibliography

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Artificial Intelligence

Title:Planning with Information-Processing Constraints and Model Uncertainty in Markov Decision Processes

Submission history

Access Paper:

References & Citations

DBLP - CS Bibliography

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators