Consiglio Nazionale delle Ricerche

Tipo di prodottoArticolo in rivista
TitoloEfficient sampling in approximate dynamic programming algorithms
Anno di pubblicazione2007
Formato-
Autore/iCristiano Cervellera; Marco Muselli
Affiliazioni autoriCristiano Cervellera: Istituto di Studi sui Sistemi Intelligenti per l'Automazione, Consiglio Nazionale delle Ricerche, Via de Marini 6, 16149 Genova, Italy Marco Muselli: Istituto di Elettronica e di Ingegneria dell'Informazione e delle Telecomunicazioni, Consiglio Nazionale delle Ricerche, Via de Marini 6, 16149 Genova, Italy
Autori CNR e affiliazioni
  • CRISTIANO CERVELLERA VQR
  • MARCO MUSELLI VQR
Lingua/e
  • inglese
AbstractDynamic Programming (DP) is known to be a standard optimization tool for solving Stochastic Optimal Control (SOC) problems, either over a finite or an infinite horizon of stages. Under very general assumptions, commonly employed numerical algorithms are based on approximations of the cost-to-go functions, by means of suitable parametric models built from a set of sampling points in the d-dimensional state space. Here the problem of sample complexity, i.e., how "fast" the number of points must grow with the input dimension in order to have an accurate estimate of the cost-to-go functions in typical DP approaches such as value iteration and policy iteration, is discussed. It is shown that a choice of the sampling based on low-discrepancy sequences, commonly used for efficient numerical integration, permits to achieve, under suitable hypotheses, an almost linear sample complexity, thus contributing to mitigate the curse of dimensionality of the approximate DP procedure.
Lingua abstractinglese
Altro abstract-
Lingua altro abstract-
Pagine da417
Pagine a443
Pagine totali-
RivistaComputational optimization and applications
Attiva dal 1992
Editore: Kluwer Academic Publishers - Boston
Paese di pubblicazione: Stati Uniti d'America
Lingua: inglese
ISSN: 0926-6003
Titolo chiave: Computational optimization and applications
Titolo abbreviato: Comput. optim. appl.
Numero volume della rivista38
Fascicolo della rivista3
DOI10.1007/s10589-007-9054-8
Verificato da refereeSì: Internazionale
Stato della pubblicazione-
Indicizzazione (in banche dati controllate)
  • ISI Web of Science (WOS) (Codice:000250880200007)
  • Scopus (Codice:2-s2.0-36148965498)
Parole chiaveStochastic optimal control problem, Dynamic programming, Sample complexity, Deterministic learning, Low-discrepancy sequences
Link (URL, URI)-
Titolo parallelo-
Data di accettazione-
Note/Altre informazioni-
Strutture CNR
  • IEIIT — Istituto di elettronica e di ingegneria dell'informazione e delle telecomunicazioni
  • ISSIA — Istituto di studi sui sistemi intelligenti per l'automazione
Moduli CNR
    Progetti Europei-
    Allegati
    • Articolo pubblicato

    Dati storici
    I dati storici non sono modificabili, sono stati ereditati da altri sistemi (es. Gestione Istituti, PUMA, ...) e hanno solo valore storico.
    Area valutazione CIVRIngegneria industriale e informatica
    Rivista ISICOMPUTATIONAL OPTIMIZATION AND APPLICATIONS [12096J0]