Método de diferenças temporais aplicado às equações de Riccati acopladas entre si

Costa, Oswaldo L. V.; Aya, Julio C.C.

doi:10.1590/S0103-17592003000300001

Acessibilidade / Reportar erro

Brasil

Sba: Controle & Automação Sociedade Brasileira de Automatica

Español English

Brasil

Español English

sumário « anterior atual seguinte »

Sumário

Sistemas Estocásticos • Sba Controle & Automação 14 (3) • Set 2003 • https://doi.org/10.1590/S0103-17592003000300001 copiar

Método de diferenças temporais aplicado às equações de Riccati acopladas entre si

Autoria SCIMAGO INSTITUTIONS RANKINGS

Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA.

Simulações de monte carlo; equações algébricas de Riccati acopladas entre si; sistemas com saltos; controle ótimo

Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br

Acompanhe os números deste periódico no seu leitor de RSS