Acessibilidade / Reportar erro

Uso de conjuntos terminais parametrizados para tratamento de problemas de não-factibilidade em controle preditivo

Employment of parametrized terminal sets for infeasibility handling in predictive control

Resumos

Restrições terminais são tipicamente empregadas em formulações de controle preditivo para garantia de estabilidade em malha fechada. Contudo, tal garantia é perdida caso o problema de otimização associado não seja factível no instante inicial ou deixe de ser factível devido, por exemplo, à ocorrência de falhas. Este trabalho apresenta uma abordagem de gerenciamento de referência aliado ao relaxamento de restrições operacionais como forma de tratar problemas de não-factibilidade em controle preditivo. Considera-se que a não-factibilidade pode ocorrer tanto no início da tarefa de controle, em decorrência de uma condição inicial desfavorável, como pode ser causada por uma falha de atuador que reduza a faixa de valores de controle permitidos. A abordagem proposta envolve a parametrização do conjunto máximo admissível de saída (MAS) utilizado como restrição terminal na lei de controle. Evita-se assim a necessidade de se repetir a determinação do MAS durante o tratamento da não-factibilidade. Para fins de exemplo, apresenta-se um estudo de caso com um modelo de simulação.

Controle preditivo; Restrições; Factibilidade; Gerenciamento de referência


Terminal constraints are usually employed in predictive control formulations to provide closed-loop stability guarantees. However, such guarantees are lost if the associated optimization problem is not feasible from the beginning or if it becomes infeasible due to the onset of faults, for example. This work presents an approach involving setpoint management and relaxation of operational constraints to address infeasibility problems in predictive control. It is assumed that infeasibility may occur either at the beginning of the control task, due to an adverse initial condition, or as the result of an actuator fault that reduces the range of admissible control values. The proposed approach involves the parametrization of the maximal output admissible set (MAS) employed as terminal constraint in the control law. This parametrization avoids the need to repeat the MAS determination during the infeasibility handling procedure. For illustration purposes, a case study involving a simulation model is presented.

Predictive control; Constraints; Feasibility; Setpoint management


CONTROLE PREDITIVO

Uso de conjuntos terminais parametrizados para tratamento de problemas de não-factibilidade em controle preditivo

Employment of parametrized terminal sets for infeasibility handling in predictive control

Rubens Junqueira Magalhães AfonsoI; Roberto Kawakami Harrop GalvãoII

IInstituto Tecnológico de Aeronáutica, Divisão de Engenharia Eletrônica, 12228-900 São José dos Campos, SP, Brasil. rubensjm@ita.br

IIInstituto Tecnológico de Aeronáutica, Divisão de Engenharia Eletrônica, 12228-900 São José dos Campos, SP, Brasil. kawakami@ita.br

RESUMO

Restrições terminais são tipicamente empregadas em formulações de controle preditivo para garantia de estabilidade em malha fechada. Contudo, tal garantia é perdida caso o problema de otimização associado não seja factível no instante inicial ou deixe de ser factível devido, por exemplo, à ocorrência de falhas. Este trabalho apresenta uma abordagem de gerenciamento de referência aliado ao relaxamento de restrições operacionais como forma de tratar problemas de não-factibilidade em controle preditivo. Considera-se que a não-factibilidade pode ocorrer tanto no início da tarefa de controle, em decorrência de uma condição inicial desfavorável, como pode ser causada por uma falha de atuador que reduza a faixa de valores de controle permitidos. A abordagem proposta envolve a parametrização do conjunto máximo admissível de saída (MAS) utilizado como restrição terminal na lei de controle. Evita-se assim a necessidade de se repetir a determinação do MAS durante o tratamento da não-factibilidade. Para fins de exemplo, apresenta-se um estudo de caso com um modelo de simulação.

Palavras-chave: Controle preditivo, Restrições, Factibilidade, Gerenciamento de referência.

ABSTRACT

Terminal constraints are usually employed in predictive control formulations to provide closed-loop stability guarantees. However, such guarantees are lost if the associated optimization problem is not feasible from the beginning or if it becomes infeasible due to the onset of faults, for example. This work presents an approach involving setpoint management and relaxation of operational constraints to address infeasibility problems in predictive control. It is assumed that infeasibility may occur either at the beginning of the control task, due to an adverse initial condition, or as the result of an actuator fault that reduces the range of admissible control values. The proposed approach involves the parametrization of the maximal output admissible set (MAS) employed as terminal constraint in the control law. This parametrization avoids the need to repeat the MAS determination during the infeasibility handling procedure. For illustration purposes, a case study involving a simulation model is presented.

Keywords: Predictive control, Constraints, Feasibility, Setpoint management.

1 INTRODUÇÃO

O termo Controle Preditivo Baseado em Modelo (Model-based Predictive Control, MPC) denomina uma ampla gama de técnicas que empregam realimentação dos sensores da planta a cada período de amostragem para calcular a solução de um problema de controle ótimo em um horizonte móvel (Normey-Rico, 2007), (Camacho e Bordons, 1999). Originalmente, o desenvolvimento de tais técnicas foi motivado por aplicações na indústria de petróleo (Cutler e Ramaker, 1980). Entretanto, outros setores vêm cada vez mais se beneficiando do emprego de abordagens de MPC (Qin e Badgwell, 2003). Com efeito, trabalhos recentes relatam que esta estratégia pode ser empregada com sucesso também em aplicações de dinâmica rápida, tais como as encontradas no setor aeronáutico, por exemplo (Keviczky e Balas, 2006), (Lopes, 2007), (Almeida e Leissling, 2010). Uma das principais vantagens do MPC consiste na capacidade de tratar restrições nas entradas e estados da planta, possibilitando a obtenção de ganhos de desempenho e maior segurança de operação (Maciejowski, 2002), (Rossiter, 2003). Em particular, restrições sobre a excursão dos sinais de controle são comuns em processos que operam perto das suas condições economicamente ótimas (Rodrigues e Odloak, 2005).

A estabilidade da malha de controle com o MPC pode ser garantida por meio do uso de horizonte de predição infinito ou através da introdução de restrições terminais (Maciejowski, 2002), (Rossiter, 2003). Neste último caso, pode-se impor que o estado atinja o ponto de equilíbrio desejado ao final do horizonte de predição ou, de forma menos restrita, que ingresse em um determinado conjunto terminal que seja invariante (Gilbert e Tan, 1991) sob a ação de um controlador local estabilizante. Contudo, para que as garantias de estabilidade sejam preservadas, o problema de otimização deve ser factível a cada instante de amostragem. Neste contexto, torna-se imperativo o desenvolvimento de técnicas de recuperação da factibilidade, caso o problema não seja factível no instante inicial de operação ou deixe de ser factível, por exemplo, devido à ocorrência de uma falha.

Uma solução simples para a recuperação da factibilidade consiste no aumento do horizonte utilizado, de forma a proporcionar mais graus de liberdade para a otimização. No entanto, aumenta-se, por consequência, a carga computacional envolvida, visto que o problema passará a envolver um número maior de variáveis de decisão.

Como alternativa, pode-se recorrer a estratégias de relaxamento de restrições. Segundo (Vada, Slupphaug e Johansen, 2001), as restrições a serem tratadas por um MPC podem ser divididas nas seguintes classes:

  • Restrições físicas: São restrições que devem ser respeitadas durante toda a operação. Os limites de operação de uma válvula, que pode estar aberta entre 0 e 100% de sua capacidade, constituem um exemplo de restrições físicas.

  • Restrições operacionais: São restrições que se deseja respeitar a fim de obter um comportamento mais adequado, mas que podem ser relaxadas caso ocorra não-factibilidade. Por exemplo, pode ser vantajoso operar um reator químico em uma determinada faixa de temperaturas, de forma a acelerar a formação de produtos de interesse econômico. Entretanto, no caso de ser impossível que isso seja feito sem comprometer a segurança de operação da planta, estas restrições podem ser relaxadas.

A literatura é vasta em diferentes abordagens para realizar o relaxamento das restrições. Rawlings e Muske (1993) sugerem remover as restrições durante um período inicial do horizonte de predição garantindo a factibilidade da otimização. Após esse período, as restrições voltam a ser consideradas. Zafiriou e Chiou (1993) propõem uma forma de calcular a magnitude do relaxamento necessário para tornar o problema de otimização factível, considerando um sistema de entrada e saída únicas. O trabalho de Scokaert (1994) contém diversas propostas para contornar o problema da não-factibilidade, entre elas, uma abordagem que consiste em classificar as restrições em níveis de prioridade e satisfazer as de níveis mais altos, relaxando as de níveis mais baixos. Scokaert e Rawlings (1996) apresentam uma abordagem capaz de minimizar a duração e o pico das violações das restrições impostas ao sistema, melhorando as características da resposta transiente. No que tange ao relaxamento de restrições tanto sobre o sinal de controle quanto sobre as saídas, uma técnica encontra-se descrita em (Alvarez e de Prada, 1997). Critérios de prioridades previamente definidos são usados no relaxamento da amplitude ou da taxa de variação dos sinais de controle. Já as restrições de saída são relaxadas na amplitude ou no intervalo de duração ao longo do horizonte de predição. Em (Vada, Slupphaug, Johansen e Foss, 2001) a solução proposta consiste em classificar as restrições em níveis de prioridades e adicionar um problema de programação linear para ser resolvido em paralelo com o problema de otimização padrão do MPC. Uma revisão dessas diversas técnicas é apresentada em (Afonso e Galvão, 2012) com exemplos de aplicação. No âmbito de acomodação de falhas de atuador, Afonso e Galvão (2010) trataram o problema de priorização de restrições através da agregação de diferentes variáveis de folga às restrições de saída da planta. O menor relaxamento necessário era então obtido através da solução de um problema de programação linear, atribuindo-se pesos às variáveis de folga de acordo com a prioridade de cada restrição.

Outra forma de recuperar a factibilidade são os chamados procedimentos de "gerenciamento de referência" (Bemporad e Mosca, 1994), (Gilbert e Kolmanovsky, 1995), (Bemporad et al., 1997), que reduzem artificialmente a distância entre o estado da planta e o conjunto terminal de restrições. O reference governor proposto por (Kapasouris et al., 1988) inspira diversas técnicas de manipulação do sinal de referência ou do erro de rastreamento para lidar com problemas em que há saturação dos atuadores (Gilbert e Kolmanovsky, 1995). Em (Afonso e Galvão, 2010b) utiliza-se uma dessas técnicas para tratamento de não-factibilidades advindas de falhas de atuador em um modelo de helicóptero de laboratório. Há também trabalhos visando impor um comportamento à planta por meio de um modelo de referência que se utilizam da introdução de uma variável de relaxamento para obter factibilidade quando existem limitações dos sinais de controle (Montandon et al., 2008).

As garantias de estabilidade em abordagens de gerenciamento de referência podem ser mantidas por meio do emprego de conjuntos terminais invariantes previamente determinados considerando a possibilidade de mudança na referência. Limon et al. (2008) usam uma abordagem desse tipo, parametrizando o conjunto terminal em termos dos valores de equilíbrio tanto do controle como do estado. Os autores mostram que um gerenciamento ótimo da referência pode ser feito de forma a garantir o menor afastamento possível entre o valor de equilíbrio desejado e o usado pelo MPC, mantendo a factibilidade. Como resultado, é possível aumentar o domínio de atração proporcionado pelo controlador.

Uma aplicação da parametrização do conjunto terminal em termos do valor estacionário do controle pode ser encontrada em (Almeida e Leissling, 2010). Nesse trabalho, os procedimentos utilizados para parametrização e obtenção de um valor ótimo de regime são similares aos adotados em (Limon et al., 2008). Contudo, a aplicação é estendida para tratar casos de não-factibilidade advinda de falhas de atuador. No caso de uma falha desse tipo, dispondo-se de informação sobre sua localização e magnitude, pode-se reconfigurar o MPC de forma a levar em conta as novas condições dos atuadores. Em particular, falhas que reduzam a faixa de operação do atuador podem ser tratadas pelo MPC por meio da mudança das restrições impostas sobre a excursão do sinal de controle. No entanto, torna-se necessário recorrer à parametrização do conjunto terminal de restrições em termos também dos valores possíveis de restrições sobre os controles, a fim de evitar a necessidade da redeterminação dos mesmos. Com efeito, em aplicações de dinâmica rápida, a complexidade dos cálculos envolvidos na determinação do conjunto invariante podem impossibilitar a sua atualização em tempo real.

No presente trabalho, recorre-se a uma estratégia de parametrização do conjunto terminal invariante em termos dos possíveis valores de equilíbrio das variáveis de controle e estado, bem como das restrições impostas sobre elas. Dessa forma, torna-se possível reconfigurar o conjunto terminal em tempo real quando o gerenciamento de referência ou o relaxamento de restrições se fizerem necessários a fim de recuperar a factibilidade do problema de otimização. Pode-se ainda reconfigurar o MPC com os novos valores de restrições impostas sobre o controle em decorrência da falha. Por considerar a parametrização em termos tanto de valores de equilíbrio quanto das restrições de excursão das variáveis de controle e estados, este trabalho traz contribuições em relação a (Limon et al., 2008) e (Almeida e Leissling, 2010). A estratégia proposta é ilustrada por meio de um estudo de caso simulado, considerando tanto o problema de não-factibilidade inicial quanto a ocorrência de falha de atuador.

O restante do texto encontra-se estruturado da seguinte forma. A Seção 2 detalha a formulação de MPC adotada neste trabalho. A Seção 3 apresenta as técnicas de gerenciamento de referência e relaxamento da restrições, assim como a parametrização proposta para o conjunto terminal. Resultados de simulação são discutidos na Seção 4. Finalmente, a Seção 5 traz as conclusões obtidas, bem como sugestões de trabalhos futuros.

1.1 Notação

xPn: estado da planta;

xrefn: valor desejado para o estado;

x = xP - xref;

◊ µ ∈

n: estado fictício de equilíbrio após o gerenciamento de referência;

uPp: controle aplicado à planta;

urefp: controle em regime associado a xref;

◊ η ∈

p: valor de controle de equilíbrio fictício associado a µ;

vp: controle gerado pelo MPC;

up: controle gerado pelo MPC adicionado ao da malha interna;

yP,maxq: restrição operacional superior da saída;

yP,minq: restrição operacional inferior da saída;

q: restrição física superior da saída;

q: restrição física inferior da saída;

uP,maxp: restrição superior do controle em condições normais de operação;

uP,minp: restrição inferior do controle em condições normais de operação;

ufal,maxp: restrição superior de controle após a falha de atuador;

ufal,minp: restrição inferior de controle após a falha de atuador;

◊ єsq: variável de folga associada ao relaxamento da restrição superior de saída;

◊ єiq: variável de folga associada ao relaxamento da restrição inferior de saída;

k: instante atual;

(k + i|k): valor previsto da variável • no instante k + i com base nas informações disponíveis até o instante k;

◊ •*: valor ótimo da variável •;

N: horizonte do MPC;

Kp×n: ganho da malha interna;

In: matriz identidade de dimensão n×n;

2 FORMULAÇÃO DE CONTROLE PREDITIVO ADOTADA

A Fig. 1 apresenta os principais elementos da formulação de MPC usada neste trabalho. Como a implementação está na forma de regulador, o ponto de equilíbrio xref desejado para o estado deve ser subtraído do estado medido da planta xP, de modo a gerar o estado x lido pelo controlador, isto é:


De maneira similar, o valor de equilíbrio correspondente para o controle (uref) deve ser adicionado à saída do controlador u para gerar o controle uP a ser aplicado à planta, ou seja:

Assume-se que a dinâmica da planta seja descrita por uma equação de estado a tempo discreto da forma xP(k + 1) = AxP(k) + BuP(k). Desse modo, a relação entre u e x é dada por

Deseja-se projetar o controlador preditivo de modo a respeitar restrições do tipo

sendo yP relacionada com o estado da planta por uma equação de saída yP = C xP. Tendo em vista (1) e (2), as restrições (4) e (5) podem ser expressas como

sendo y = Cx.

O problema de otimização a ser resolvido no instante k consiste em minimizar uma função de custo da forma

sujeita às seguintes restrições:

em que Ψ = ΨT > 0 é uma matriz de peso e e são respectivamente os conjuntos de controles e saídas admissíveis em vista de (6) e (7).

Seguindo uma política de horizonte retrocedente, o controle no instante k é dado por u(k) = *(k|k) - Kx(k), sendo K o ganho da malha interna representada na Fig. 1. No instante k + 1, a otimização é repetida de modo a obter *(k + 1|k + 1).

O controlador da malha interna é projetado como um regulador linear-quadrático (linear-quadratic regulator, LQR) com a seguinte função de custo:

sendo Qlqr escolhida de modo que o par seja detectável.

Seja P a única solução simétrica não-negativa da equação algébrica de Riccati P = ATPA - ATPB(Rlqr + BTPB)-1BTPA + Qlqr. Pode-se então mostrar que, se a matriz de peso Ψ for escolhida como Ψ = Rlqr + BTPB, então a minimização do custo (8) sujeito a (9) - (15) equivale à minimização do custo (9) sujeito a (11) - (15) (Chisci et al., 2001). Tem-se então a vantagem de se trabalhar com uma função de custo com horizonte infinito, o que é útil para garantia de estabilidade. Essa formulação foi introduzida por (Scokaert e Rawlings, 1998) e posteriormente colocada na forma aqui adotada por (Kouvaritakis et al., 1998). Vale notar que, devido à penalização do sinal de controle em (8), o MPC só atua quando é necessário corrigir o controle da malha interna a fim de evitar violação das restrições (14) e (15).

Definindo o vetor e a matriz como

a função de custo pode ser reescrita como

que é quadrática em termos de .

Vale ressaltar que a presença de infinitas restrições em (14) e (15) impede o uso direto de métodos computacionais para solução do problema de otimização. Contudo, essa dificuldade pode ser contornada introduzindo-se uma restrição terminal para o estado na forma de um "Conjunto Máximo de Saída Admissível" (Maximal Output Admissible Set - MAS) (Gilbert e Tan, 1991), conforme definido no Apêndice A APÊNDICE A .

Com efeito, para i > N, tem-se uma lei de controle dada simplesmente pela realimentação de estado (k + i|k) = -K(k + i|k) (vide restrições (9) e (10)). Desse modo, a evolução do estado passa a ser descrita por uma equação não-forçada da forma (k + i + 1|k) = (A - BK)(k + i|k), sendo (A - BK) uma matriz com autovalores no interior do círculo unitário. Portanto, tomando uma variável de saída z definida como

pode-se empregar o procedimento descrito no Apêndice A APÊNDICE A para obter um MAS, denotado por , tal que as restrições (14) e (15) sejam equivalentes a impor (k + N|k) ∈ . Ainda como discutido no Apêndice A APÊNDICE A , tal restrição terminal equivale a impor as restrições (14) e (15) até i = N + t*, sendo t* obtido durante a determinação de .

Sejam e vetores com os valores preditos das variáveis de saída e controle definidos como

Tendo em vista as relações (9) - (13), as equações de predição para e podem ser escritas na forma

sendo Hq(N+t*)×pN, Hup(N+t*+1)×pN, Φ ∈ q(N+t*)×n, ΦUp(N+t*+1)×n matrizes construídas a partir de A, B, C e K (Maciejowski, 2002).

Assim, dadas restrições da forma

e lembrando que x(k) = xP(k) - xref a minimização da função de custo (18) fica sujeita ao seguinte conjunto de desigualdades lineares:

em que [•]m é um operador que empilha m cópias de uma dado vetor coluna •. Portanto, o problema de otimização pode ser resolvido empregando algoritmos de Programação Quadrática (Maciejowski, 2002), pois há número finito de restrições lineares e o custo dado pela Eq. (18) é quadrático.

3 GERENCIAMENTO DE REFERÊNCIA E RELAXAMENTO DE RESTRIÇÃO

A formulação de controle preditivo descrita na Seção 2 garante factibilidade recursiva do problema de otimização e estabilidade da malha de controle (Rossiter, 2006), desde que as restrições (25) sejam inicialmente factíveis e os limites sobre u e y não sejam subsequentemente alterados. Neste trabalho, serão tratados problemas de não-factibilidade devido às seguintes causas:

1. Não-factibilidade inicial. Como as restrições em (25) dependem da diferença xP(k) - xref, o problema de otimização pode não ser factível no instante inicial k = 0 se o estado xP(0) estiver muito distante da referência xref.

2. Perda de factibilidade devido à ocorrência de falha de atuador. O tipo de falha aqui considerado consiste em uma alteração nos limites físicos do controle, com aumento de uP,min e/ou redução de uP,max. Assume-se que na prática tal alteração seria informada por um módulo de detecção e identificação de falhas. Desse modo, a partir da ocorrência da falha, a restrição (6) passaria a ser

sendo ufal,min e ufal,max os novos limites para a excursão de uP. Com isso, o problema de otimização resultante pode se revelar não-factível.

Na abordagem aqui adotada, tais problemas serão tratados através do relaxamento de restrições operacionais sobre a saída da planta e/ou do gerenciamento da referência xref.

No que diz respeito ao relaxamento de restrições, considera-se que os limites de saída yP,min, yP,max em (5) possam ser relaxados até limites físicos pré-estabelecidos de modo a contornar o problema de não-factibilidade. Para isso, serão introduzidas variáveis de folga єs, єiq em (7), passando-se a impor:

Já o gerenciamento da referência consiste em encontrar uma pseudo-referência

a cada instante k a fim de tornar o problema de otimização factível e direcionar paulatinamente o sistema à referência original xref. No caso geral, mudanças na referência xref também ocasionam alterações (denotadas por η) no valor de regime correspondente para o controle (uref), resultando na seguinte pseudo-referência para o controle:

A relação entre µ e η pode ser estabelecida da seguinte maneira. Em regime, a relação entre os valores de xref e uref obtida a partir da equação de estado da planta é:

sendo In uma matriz identidade n × n. Da mesma forma, a Eq. (32) precisa ser satisfeita pelos novos valores de regime x'ref e u'ref, isto é,

De (30), (31) e (33), tem-se que (In - A)(xref - µ) = B(uref - η). Tendo em vista (32), conclui-se então que

Por fim, substituindo uref por uref - η em (26) e xref por xref - µ em (27), tais restrições passam a ser escritas como

estando as variáveis adicionais єi, єs, µ e η sujeitas a (28), (29) e (34).

Vale salientar que estas alterações impõem a necessidade de uma nova determinação do MAS a cada vez que os valores de єi, єs, µ, η, ufal,min ou ufal,max forem mudados. A abordagem proposta a seguir permite parametrizar o MAS em termos dos possíveis valores dessas variáveis, evitando assim a necessidade de se repetir em tempo real todo o procedimento envolvido na determinação de tal conjunto.

3.1 Parametrização do MAS

A parametrização do MAS pode ser feita através do uso de um estado aumentado definido como

que evolui dentro do MAS de acordo com

Vale salientar que a matriz identidade In+2q+3p multiplica as componentes adicionais do estado porque estas são supostas constantes ao longo do horizonte de predição. Embora tenha autovalores na borda do círculo unitário (autovalores em +1 associados à matriz In+2q+3p), ainda é possível determinar o MAS em número finito de passos porque a dinâmica dada por (38) é estável no sentido de Lyapunov (Gilbert e Tan, 1991).

Para levar em conta as restrições (28), (29), (34), (35) e (36) pode-se definir uma variável de saída como

que estará sujeita às seguintes restrições:

em que e correspondem aos valores de ufal,min e ufal,max no pior caso assumido para as possíveis falhas de atuador. A notação - ∞ empregada em (40) indica que a variável em questão não está limitada inferiormente. Vale ainda salientar que a última restrição em (40) corresponde à restrição de igualdade expressa em (34).

Lembrando que u = -Kx dentro do MAS, a função de saída para a determinação do MAS torna-se = com

Tendo-se realizado a determinação do MAS associado à dinâmica (38) com o conjunto de restrições (40), pode-se particularizá-lo em tempo real fixando-se os valores de µ, η, єs, єi, ufal,max e ufal,min. O conjunto assim obtido permanece invariante com respeito à trajetória do estado x, conforme mostrado no Apêndice B APÊNDICE B . Convém ressaltar que, como discutido anteriormente, a restrição terminal (k + N|k) ∈ equivale a impor as restrições sobre (k + i|k) e (k + i|k) até i = N + *, sendo * obtido durante a determinação off-line do MAS parametrizado.

Deve-se ainda salientar que os valores de ufal,max e ufal,min são iguais a uP,max e uP,min, respectivamente, em condições normais de operação. Ao ocorrer uma falha, considera-se, por hipótese, que os novos valores de ufal,max e ufal,min sejam informados ao controlador, de modo a adequar as restrições. Por outro lado, os valores de µ, η, єs e єi são graus de liberdade adicionais que podem ser explorados pelo controlador preditivo, como detalhado a seguir.

3.2 Formulação do problema de otimização

Considerando o gerenciamento de referência e o relaxamento das restrições de saída, o problema de otimização a ser resolvido no instante k passa a envolver , µ, η, єs e єi como variáveis de decisão. Nesse caso, as restrições (25) sobre devem ser modificadas para levar em conta a alteração de xref e uref por xref - µ e uref - η, bem como a introdução das variáveis de folga єs e єi. Adicionalmente, os limites uP,max e uP,min passam a ser ufal,max e ufal,min e t* deve ser substituído por *.

Com isso, o problema de otimização a ser resolvido no instante k passa a ser

em que W µ, W η, e são matrizes positivo-definidas de pesos. Quanto maiores forem os pesos W µ, W η, e em comparação com Ψ, mais a solução se aproxima da que seria obtida se não houvesse necessidade de gerenciamento de referência e/ou relaxamento de restrições. Ainda, visando priorizar o respeito às restrições operacionais sobre a saída, podem-se manipular e de forma que as parcelas a eles associadas no custo tenham maior magnitude do que aquelas associadas a W µ e W η. Com isso, prioriza-se o gerenciamento da referência como solução para o problema de não-factibilidade.

Tendo-se resolvido o problema de otimização (42), o controle a ser aplicado à planta é dado por

4 RESULTADOS

Para ilustrar o uso da estratégia proposta, empregou-se um modelo de simulação da forma

P = Ac xP + Bc uP, com

sendo o índice c utilizado para salientar que se trata de uma equação de estado a tempo contínuo. A matriz Ac possui autovalores -7 ± 7 ι, que correspondem a uma frequência natural ωn = 10 rad/s. A fim de implementar o MPC, o modelo foi discretizado com período de amostragem de 0,04s, que é aproximadamente 15 vezes menor do que o período associado à frequência natural ωn.

A tarefa de controle a ser realizada consiste em conduzir o estado da planta para a origem (isto é, xref = 0), partindo de uma dada condição inicial. Considera-se que as variáveis de estado estejam sujeitas a limites operacionais -2 < xP,1, xP,2< 2, que podem ser relaxados até limites físicos -2,5 < xP,1, xP,2< 2,5 em caso de não-factibilidade. Tais restrições são incluídas na estratégia proposta definindo-se que as variáveis de saída yP sujeitas a restrições sejam os próprios estados, isto é, yP = CxP com C = I2.

Adicionalmente, impõe-se que o controle uP deva permanecer na faixa -0,1 < uP < 0,1 em condições normais de operação. Assume-se ainda que a ocorrência de falha no atuador restrinja a excursão do controle à faixa -0,03 < uP < 0,03. Tal falha foi introduzida no instante tfal = 0,12 s (isto é, três períodos de amostragem após o início da simulação).

O controlador LQR utilizado na malha interna foi projetado com matrizes de peso Qlqr = 10I2 e Rlqr = 1. O horizonte adotado no MPC foi N = 5. Os pesos atribuídos às variáveis de relaxamento na função de custo (42) foram W µ = I2, W η = 1 e = = 103 × I2.

As simulações foram realizadas a partir da condição inicial xP(0) = [-1,8 -1,8]T. Embora esta condição inicial se encontre dentro dos limites operacionais estabelecidos sobre os estados, o problema de otimização associado não se mostra factível, o que justifica o emprego da metodologia proposta. Como resultado, o problema de não-factibilidade inicial pôde ser contornado através da utilização conjunta dos procedimentos de relaxamento de restrições operacionais e gerenciamento de referência.

Conforme mostra a Fig. 2, a restrição operacional inferior de xP,2 foi relaxada durante os dois primeiros períodos de amostragem através do uso da variável de folga єi2. Nos instantes posteriores, єi2 permaneceu igual a zero, indicando que a restrição correspondente pôde ser mantida no seu valor original. Não houve necessidade de se relaxar a restrição operacional superior de xP,2, nem tampouco as restrições operacionais inferior e superior de xP,1 (isto é, as variáveis de folga єs2, єi1 e єs1 permaneceram iguais a zero durante toda a tarefa de controle).


A Fig. 3 exibe o comportamento da pseudo-referência µ2 para o estado xP,2. Observa-se que foi realizado um gerenciamento da referência nos dois primeiros períodos de amostragem. Tal gerenciamento, em conjunto com o relaxamento de restrição acima descrito, foi realizado de modo a contornar a não-factibilidade inicial. Já no terceiro período de amostragem o gerenciamento da referência passou a ser desnecessário, o que indica que o controlador foi capaz de conduzir o estado xP ao domínio de atração associado à referência original. Contudo, com a introdução da falha em tfal = 0,12 s, a faixa de valores admissíveis do controle foi reduzida, diminuindo assim o domínio de atração e causando novamente um problema de não-factibilidade. Assim, mais uma vez o gerenciamento da referência passou a ser necessário até o estado xP ingressar no novo domínio de atração, o que ocorreu no instante t = 0,40s.


Aliada ao gerenciamento da referência para o estado, ocorre a mudança na pseudo-referência do controle. Esta pode ser vista na Fig. 4. Nota-se que seu perfil é similar ao da pseudo-referência µ2, visto que ambas são relacionadas pelo vínculo algébrico (34).


Convém salientar que a pseudo-referência µ1 para o estado xP,1 permaneceu igual a zero durante o curso de toda a manobra, isto é, não foi necessário nenhum ajuste na referência do estado xP,1 para recuperar a factibilidade do problema de otimização. Da mesma forma, o relaxamento de restrições só se mostrou necessário durante os instantes iniciais, como já comentado com respeito à Fig. 2.

A Fig. 5 apresenta a evolução dos estados xP,1 e xP,2, mostrando que os mesmos foram conduzidos até a origem, como desejado. Vale notar que a restrição operacional inferior de xP,2 (correspondente à linha horizontal tracejada em -2) foi ultrapassada nos instantes iniciais, como resultado do relaxamento realizado. Contudo, as restrições físicas (correspondentes às linhas horizontais contínuas em ±2,5 na Fig. 5) foram respeitadas.


Como se pode observar na Fig. 6, o sinal de controle uP foi mantido dentro da faixa de ±0,1 até a ocorrência da falha em tfal = 0,12s. A partir desse instante, a excursão do controle passou a ser limitada a ±0,03.


O tempo de computação a cada período de amostragem é apresentado na Fig. 7. Para obter esses dados a simulação foi executada 100 vezes em um computador pessoal com processador Pentium(R) Dual-Core E5400 com clock de 2,7 GHz e a média dos tempos de computação foi tomada. Esse procedimento visou eliminar flutuações devidas a interrupções do sistema operacional estranhas à simulação. O ambiente de simulação utilizado foi o Matlab® 7.1, empregando-se a função quadprog do Matlab Optimization Toolbox para a solução dos problemas de programação quadrática. Na aferição do tempo de computação, isolou-se o trecho de código relativo à otimização realizada por meio da função quadprog, de forma a não incluir o tempo gasto em rotinas alheias à obtenção do sinal de controle. Adicionalmente, desabilitou-se a exibição das mensagens relacionadas ao resultado da otimização na tela do Matlab, para evitar que o tempo de atualização da tela fosse indevidamente contabilizado como parte da computação. Nota-se na Fig. 7 que a necessidade de lidar com a não-factibilidade aumenta a carga computacional nos instantes iniciais e logo após a ocorrência da falha, devido à necessidade de se realizar o relaxamento de restrições e o gerenciamento de referência.


É também ilustrativo analisar os resultados obtidos ao se introduzir a falha mais tardiamente dentro da manobra realizada. Para isso, a simulação foi repetida com tfal = 0,16s e tfal = 0,20s. Neste último caso, a falha não acarretou perda de factibilidade, uma vez que o estado já se encontrava suficientemente próximo da origem.

A Fig. 8 mostra o valor da pseudo-referência µ2 para o estado xP,2 com a falha ocorrendo em tfal = 0,16s e tfal = 0,20s. Percebe-se por meio de comparação com a Fig. 3 que, quanto mais tardiamente a falha ocorre, menor é a duração necessária do gerenciamento da referência, uma vez que o estado xP já se encontra mais perto da origem. Os valores da pseudo-referência de controle η na Fig. 9 corroboram esta observação.



Os resultados obtidos para a evolução temporal da variável de folga єi2 e também do estado xP não estão apresentados por serem similares aos já vistos nas Figuras 2 e 5, respectivamente.

A Fig. 10 mostra o sinal de controle resultante. Pode-se notar que as restrições são adequadamente obedecidas, o que mais uma vez indica a capacidade de contornar os problemas advindos da falha.


Os esforços computacionais demandados com a falha a partir de tfal = 0,16s (linha contínua) e tfal = 0,20s (linha tracejada) encontram-se na Fig. 11. Assim como na Fig. 7, os picos de carga computacional são observados no início da manobra, devido à necessidade de contornar a não-factibilidade inicial. Observa-se também um pico logo após a falha em tfal = 0,16s. Já com tfal = 0,20s, o aumento do tempo de computação após a falha foi menos expressivo. Isso pode ser explicado pelo fato de que, no último caso, mantém-se a factibilidade mesmo na presença da falha, não sendo necessário recorrer aos procedimentos de relaxamento de restrições ou gerenciamento de referência.


5 CONCLUSÕES

Este artigo apresentou uma estratégia para o tratamento de problemas de não-factibilidade em controle preditivo através do relaxamento de restrições operacionais de saída e/ou gerenciamento da referência. Tal estratégia contempla casos de não-factibilidade inicial e também de perda de factibilidade devido a falhas de atuador que reduzam a excursão permitida para a variável de controle. Para isso, foi desenvolvido um procedimento de parametrização do conjunto invariante utilizado como restrição terminal no MPC. Com isso, evita-se a necessidade de se repetir a determinação de tal conjunto durante o tratamento da não-factibilidade. Como resultado, torna-se possível obter valores apropriados da pseudo-referência e do relaxamento de restrições de saída como resultado de um problema de programação quadrática.

Vale salientar que a abordagem proposta é voltada a problemas de regulação em torno de um ponto de equilíbrio. Esta característica é diretamente herdada de (Limon et al., 2008) e (Almeida e Leissling, 2010). Uma extensão para problemas de rastreamento poderia ser baseada na escolha de uma sequência de pontos de equilíbrio nas proximidades da trajetória considerada. Nesse caso, cada um dos pontos de equilíbrio seria uma referência intermediária para o controlador. A comutação de uma referência para a seguinte poderia ser realizada quando o problema de otimização envolvendo a nova referência se mostrasse factível. Esta ideia foi explorada em (Cavalca, 2011) e (Cavalca et al., 2012) no contexto de controle preditivo empregando desigualdades matriciais lineares. Em princípio, seria possível relaxar o requisito de que as referências intermediárias correspondam a pontos de equilíbrio. Isso impediria o uso de conjuntos terminais invariantes na forma adotada no presente trabalho, mas tal dificuldade poderia ser contornada empregando abordagens como a proposta em (Richards e How, 2006), que utiliza conjuntos-alvo não-invariantes. Essa possibilidade será explorada em trabalhos futuros.

Por simplicidade, o procedimento de relaxamento de restrições empregado neste trabalho envolveu apenas as variáveis de saída. Contudo, seria possível contemplar restrições operacionais de controle, considerando que as mesmas possam ser relaxadas até limites físicos mais amplos. Nesse caso, a falha de atuador acarretaria a imposição de limites mais estreitos sobre a variável de folga associada ao controle.

Investigações futuras podem incluir a realização de ensaios de bancada empregando a estratégia proposta. Seria também de valia desenvolver formas de parametrização do conjunto terminal para o tratamento de classes mais amplas de falhas, envolvendo alterações nos parâmetros ou mesmo na estrutura do modelo da planta.

AGRADECIMENTOS

Os autores agradecem o apoio da FAPESP (2009/12674-0 e 2006/58850-6) e CNPq (Produtividade em Pesquisa).

Artigo submetido em 02/08/2011 (Id.: 1365)

Revisado em 08/11/2011, 15/03/2012

Aceito sob recomendação do Editor Associado Prof. Luis Fernando Alves Pereira

Seja um sistema linear não-forçado com dinâmica descrita por uma equação de estado da forma

O estado inicial desse sistema é admissível quanto à saída com respeito a um conjunto de restrições q se a função de saída z = h(x(x)) satisfaz a condição z(k) ∈ , ∀k > 0. O conjunto de todos os estados iniciais com esta propriedade é denominado MAS (Maximal Output Admissible Set), sendo usualmente simbolizado por . Tal conjunto é invariante no sentido de que x(k) ∈ x(k + 1) ∈ (Gilbert e Tan, 1991).

Considerando uma função de saída linear (isto é, z = Cx), e restrições da forma fi(z) < 0, i = 1, 2, ..., s, um algoritmo para a determinação computacional do MAS pode ser encontrado em (Gilbert e Tan, 1991). Tal determinação equivale a impor o conjunto de restrições originais por um horizonte t* > 0 finito, desde que o sistema seja estável no sentido de Lyapunov. Assim, mesmo no caso em que a dinâmica envolva integradores, pode-se caracterizar o conjunto invariante através de um número finito de restrições (González e Odloak, 2009).

Seja um sistema linear não-forçado com dinâmica descrita por uma equação de estado da forma

em que x(k) ∈ n.

Seja ainda um estado aumentado (k) ∈ n+m definido como

em que θ(k) ∈ m é um vetor constante de parâmetros, ou seja, θ(k + 1) = θ(k). Pode-se então escrever

com

Considere-se agora uma função de saída definida como

estando zx θ(k) = h(x(k), θ(k)) e z θ(k) = h θ ( θ(k)) sujeitas a restrições da forma

Denote-se por

o MAS associado à dinâmica (48) e às restrições (51), (52), isto é

Seja agora θcm um vetor fixado e admissível com respeito às restrições de θ, isto é,

Tem-se então que o conjunto

definido como

é um MAS associado à dinâmica (46) e à restrição (51) particularizada para θ = θc.

Demonstração:

O conjunto

é admissível quanto à saída zx θ(k) por construção. Com efeito, pela definição (55), se x(0) ∈ , tem-se que

Portanto, pela definição (53) a restrição (51) será respeitada ∀k > 0. Resta ainda demonstrar que é o máximo conjunto admissível quanto à saída zx θ(k).

Por absurdo, suponha que ∃ ξ ∈

n tal que

Sabendo que θc satisfaz (54), tem-se que z θ(k) ∈ θ, ∀k > 0. Por outro lado, h(x(k), θc) ∈ x θ, ∀k > 0, implica que zx θ(k) ∈ x θ, ∀k > 0. Portanto, tem-se que . De (55), segue então que ξ ∈ , o que contradiz (57). Assim, conclui-se que todas as condições iniciais ξ ∈ n que satisfazem (56) devem pertencer a , mostrando que é o máximo conjunto admissível quanto à saída zx θ(k).

  • Afonso, R. J. M. Galvão, R. K. H. 2010 . Controle preditivo com garantia de estabilidade nominal aplicado a um helicóptero com três graus de liberdade empregando relaxamento de restrições de saída, Proc. XVIII Congresso Brasileiro de Automática, pp. 1797 - 1804.
  • Afonso, R. J. M. Galvão, R. K. H. 2010b . Predictive control of a helicopter model with tolerance to actuator faults, Proc. Conference on Control and Fault-Tolerant Systems (SysTol), pp. 744 - 751.
  • Afonso, R. J. M. Galvão, R. K. H. 2012 . Infeasibility handling in constrained MPC. In: Zheng, T. (ed.) Frontiers of Model Predictive Control, Intech, Rijeka, Croatia, pp. 47 - 64.
  • Almeida, F. A. Leissling, D. 2010 . Fault-tolerant model predictive control with flight-test results, Journal of Guidance, Control, and Dynamics 33(2): 363 - 375.
  • Alvarez, T. de Prada, C. 1997 . Handling infeasibilities in predictive control, Computers & Chemical Engineering 21: S577 - S582.
  • Bemporad, A., Casavola, A. Mosca 1997 . Nonlinear control of constrained linear systems via predictive reference management, IEEE Trans. Automatic Control 42(3): 340 - 349.
  • Bemporad, A. Mosca 1994 . Constraint fulfilment in feedback control via predictive reference management, Proc. 3rd IEEE Conf. Control Applications, Glasgow, UK, pp. 1909 - 1914.
  • Camacho, E. F. Bordons, C. 1999 . Model Predictive Control, Springer-Verlag, London.
  • Cavalca, M. S. M. 2011 . Controle Preditivo Reconfigurável para Acomodação de Falhas, Tese de Doutorado, ITA, São José dos Campos.
  • Cavalca, M. S. M., Galvão, R. K. H. Yoneyama, T. 2012 . Robust model predictive control using linear inequalities for the treatment of asymmetric output constraints, Journal of Control Science and Engineering (485784).
  • Chisci, L., Rossiter, J. A. Zappa, G. 2001 . Systems with persistent disturbances: predictive control with restricted constraints, Automatica 37(7): 1019 - 1028.
  • Cutler, C. R. Ramaker, B. L. 1980 . Dynamic matrix control - a computer control algorithm, Proc. Joint American Control Conference, IEEE, San Francisco.
  • Gilbert, E. G. Kolmanovsky, I. 1995 . Discrete-time reference governors for systems with state and control constraints and disturbance inputs, Proc. 34th IEEE Conference on Decision and Control
  • Gilbert, E. G. Tan, K. T. 1991 . Linear systems with state and control constraints: the theory and application of maximal output admissible sets, IEEE Trans. Automatic Control 36(9): 1008 - 1020.
  • González, A. H. Odloak, D. 2009 . Enlarging the domain of attraction of stable mpc controllers, maintaining the output performance, Automatica 45: 1080 - 1085.
  • Kapasouris, P., Athans, M. Stein, G. 1988 . Design of feedback control systems for stable plants with saturating actuators, Proc. 27th IEEE Conference on Decision and Control
  • Keviczky, T. Balas, G. J. 2006 . Receding horizon control of an F-16 aircraft: a comparative study, Control Engineering Practice 14(9): 1023 - 1033.
  • Kouvaritakis, B., Rossiter, J. A. Cannon, M. 1998 . Linear quadratic feasible predictive control, Automatica 34(12): 1583 - 1592.
  • Limon, D., Alvarado, I., Alamo, T. Camacho, E. 2008 . MPC for tracking piecewise constant references for constrained linear systems, Automatica 44(9): 2382 - 2387.
  • Lopes, R. V. 2007 . Modelagem e controle preditivo de um helicóptero com três graus de liberdade, Tese de mestrado, ITA, São José dos Campos.
  • Maciejowski, J. M. 2002 . Predictive Control with Constraints, Prentice Hall, Harlow, England.
  • Montandon, A. G., Borges, R. M. Henrique, H. M. 2008 . Experimental application of a neural constrained model predictive controller based on reference system, Latin American Applied Research 38: 51 - 62.
  • Normey-Rico, J. E. 2007 . Controle preditivo baseado em modelo. In: Aguirre, L. A. (ed.) Enciclopédia de Automática, Blucher, São Paulo, Vol. 2, Cap. 11, pp. 242 - 260.
  • Qin, S. J. Badgwell, T. A. 2003 . A survey of industrial model predictive control technology, Control Engineering Practice 11(7): 733 - 764.
  • Rawlings, J. B. Muske, K. R. 1993 . The stability of constrained receding horizon control, IEEE Trans. Automatic Control 38(10): 1512 - 1516.
  • Richards, A. How, J. P. 2006 . Robust variable horizon model predictive control for vehicle maneuvering, International Journal of Robust and Nonlinear Control 16: 333 - 351.
  • Rodrigues, M. A. Odloak, D. 2005 . Robust MPC for systems with output feedback and input saturation, Journal of Process Control 15: 837 - 846.
  • Rossiter, J. A. 2003 . Model-based Predictive Control: a practical approach, CRC Press, Boca Raton.
  • Rossiter, J. A. 2006 . A global approach to feasilbility in linear MPC, Proc. UKACC international Control Conference, UKACC, Glasgow.
  • Scokaert, P. O. M. 1994 . Constrained Predictive Control, Tese de doutorado, Univ. Oxford, UK.
  • Scokaert, P. O. M. Rawlings, J. B. 1998 . Constrained linear quadratic regulation, IEEE Trans. Automatic Control 43(8): 1163 - 1169.
  • Scokaert, P. Rawlings, J. 1997 . On infeasibilities in model predictive control, AIChE Symposium Series, pp. 331 - 334.
  • Vada, J., Slupphaug, O. Johansen, T. A. 2001 . Optimal prioritized infeasibility handling in model predictive control: parametric preemptive multiobjective linear programming approach, Journal of optimization theory and applications 109(2): 385 - 413.
  • Vada, J., Slupphaug, O., Johansen, T. Foss, B. 2001 . Linear MPC with optimal prioritized infeasibility handling: application, computational issues and stability, Automatica 37(11): 1835 - 1843.
  • Zafiriou, E. Chiou, H. 1993 . Output constraint softening for SISO model predictive control, Proc. American Control Conference

APÊNDICE A 

APÊNDICE B 

Datas de Publicação

  • Publicação nesta coleção
    02 Jan 2013
  • Data do Fascículo
    Dez 2012

Histórico

  • Recebido
    02 Ago 2011
  • Aceito
    15 Mar 2012
  • Revisado
    08 Nov 2011
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br