Acessibilidade / Reportar erro

Controle de sistemas lineares com comutação

Resumos

Este trabalho tem como objetivo o estudo de estabilidade de sistemas lineares com comutação sujeitos à perturbações impulsivas tendo em vista o projeto de controle via realimentação de estado com comutação. As condições obtidas são baseadas nas desigualdades de Lyapunov-Metzler, que asseguram a estabilidade mesmo quando o sistema evoluir sobre um modo deslizante. Estas desigualdades permitem levar em conta um custo garantido de desempenho. De forma a analisar a qualidade do resultado, um limitante inferior para o custo verdadeiro é determinado. A teoria desenvolvida é aplicada em um problema de controle H2 multiobjetivo com critérios possivelmente conflitantes. É mostrado que, neste contexto, o uso de controle com comutação fornece resultados melhores quando comparados com outros métodos encontrados na literatura. Exemplos acadêmicos são usados para ilustração.

sistemas com comutação; controle H2; sistemas a tempo contínuo; desigualdades de Lyapunov-Metzler


This work aims at studying the stability of switched linear systems with impulsive disturbances and at designing a state feedback switched control. The conditions are based on Lyapunov-Metzler inequalities, which assure that stability is preserved even if the system evolves on a sliding mode. A slight modification of these inequalities is introduced to cope with a guaranteed cost performance. In order to analyze the quality of the proposed solution, a lower bound for the actual cost is calculated. The theoretical results are applied to a multiobjective H2 control design problem with a number of possibly conflicting criteria. It is shown that the use of switched linear systems theory in multiobjective H2 control problems provides better results than others methods available in the literature. Academic examples are used for illustration.

switched systems; H2 control; continuoustime systems; Lyapunov-Metzler inequalities


SISTEMAS DE CONTROLE

Controle de sistemas lineares com comutação

Grace S. Deaecto; José C. Geromel

DSCE / Faculdade de Engenharia Elétrica e de Computação UNICAMP, CP 6101, 13083 - 970 Campinas, SP, Brasil - grace@dsce.fee.unicamp.br, geromel@dsce.fee.unicamp.br

RESUMO

Este trabalho tem como objetivo o estudo de estabilidade de sistemas lineares com comutação sujeitos à perturbações impulsivas tendo em vista o projeto de controle via realimentação de estado com comutação. As condições obtidas são baseadas nas desigualdades de Lyapunov-Metzler, que asseguram a estabilidade mesmo quando o sistema evoluir sobre um modo deslizante. Estas desigualdades permitem levar em conta um custo garantido de desempenho. De forma a analisar a qualidade do resultado, um limitante inferior para o custo verdadeiro é determinado. A teoria desenvolvida é aplicada em um problema de controle H2 multiobjetivo com critérios possivelmente conflitantes. É mostrado que, neste contexto, o uso de controle com comutação fornece resultados melhores quando comparados com outros métodos encontrados na literatura. Exemplos acadêmicos são usados para ilustração.

Palavras-chave: sistemas com comutação, controle H2, sistemas a tempo contínuo, desigualdades de Lyapunov-Metzler.

ABSTRACT

This work aims at studying the stability of switched linear systems with impulsive disturbances and at designing a state feedback switched control. The conditions are based on Lyapunov-Metzler inequalities, which assure that stability is preserved even if the system evolves on a sliding mode. A slight modification of these inequalities is introduced to cope with a guaranteed cost performance. In order to analyze the quality of the proposed solution, a lower bound for the actual cost is calculated. The theoretical results are applied to a multiobjective H2 control design problem with a number of possibly conflicting criteria. It is shown that the use of switched linear systems theory in multiobjective H2 control problems provides better results than others methods available in the literature. Academic examples are used for illustration.

Keywords: switched systems, H2 control, continuoustime systems, Lyapunov-Metzler inequalities.

1 INTRODUÇÃO

Nos últimos anos, o interesse no estudo de sistemas com comutação tem sido bastante significativo. A motivação deve-se ao fato de que a comutação entre subsistemas pode melhorar o desempenho global, além de permitir o surgimento de propriedades importantes que não são encontradas nos subsistemas isolados. Em princípio, a teoria de sistemas lineares com comutação pode ser dividida em dois grupos. No primeiro a regra de comutação, denotada σ(·), é independente dos estados e corresponde a uma incerteza variante no tempo. Neste caso, as condições de estabilidade devem garantir a robustez para qualquer σ(·) ∈ {1, 2, ..., N}, sendo N a quantidade de subsistemas. Veja (Hespanha e Morse, 2002) para a síntese de controladores que estabilizam sistemas com comutação em um contexto bastante geral. O segundo grupo é caracterizado pelo fato de σ(·) ser uma variável de controle que pode, inclusive, depender do estado do sistema em estudo. O objetivo consiste na determinação de uma regra de comutação σ(·) de tal forma a assegurar a estabilidade assintótica global. Em (Liberzon e Morse, 1999), (Liberzon, 2003), (DeCarlo et al., 2000), (Wirth, 2005), (Shorten et al., 2007) o leitor pode encontrar conjuntos de resultados bastante completos sobre sistemas lineares com comutação a tempo contínuo, em especial, para o caso de comutação envolvendo apenas dois subsistemas lineares. O artigo (Hespanha, 2005) utiliza extensões do Princípio da Invariância de LaSalle e fornece uma discussão interessante sobre resultados referentes à estabilidade uniforme de sistemas com comutação. Sistemas com comutação a tempo discreto são tratados em (Geromel e Colaneri, 2006b) e resultados sobre a construção de funções de Lyapunov estão disponíveis em (Daafouz e Bernussou, 2001), (Johansson e Rantzer, 1998).

Este trabalho tem como objetivo principal generalizar as condições de estabilidade obtidas em (Geromel e Colaneri, 2006a) para tratar sistemas com comutação mais gerais, sujeitos à perturbações impulsivas e realizar o projeto conjunto de uma regra de comutação σ(t) = g(x(t)) ∈ {1, 2, ..., N} e de ganhos de realimentação de estado {K1,...,KN} que permitem construir a lei de controle u(t) = Kσ(t)x(t). Mostramos que as condições de estabilidade dependem da solução de um conjunto de desigualdades de Lyapunov-Metzler mais gerais do que aquelas introduzidas em (Geromel e Colaneri, 2006a) . Estas desigualdades possuem natureza não-convexa devido à existência de produtos de variáveis, entre matrizes simétricas definidas positivas {P1,...,PN} e uma matriz de Metzler Π. Assim sendo, não é possível resolvê-las através da utilização de ferramentas disponíveis na literatura para tratar LMIs, (Boyd et al., 1994). . No entanto, apresentamos uma versão alternativa mais simples, embora mais conservadora, que é baseada nos resultados de (Geromel e Colaneri, 2006a) e consiste na utilização de uma subclasse de matrizes de Metzler caracterizada por apresentar elementos iguais na diagonal principal. Neste caso, a solução das referidas desigualdades não-convexas é conseguida através da manipulação de LMIs em conjunto com uma busca unidimensional. Em seguida, o problema de minimização de um custo garantido é tratado e, para evidenciar a qualidade do resultado final, calculamos limitantes superior e inferior (ver (Spinelli et al., 2006) para uma proposta alternativa) do custo ótimo.

As condições obtidas garantem a estabilidade inclusive na presença de possíveis modos deslizantes e não exigem que isoladamente cada subsistema seja estável. A teoria desenvolvida é ilustrada através de alguns exemplos. Em um deles, projetamos o controle para dois subsistemas instáveis e não controláveis para mostrar que a atuação conjunta de ambas as variáveis de controle, a saber, a regra de comutação e os ganhos de realimentação de estado, faz com que a origem do sistema em malha fechada seja globalmente assintoticamente estável. Em outro exemplo, projetamos um controle

2 multiobjetivo com comutação e o comparamos com as alternativas de controle propostas em (Khargonekar e Rotea, 1991) e (Eker e Malmborg, 1999). Resultados complementares, bem como uma discussão mais detalhada daqueles aqui apresentados podem ser encontrados em (Deaecto, 2007).

A notação usada é padrão. Para matrizes ou vetores reais (') indica o seu transposto. Para matrizes quadradas tr(X) denota a função traço de X. Para facilitar a notação de matrizes simétricas particionadas, o símbolo (•) denota genericamente cada bloco simétrico. O símbolo δ(t) denota o impulso unitário. A norma l2 de uma trajetória ξ(t) definida para todo t > 0 é dada por := ξ(t)'ξ(t)dt. O conjunto {1,...,N} é denotado por . Finalmente, a convolução de dois sinais ξ1(t) e ξ2(t) definidos para todo t > 0 é indicada por ξ1*ξ2.

2 ESTABILIDADE E DESEMPENHO

Para dar embasamento à teoria a ser desenvolvida em seguida, alguns resultados preliminares já apresentados em (Geromel e Colaneri, 2006a) são expostos. Considere o sistema

definido para todo t > 0, em que x(t)n é o estado e é suposto disponível para a realimentação, σ(t) é a regra de comutação e x0n é a condição inicial. Em cada instante de tempo a regra de comutação σ(t) ∈ seleciona uma matriz Aσ(t)n ×n dentre aquelas pertencentes ao conjunto {A1,...,AN}. As condições de estabilidade global, isto é, as condições sob as quais a origem x = 0 é um ponto de equilíbrio globalmente assintoticamente estável, são obtidas adotando-se a seguinte função de Lyapunov

sendo Pi, ∀i matrizes simétricas definidas positivas e λ ∈ n um elemento do conjunto convexo Λ,

Um aspecto relevante a ser considerado é que a função (2) não é diferenciável para todo xn. De fato, pode-se verificar 1 Para maiores detalhes o leitor deve consultar o apêndice. 1 1 Para maiores detalhes o leitor deve consultar o apêndice. que ela deixa de ser diferenciável em todos os pontos onde a minimização indicada em (2) não for única. Para facilitar os desenvolvimentos posteriores, definimos o conjunto de índices I(x) = {i : v(x) = x' Pix} ⊂ e notamos que para os casos em que a minimização (2) não for única, o conjunto I(x) contém mais de um elemento.

Nosso objetivo é encontrar uma regra de comutação g(x):n , e as condições para que σ(t) = g(x(t)) faça com que a origem do sistema (1) seja um ponto de equilíbrio globalmente assintoticamente estável. O teorema dado a seguir apresenta estas condições e, além disso, estabelece um limitante superior para um custo que depende quadraticamente das variáveis de estado do sistema em malha fechada. Sua prova decorre da utilização da função de Lyapunov (2) e de uma classe de matrizes de Metzler denotada por e composta por todas as matrizes Π ∈ N×N tais que

Observe, como uma conseqüência imediata, que para qualquer matriz desta classe, todos os elementos da sua diagonal principal são não-positivos, isto é πii< 0 para todo i.

Teorema 1Considere Qi para todo i matrizes simétricas semi-definidas positivas. Se existirem um conjunto de matrizes simétricas definidas positivas {P1,...,PN} e uma matriz Π ∈ satisfazendo as seguintes desigualdades de Lyapunov-Metzler

então a regra de comutação

faz com que a origem do sistema (1) seja um ponto de equilíbrio globalmente assintoticamente estável. Ademais, para qualquer condição inicial a seguinte desigualdade

é verdadeira.

Prova: Embora a prova já tenha sido apresentada em (Geromel e Colaneri, 2006a), vamos aqui repeti-la para comodidade do leitor. Devido ao fato de que a função (2) não é diferenciável para todo xn, calculamos sua derivada de Dini, dada por (Garg, 1998)

Assim sendo, considerando que em um instante de tempo genérico temos σ(t) = iI(x(t)), os desenvolvimentos apresentados no apêndiceapêndice→ . Por hipótese, . Defina a função como sendoSeja f(x,i): n × → . Por hipótese, f(x,i) tem derivadas parciais ∂f/∂xi contínuas para todo i ∈ . Defina a função ν(x):n→ como sendo levam a

Lembrando que x(t)' Pjx(t) > x(t)' Pix(t) e que πji> 0 para todo ji, utilizando (5) obtemos

fazendo com que a origem do sistema (1) seja globalmente assintoticamente estável. A determinação do limitante superior segue também da desigualdade (10) pois, lembrando que σ(t) = i, temos

Integrando ambos os lados desta desigualdade entre os instantes 0 e t, fazendo em seguida t → ∞ obtemos (7), já que a estabilidade assintótica global do sistema (1) implica v(x(∞)) = 0.

Um ponto relevante a ser levado em consideração é que as condições definidas em (Geromel e Colaneri, 2006a) asseguram a estabilidade do sistema inclusive na presença de possíveis modos deslizantes, já que para cada t > 0, I(x(t)) pode conter mais de um elemento. Neste caso, σ(t) utiliza apenas um deles selecionado arbitrariamente dentre os elementos de I(x(t)). Outro ponto a ser levado em consideração é que as condições apresentadas no Teorema 1 não exigem nenhuma propriedade de estabilidade das matrizes {A1,...,AN} tomadas individualmente. De fato, como πji> 0 para ij, uma condição necessária para que as desigualdades (5) sejam factíveis é que

para todo i. Como Pi > 0 para todo i, isto só pode ocorrer se as matrizes Ai + (πii/2)I, i forem assintoticamente estáveis. Além disso, tendo em vista que πii < 0, i, a factibilidade de (12) não exige a estabilidade de nenhuma das matrizes do conjunto {A1,...,AN}. Em outras palavras, as desigualdades de Lyapunov-Metzler (5) podem ser satisfeitas mesmo que as matrizes Ai, i não sejam assintoticamente estáveis. Este importante aspecto será ilustrado através de exemplos.

Vale ressaltar que a escolha da função de Lyapunov não é única. As condições para a estabilidade do sistema (1) podem, com uma certa condição adicional, ser obtidas através da utilização de uma função de Lyapunov diferente. Uma delas, ver (Liberzon, 2003) para maiores detalhes, é a seguinte

em que Pi é uma matriz simétrica definida positiva pertencente ao conjunto {P1,...,PN}. De maneira similar ao caso anterior definimos (x) = {i: V(x) = x ' Pix} e consideramos o conjunto de desigualdades matriciais

que ao serem resolvidas em relação às matrizes simétricas definidas positivas {P1, ..., PN} e à matriz de Metzler Π, permitem definir a regra de comutação

Seria de se esperar, dada a simetria min / max das soluções propostas, que ambas fornecessem sistemas globalmente assintoticamente estáveis. Infelizmente, este não é o caso, a não ser que assumamos que o conjunto (x(t)) contenha apenas um elemento para todo t > 0. Para verificar esta afirmação, considerando que em um instante genérico t > 0 temos σ(t) = i(x(t)), a partir dos resultados apresentados no apêndiceapêndice→ . Por hipótese, . Defina a função como sendoSeja f(x,i): n × → . Por hipótese, f(x,i) tem derivadas parciais ∂f/∂xi contínuas para todo i ∈ . Defina a função ν(x):n→ como sendo obtemos

Novamente, lembrando que x(t)' Pj x(t) < x(t)' Pix(t) e que πji> 0 para todo ji, utilizando (14), vem

o que comprova a estabilidade assintótica global do sistema com a regra de comutação (15). Note que a segunda igualdade em (16) depende fortemente do fato de existir apenas um elemento em (x(t)) em todo t > 0. Se esta hipótese não se verificar, por exemplo, na eventual ocorrência de modos deslizantes, (x(t)) necessariamente contém mais de um elemento e a estabilidade do sistema não pode ser estabelecida. Nesta situação, verifica-se através de exemplos que o sistema torna-se instável, (Deaecto, 2007). Entretanto, em alguns casos, a estabilidade assintótica ainda pode ser verificada a posteriori através de testes suplementares que permitam assegurar que o conjunto (x(t)) contém apenas um elemento, (Ishii et al., 2004). Infelizmente, estes testes são muito difíceis de serem aplicados sobretudo quando o número de subsistemas é maior do que dois.

De acordo com o Teorema 1, as condições para a estabilidade assintótica de (1) dependem da solução das desigualdades de Lyapunov-Metzler (5). Estas desigualdades possuem natureza não-convexa devido ao produto das variáveis (Π, {P1,...,PN}) e não é possível resolvê-las através de rotinas numéricas disponíveis na literatura para a solução de LMIs. No entanto, em (Geromel e Colaneri, 2006a) foi proposta uma versão mais conservadora que pode ser resolvida utilizando-se LMIs e uma busca unidimensional. Ela é obtida quando restringimos as matrizes de Metzler do Teorema 1 a terem uma estrutura particular com todos os elementos iguais na diagonal principal.

Corolário 2Considere Qi para todo i matrizes simétricas semi-definidas positivas. Se existirem um conjunto de matrizes simétricas definidas positivas {P1,...,PN} e um escalar positivo γ satisfazendo as desigualdades modificadas de Lyapunov-Metzler

então a regra de comutação (6) faz com que a origem do sistema (1) seja um ponto de equilíbrio globalmente assintoticamente estável e a desigualdade (7) seja satisfeita.

Prova: Considerando a subclasse de matrizes de Metzler com elementos iguais na diagonal principal, isto é πii = -γ, para todo i temos

Levando em conta que πji> 0 para todo ij × , multiplicando (18) por πji, somando para todos os elementos ij e finalmente multiplicando por γ-1, obtemos

para todo i. Ou seja, as desigualdades de Lyapunov-Metzler (5) são verificadas e a prova decorre imediatamente do Teorema 1.

Embora mais conservadoras do que as desigualdades de Lyapunov-Metzler, estas introduzidas no Corolário 2 são muito mais simples de serem resolvidas pois se reduzem a N LMIs acopladas para cada valor de γ > 0 fixo. Ademais, a condição necessária para a existência de solução continua a não exigir que as matrizes do conjunto {A1,..., AN} sejam assintoticamente estáveis.

3 PERTURBAÇÕES IMPULSIVAS

Considere um sistema com comutação e condições iniciais nulas, cuja realização no espaço de estado é dada por

em que x(t) ∈ n é o estado, w(t) ∈ m é a perturbação externa e ξ(t) ∈ p é a saída controlada. A regra de comutação σ(t) = i seleciona um determinado subsistema definido por (Ai, Gi, Ci). Para cada θ = 1,..., m, uma entrada impulsiva da forma w(t) = eθδ(t), com eθ representando a θ-ésima coluna da matriz identidade m × m, é aplicada e a correspondente saída controlada ξθ(t) é obtida, o que permite determinar . Desta forma, definimos o custo total associado a uma determinada regra de comutação σ(t) como sendo a soma das contribuições dos custos para θ = 1,..., m, ou seja

É importante salientar que na ausência de comutação, isto é, quando σ(t) = i para todo t > 0, a quantidade Θ(σ) coincide com o quadrado da norma 2 da função de transferência entre a entrada w e a saída ξ do sistema dinâmico linear com representação de estado definida pelas matrizes (Ai, Gi, Ci), (Colaneri et al., 1997). O teorema a seguir apresenta condições para a estabilidade assintótica global do sistema (21)-(22), bem como um limitante superior do custo funcional (23).

Teorema 3Se existirem um conjunto de matrizes simétricas definidas positivas {P1,...,PN} e uma matriz Π ∈ satisfazendo as seguintes desigualdades de Lyapunov-Metzler

então a regra de comutação (6) faz com que o ponto de equilíbrio x = 0 do sistema (21)-(22) seja globalmente assintoticamente estável. Ademais, a seguinte desigualdade

é verdadeira.

Prova: Podemos observar que para a mesma regra de comutação, a solução de (21) com x(0) = 0 e w(t) = eθδ(t) é igual à solução de (1) com x(0) = Gσ(0)eθ, pois ambas satisfazem

Esta propriedade permite utilizar diretamente os resultados do Teorema 1 no sistema (21)-(22). Substituindo as matrizes Qi pelas matrizes para todo i obtemos as desigualdades (24) que asseguram a estabilidade assintótica bem como a validade do limitante superior

Conseqüentemente, somando as parcelas para θ = 1, ..., m determinamos

o que prova o teorema proposto.

Uma discussão relevante a respeito do resultado deste teorema refere-se à determinação do valor de σ(0) a ser usado em (21)-(22). Note que no instante t = 0, imediatamente anterior à aplicação do impulso, a regra de comutação

não especifica σ(0) pois x(0) = 0. Ou seja, podemos escolher σ(0) = da forma mais conveniente para reduzir o custo garantido que aparece no lado direito de (25). Assim procedendo, obtemos

em que Φ representa o conjunto de todas as soluções factíveis de (24). O esforço computacional para resolver o problema de otimização indicado no lado direito de (30) pode ser reduzido impondo-se = i. É claro que, assim procedendo, o resultado final é um limitante superior mais conservador. O corolário a seguir apresenta as condições para a estabilidade assintótica global do sistema (21)-(22) utilizando a subclasse de matrizes de Metzler com elementos iguais na diagonal principal.

Corolário 4Se existirem um conjunto de matrizes simétricas definidas positivas {P1,...,PN} e um escalar positivo γ satisfazendo a s desigualdades modificadas de Lyapunov-Metzler

então a regra de comutação (6) faz com que a origem do sistema (21)-(22) seja um ponto de equilíbrio globalmente assintoticamente estável e a desigualdade (25) seja satisfeita.

Prova: A demonstração segue, em linhas gerais, aquela do Corolário 2 e será, portanto, omitida.

Uma maneira de verificar se o custo garantido proposto no Teorema 3 é preciso consiste em determinar a folga eventualmente existente entre ambos os lados da desigualdade (25). Entretanto, como a determinação analítica do custo Θ(σ) é virtualmente impossível, propomos um limitante inferior para Θ(σ) de forma a viabilizar aquela verificação, ainda que não exatamente.

Teorema 5Se existirem um conjunto de matrizes simétricas definidas positivas {P1,...,PN} e uma matriz Π ∈ satisfazendo as seguintes desigualdades de Lyapunov-Metzler

então para qualquer regra de comutação que estabiliza o sistema (21)-(22), a seguinte desigualdade é verdadeira

Prova: Considerando que em um instante de tempo t > 0 temos σ(t) = q sendo σ(·) uma regra de comutação qualquer que estabiliza assintoticamente o sistema (1), a derivada direcional da função de Lyapunov (13) permite concluir que

para todo i(x(t)). Por outro lado, levando em conta que x(t)' Pix(t) > x(t)' Pjx(t) e que πji> 0 para todo ji, usando (32), obtemos

que após integração em ambos os lados fornece V(x(0)) – V(x(∞)) < . Desta forma, com a condição inicial x0 = Gσ(0)eθn e levando em conta que a regra de comutação estabilizante faz com que V(x(∞)) = 0, temos > V(x0) = . Conseqüentemente,

o que prova o teorema proposto.

Note que é possível determinar o maior limitante inferior para Θ(σ) maximizando-se o lado direito de (33) o que nos leva à desigualdade

em que Ω representa o conjunto de todas as soluções factíveis de (32).

Como já foi comentado anteriormente, encontrar uma solução para as desigualdades (32) não é uma tarefa simples. A dificuldade reside no fato de que elas não são lineares devido à presença dos produtos de variáveis πjiPj para todo i, j × . Uma maneira de contornar esta dificuldade é considerar apenas matrizes Π ∈ com elementos iguais na diagonal principal. O corolário seguinte apresenta formalmente este resultado.

Corolário 6Se existirem um conjunto de matrizes simétricas definidas positivas {P1,...,PN} e um escalar positivo γ satisfazendo as seguintes desigualdades modificadas de Lyapunov-Metzler

para todo i j × e q , então para qualquer regra de comutação que estabiliza o sistema (21)-(22), a desigualdade (33) é verdadeira.

Prova: Trata-se de prova idêntica àquela do Corolário 2, sendo assim omitida.

O exemplo dado a seguir ilustra a teoria desenvolvida nesta seção. Nosso objetivo, em particular, é aplicar os resultados do Corolário 4 e do Corolário 6 para avaliar a folga existente entre os limitantes superior (25) e inferior (33) do custo Θ(σ) para uma regra de comutação específica.

Exemplo 1 : Este exemplo foi proposto em (Geromel et al., 2008). Considere o sistema (21)-(22), constituído por N = 2 subsistemas lineares definidos pelas matrizes

Nosso objetivo inicial é determinar uma regra de comutação de tal forma que x = 0 seja um ponto de equilíbrio globalmente assintoticamente estável. É importante notar que cada subsistema isolado é instável.

A solução ótima do problema de otimização

com γ = 200, foi determinada sem dificuldades tendo em vista que ele se reduz a dois problemas independentes descritos por LMIs. Desta forma determinamos as matrizes simétricas definidas positivas

bem como o limitante superior 8.8925. A partir das matrizes P1 e P2 a regra de comutação (6) foi implementada. As trajetórias das variáveis de estado x(t) ∈ 3 em função do tempo, considerando uma pertubação impulsiva do tipo w(t) = e1δ(t) com e1 sendo a primeira coluna da matriz identidade, são apresentadas na Figura 1. Em seguida, o problema de otimização


com γ = 200 também foi resolvido para determinar o limitante inferior 4.2503. Com base nestes resultados podemos afirmar que 4.2503 < Θ(σ) < 8.8925 sendo σ a regra de comutação (6) determinada com as matrizes P1 e P2. Via simulação numérica determinamos Θ(σ) = 4.9730, o que mostra uma maior precisão do limitante inferior. Por outro lado, podemos também ressaltar que muito embora o problema de controle ótimo infσ Θ(σ), restrito ao conjunto de todas as regras de comutação estabilizantes, seja praticamente impossível de ser resolvido, sua solução σ* satisfaz 4.2503 < Θ(σ*) < 4.9730. Isto coloca em evidência a qualidade do resultado obtido.

4 SÍNTESE DE CONTROLE

Como veremos, não há grandes dificuldades para projetar, simultaneamente, um controle via realimentação de estado e uma regra de comutação que minimizam o custo garantido introduzido anteriormente. Neste sentido, considere o sistema

com condições iniciais nulas, em que x(t) ∈ n é o estado, u(t) ∈ r é o controle, w(t) ∈ m é a entrada externa impulsiva e ξ(t) ∈ p é a saída controlada. Como anteriormente comentado, a regra de comutação σ(t) = i seleciona um subsistema definido por (Ai, Bi, Gi, Ci, Di). Nosso objetivo é determinar uma lei de controle da forma

e uma regra de comutação σ(x(t)) = i que seleciona, a cada instante de tempo t > 0, um elemento do conjunto = {K1,...,KN}. Aplicando (46) em (44)-(45), o sistema em malha fechada pode ser representado pelas equações no espaço de estado

com condições iniciais nulas. Trata-se de um sistema com a mesma estrutura daquele já tratado. A única diferença reside na presença dos ganhos de controle a serem determinados.

Teorema 7Se existirem dois conjuntos de matrizes simétricas definidas positivas {X1, ...,XN}, Zij i j × , um conjunto de matrizes {L1, ...,LN} e uma matriz Π ∈ tais que as seguintes desigualdades sejam satisfeitas

com

i = AiXi + BiLi +
+
, então a regra de comutação (6) com Pi = Xi -1 e os ganhos de realimentação Ki = LiXi -1 fazem com que o sistema em malha fechada seja globalmente assintoticamente estável. Ademais, a seguinte desigualdade

é verdadeira.

Prova: Admitindo que as desigualdades matriciais (49), (50) e (51) sejam válidas, levando em conta que Ki = LiXi-1, aplicando o Complemento de Schur em (51) e multiplicando ambos os lados por Pi = Xi-1, obtemos

para todo i. Em seguida, aplicando o Complemento de Schur em (50) e posteriormente multiplicando ambos os lados por Pi, obtemos

Utilizando as desigualdades (53) e (54) e lembrando que = -πii, temos

para todo i. Como estas desigualdades, com Pi

i Pi = (Ai + BiKi)' Pi + Pi(Ai + BiKi), representam a aplicação do Teorema 3 no sistema em malha fechada (47)-(48) concluímos que ele é globalmente assintoticamente estável e que Θ(σ) < junto com (51) permitem obter (52), o que prova o teorema proposto.

Podemos utilizar um resultado alternativo, porém mais conservador, para tornar o problema apresentado no Teorema 7 possível de ser resolvido através de LMIs e de uma busca unidimensional, tal como foi feito anteriormente. O corolário a seguir apresenta as LMIs resultantes.

Corolário 8 Se existirem um conjunto de matrizes simétricas definidas positivas {X1,...,XN}, um conjunto de matrizes {L1,...,LN} e um escalar positivo γ satisfazendo as seguintes desigualdades modificadas de Lyapunov-Metzler

para todo ij ×

com i = AiXi + BiLi +

+
, então a regra de comutação (6) com Pi = Xi-1 e os ganhos de realimentação Ki = LiXi-1 fazem com que o sistema em malha fechada seja globalmente assintoticamente estável e a desigualdade (52) seja verdadeira.

Prova: Imediata e será, portanto, omitida.

Para o cálculo do limitante inferior basta verificar que o Teorema 5 ou o Corolário 6 podem ser aplicados imediatamente para o sistema em malha fechada. Isto é, as matrizes Aq e Cq devem ser substituídas pelas matrizes Aq + BqKq e Cq + Dq Kq, respectivamente. Observe que os referidos resultados permitem determinar limitantes inferiores para o custo Θ(σ) correspondentes aos ganhos de realimentação Kq já determinados. Como acabamos de verificar através do Teorema 7 e do Corolário 8, a dificuldade de síntese está concentrada no cálculo de Θ(σ) e não na determinação dos ganhos de realimentação que definem o controle u(t) = Kσ(t)x(t). O exemplo dado a seguir ilustra os resultados apresentados nesta seção.

Exemplo 2 : Foi inspirado em um exemplo tratado em (Xie e Wang, 2004). O objetivo é aplicar o procedimento de síntese de controle do Corolário 8 ao sistema (44)-(45) com as respectivas matrizes do seu modelo de estado dadas por

Cabe notar que cada subsistema isolado é instável e não controlável. Mesmo assim, será possível determinar uma regra de comutação estabilizante. Fixando γ = 500, o problema de otimização

foi resolvido considerando σ(0) = 1 e σ(0) = 2. A solução com menor custo 14.3278, que define um limitante superior para Θ(σ), correspondente a σ(0) = 2 é dada por

A Figura 2 apresenta as trajetórias dos estados do sistema em malha fechada x(t) ∈ 2 que convergem para zero em um intervalo de tempo menor do que 2 segundos. Para os mesmos ganhos de realimentação, com o Corolário 6, determinamos um limitante inferior de Θ(σ) igual a 7.2892. Portanto, este exemplo ilustra que mesmo com todos os subsistemas instáveis e não controláveis, as condições do Corolário 8 permitem determinar uma lei de controle estabilizante, cujo custo pertence à faixa 7.2892 < Θ(σ) < 14.3278. Na verdade, via simulação numérica o valor exato Θ(σ) = 7.8812 foi determinado, o que mais uma vez comprova a qualidade do resultado, sobretudo a precisão do limitante inferior. Por outro lado, aplicando as condições do Corolário 8 com os ganhos de realimentação nulos, deixando atuar apenas a regra de comutação σ(t), não é possível fazer com que a origem seja globalmente assintoticamente estável. Portanto, este exemplo mostra a importância da síntese conjunta de ambas as variáveis de controle, a saber, a regra de comutação e os ganhos de realimentação de estado {K1, ..., KN}.


5 CONTROLE

2 MULTIOBJETIVO

Nesta seção, aplicamos os resultados desenvolvidos anteriormente em problemas de controle

2 multiobjetivo tendo em vista a real possibilidade de tratarmos sistemas com diversos critérios de desempenho possivelmente conflitantes. Considere o sistema linear invariante no tempo com múltiplas entradas e múltiplas saídas apresentado na Figura 3 e descrito pelas seguintes equações de estado


com condições iniciais nulas. Os vetores x, u, w, z e y representam o estado, o controle, a entrada externa, a saída controlada e a saída medida, respectivamente. As matrizes H, C e D são particionadas de acordo com a partição do vetor de entrada w' = [ ... w'N] e do vetor de saída z' = [ ... z'N] da seguinte forma

A saída medida y é conectada à entrada de controle u através de uma função de transferência K(s) definida pelo controlador de tal forma que para cada i denominamos Ti(s) a função de transferência em malha fechada entre a entrada wi e a saída zi. O problema 2 multiobjetivo consiste na determinação de uma única função de transferência K(s) de forma a estabilizar o sistema em malha fechada e minimizar o vetor J(K)

Esta minimização não é fácil, uma vez que geralmente, a minimização dos critérios para i apresenta objetivos conflitantes, ou seja, a função de transferência K(s) que minimiza cada um deles não é a mesma. A solução deste problema foi estudada por vários autores, veja (Khargonekar e Rotea, 1991) e suas referências. A estratégia utilizada por (Khargonekar e Rotea, 1991) foi a utilização da parametrização de Youla, que permite expressar as quantidades como funções afins de uma variável QRH. Graças à convexidade de com relação a QRH, o conjunto de todas as soluções ótimas de Pareto é obtido a partir do seguinte problema de otimização escalar

com λ ∈

N representando um elemento do conjunto convexo Λ definido em (3). Para cada valor de λ ∈ Λ dado, o problema (66) fornece uma das soluções ótimas de Pareto, sendo possível obter o valor ótimo de RH e, por conseqüência, o controlador ótimo , tal que a conexão u = *y estabiliza o sistema em malha fechada e minimiza a função objetivo escalar , com zi sendo a resposta ao impulso do i-ésimo canal com entrada wi e saída zi para todo i. O vetor λº é definido a priori de forma a selecionar uma solução de Pareto escolhida.

Nesta seção, pretendemos empregar os resultados anteriores para resolver o problema multiobjetivo exposto em (65), a partir de uma formulação mais abrangente que passamos a discutir. Supondo que o sistema (59)-(61) possua apenas uma entrada e múltiplas saídas, propomos uma lei de controle da forma u(t) = Kσ(t)*y(t), em que σ(t) é a regra de comutação que seleciona a cada instante de tempo um ganho de realimentação específico Kσ(t) = {K1,..., KN}. Diferente do problema clássico multiobjetivo (Khargonekar e Rotea, 1991) , em que o vetor λ ∈ Λ é considerado invariante no tempo, no presente caso, λ é variante no tempo λ(t) ∈ , sendo que representa o conjunto de todos os vértices de Λ, e corresponde a uma variável adicional a ser determinada de forma a minimizar a função objetivo . Para cada t > 0, associada ao vetor λ(t) ∈ V, definimos a regra de comutação σ(t) = i se λi(t) = 1 e λj(t) = 0 para todo ij e a nova saída controlada ξ(t) = Cσ(t)x(t) + Dσ(t) u(t). O novo problema de otimização a ser resolvido é

sendo que representa o conjunto das informações disponíveis para a realimentação, ou seja = {y(τ): ∀τ < τ}. O problema (67) não é simples de ser resolvido devido à natureza variante no tempo da lei de comutação σ(t). Assim, em (Eker e Malmborg, 1999) foi proposta uma estratégia para resolver (67) composta de duas etapas. A primeira consiste em encontrar o valor de Ki para cada σ(t) = i fixo

A segunda consiste na determinação da regra de comutação

a partir da função custo

i(x) associada ao problema de otimização resolvido na primeira etapa.

No contexto deste trabalho, propomos substituir o problema de otimização (67), pela minimização de um limitante superior adequado para que fornece a regra de comutação e um conjunto de ganhos de realimentação = {K1,..., KN}. Neste sentido, considerando o sistema (59)-(61) com a nova saída ξ, admitindo que todos os estados estejam disponíveis para realimentação, o que implica em E = I, G = 0 e substituindo u(t) = Kσ(t)x(t) em (59)-(61), obtemos

com condições iniciais nulas. Note que este sistema em malha fechada tem uma estrutura idêntica àquele dado em (47)-(48). Portanto, a solução do problema exposto pode ser obtida aplicando-se o resultado do Corolário 8 que fornece

sendo Φ(γ) o conjunto de todas as matrizes (Xi, Wi, Li), i satisfazendo as desigualdades (56) e (57) para γ > 0 fixo, de tal maneira que inf(σ, u)∈γ < pois, para a mesma regra de comutação e os mesmos ganhos de realimentação, sabemos que = Θ(σ). Devemos notar que o problema (72) é equivalente a N problemas independentes que podem ser resolvidos fazendo uma busca unidimensional em γ e resolvendo um conjunto de LMIs.

Teorema 9 Para o caso de realimentação de estado, as seguintes afirmações são verdadeiras:

a) O custo Jº é menor ou igual ao custo da solução proposta em (Eker e Malmborg, 1999).

b) O custo Jº é menor ou igual ao custo de qualquer solução de Pareto dada em (Khargonekar e Rotea, 1991).

Prova: Considerando γ > 0 arbitrariamente pequeno, as restrições (56) são desacopladas e portanto

em que Pi > 0 e Ki são tais que

com Aki = A + BKi e Cki = C + DKi, para todo i. Logo, da desigualdade (73) obtemos

que prova o item a), uma vez que a solução de (75) em relação a Ki satisfaz (68) e i(x) = x' Pix. Para provar o item b) considere K um ganho estabilizante qualquer e introduza no problema (72) as restrições adicionais K Xi = Li, para todo i. Com γ positivo arbitrariamente pequeno, (73) e (74) são válidas para K = K1 = ... = KN e, conseqüentemente, de (75), temos

para todo λ ∈ Λ o que prova o teorema proposto.

A prova do Teorema 9 deixa claro que os métodos propostos em (Khargonekar e Rotea, 1991) e (Eker e Malmborg, 1999) são comparáveis ao deste artigo considerando o parâmetro γ arbitrariamente pequeno. Logo, é de se esperar que com um grau de liberdade adicional, introduzido por γ > 0, seja possível determinar uma solução com menor custo. Esta conclusão é natural pois em relação ao método (Eker e Malm-borg, 1999) temos um grau de liberdade adicional (parâmetro γ > 0) e, em relação a (Khargonekar e Rotea, 1991) temos vários graus de liberdade adicionais (γ > 0 e N diferentes ganhos K1,..., KN). O exemplo a seguir ilustra os aspectos teóricos discutidos nesta seção.

Exemplo 3 : Este exemplo foi extraído de (Geromel e Deaecto, 2007). Considere o sistema (68)-(70), com H = I e as matrizes

que representa um triplo integrador com dois critérios conflitantes. Desejamos resolver o problema

2 multiobjetivo utilizando cada um dos métodos discutidos e comparando-os entre si.

• Método I (Khargonekar e Rotea, 1991) - A Figura 4 apresenta o conjunto de todas as soluções de Pareto do problema multiobjetivo. Foi verificado que elas têm custos entre 51.33 para λ = [1 0]' e 139.49 para λ = [0.4 0.6]'.


• Método II (Eker e Malmborg, 1999) - A solução ótima do primeiro critério tem um custo igual a 51.33 enquanto que o valor mínimo do segundo critério é 95.40. Assim sendo, o controle obtido por este método apresenta um custo não superior a 51.33.

• Método Proposto - O problema (72) foi resolvido para γ = {10-5, 10-1, 1, 2, 10} obtendo-se os custos associados = {51.33, 56.39, 57.70, 51.89, 42.16}. Note que para γ muito pequeno o custo obtido é praticamente igual ao do método II. Para γ superior a 2.2 os custos obtidos são sempre menores que os dos métodos I e II, indicando que o grau de liberdade adicional devido ao parâmetro γ resulta, de fato, em um sistema em malha fechada com melhor desempenho. Se o problema (72) fosse resolvido para os mesmos valores de γ, mas considerando o ganho Ki conhecido e igual ao ganho ótimo de cada critério isolado para i = 1 e 2, os custos obtidos seriam = {51.33, 58.87, 92.26, 93.37, 89.91}. Note que eles seriam maiores que os obtidos pelos métodos anteriores, indicando a importância de se projetar as duas variáveis de controle Kσ(t) e σ(t) conjuntamente.

A Figura 5 apresenta as trajetórias da variável de estado x3(t) a partir da condição inicial x(0) = [1 1 1]', com o controle ótimo relativo a cada critério isolado, o controle do método II e com aquele obtido pelo método aqui proposto para γ = 10. Os custos correspondentes são 102.16, 194.31, 102.16 e 57.25, respectivamente.


6 CONCLUSÃO

Neste trabalho, analisamos diversos aspectos de sistemas lineares com comutação. Dentre eles devemos citar o estudo de estabilidade assintótica global e a determinação de um custo garantido que se aplica quando o sistema estiver sujeito à perturbações externas impulsivas. Este último resultado reduz-se à norma

2 quando não ocorrem comutações. As diversas condições são expressas por um conjunto de desigualdades de Lyapunov-Metzler que possuem natureza não-convexa sendo, portanto, de difícil solução. Para contornar esta dificuldade propomos um método alternativo que substitui a solução de desigualdades não-convexas por uma busca unidimensional e a solução de um conjunto de LMIs. Para evidenciar a qualidade do resultado final, calculamos limitantes inferiores para o critério de desempenho adotado. Um ponto interessante e ilustrado através de um exemplo é a possibilidade de determinar um controle estabilizante mesmo que cada subsistema isolado seja instável e não controlável. A teoria desenvolvida foi utilizada com sucesso para propor uma solução alternativa para problemas 2 multiobjetivo. Neste particular contexto, o método proposto fornece resultados melhores que os existentes na literatura para tratar esta classe de problemas. Um tópico interessante para pesquisas futuras consiste na obtenção de resultados similares para sistemas com comutação e realimentação de saída. Neste caso, o objetivo principal continua sendo a determinação de um conjunto de controladores dinâmicos e uma lei de comutação que sejam capazes de assegurar a estabilidade assintótica global do sistema em malha fechada. A dificuldade central é que, não sendo o estado disponível, as regras de comutação aqui apresentadas não podem ser adotadas. Uma primeira abordagem deste problema foi feita em (Geromel et al., 2008).

8 AGRADECIMENTOS

Agradecemos à Fapesp (Fundação de Amparo à Pesquisa do Estado de São Paulo) e ao CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) pelo apoio financeiro e aos revisores, cujas sugestões certamente contribuíram para o aprimoramento deste artigo.

Artigo submetido em 06/03/2007

1a. Revisão em 09/09/2008

2a. Revisão em 29/09/2008

Aceito sob recomendação do Editor Associado Prof. José Roberto Castilho Piqueira

Trata-se de uma função contínua mas que não é necessariamente diferenciável nos pontos em que o conjunto

é composto por mais de um elemento. A derivada direcional à direita da função (77) em um ponto xn e em uma direção dn é definida na forma

e é calculada com o auxílio do Teorema de Danskin cuja prova pode ser encontrada em (Lasdon, 1970), pag. 420.

Teorema de Danskin A derivada direcional da função ν(x) existe em qualquer ponto xn, em qualquer direção dn e é dada por

A prova deste importante resultado mostra que a derivada direcional D+ν(x,d) dada acima é conseguida tendo em vista que os limites limsup e liminf do lado direito de (79) coincidem.

Suponha agora que x(t), t > 0 seja uma trajetória qualquer do sistema linear (t) = Ax(t). Para h → 0+, temos x(t + h) = x(t) + h(t) = x(t) + hAx(t) e portanto

No caso particular tratado neste artigo que corresponde a escolher f(x,i) = x' Pix com Pi matrizes simétricas definidas positivas para todo i, obtemos

Este procedimento pode também ser aplicado para calcular a derivada direcional da função

De fato, definindo (x) = {i : (x) = f(x,i)} ⊂ e reescrevendo-a de forma equivalente

o Teorema de Danskin fornece

permitindo concluir que, em particular, para as funções quadráticas f(x,i) = x' Pix com Pi matrizes simétricas definidas positivas para todo i, temos

Estes resultados são aplicados em diversos pontos deste artigo, sobretudo na prova do Teorema 1 e na discussão colocada em seguida.

  • Boyd, S. P., Ghaoui, L. E., Feron, E. Balakrishnan, V. 1994 . Linear matrix inequalities in system and control theory, SIAM, Philadelphia.
  • Colaneri, P., Geromel, J. C. Locatelli, A. 1997 . Control theory and design: an RH2 and RH viewpoint, Academic Press Inc., London.
  • Daafouz, J. Bernussou, J. 2001 . Parameter dependent Lyapunov functions for discrete time systems with time varying parametric uncertainties, Systems & Contr. Letters 43: 355-359.
  • Deaecto, G. S. 2007 . Síntese de controle para sistemas dinâmicos com comutação, tese de mestrado, Universidade Estadual de Campinas - FEEC, Campinas, Săo Paulo.
  • DeCarlo, R. A., Branicky, M. S., Pettersson, S. Lennartson, B. 2000 . Perspectives and results on the stability and stabilization of hybrid systems, Proceedings of the IEEE 88: 1069-1082.
  • Eker, J. Malmborg, J. 1999 . Design and implementation of a hybrid control strategy, IEEE Contr. and Systems Magazine 19: 12-21.
  • Garg, K. M. 1998 . Theory of differentiation: A unified theory of differentiation via new derivate theorems and new derivatives, Wiley-Interscience.
  • Geromel, J. C. Colaneri, P. 2006a . Stability and stabilization of continuous-time switched linear systems, SIAM Journal on Contr. and Optimization 45: 470-482.
  • Geromel, J. C. Colaneri, P. 2006b . Stability and stabilization of discrete-time switched systems, Int. Journal of Contr. 79: 719-728.
  • Geromel, J. C., Colaneri, P. Bolzern, P. 2008 . Dynamic output feedback control of switched linear systems, IEEE Trans. on Automat. Contr. 53: 720-733.
  • Geromel, J. C. Deaecto, G. S. 2007 . Multi-objective H2 control via switched linear systems, Proceedings of the 3rd IFAC Symposium on System, Structure and Control, SSSC-07, session WE2: Switched and jump systems, paper 3, Iguassu Falls
  • Hespanha, J. P. 2005 . Uniform stability of switched linear systems: extensions of LaSalle's Principle, IEEE Trans. on Automat. Contr. 43: 555-559.
  • Hespanha, J. P. Morse, A. S. 2002 . Switching between stabilizing controllers, Automatica 38: 1905-1917.
  • Ishii, H., Basar, T. Tempo, R. 2004 . Randomized algorithms for synthesis of switching rules of multimodal systems, IEEE Trans. on Automat. Contr. 49: 470-482.
  • Johansson, M. Rantzer, A. 1998 . Computation of piecewiese quadratic Lyapunov functions for hybrid systems, IEEE Trans. on Automat. Contr. 43: 555-559.
  • Khargonekar, P. P. Rotea, M. A. 1991 . Multiobjective optimal control of linear systems: The quadratic norm case, IEEE Trans. on Automat. Contr. 36: 14-24.
  • Lasdon, L. S. 1970 . Optimization theory for large systems, Macmillan, NY.
  • Liberzon, D. 2003 . Switching in systems and control, Birkhäuser.
  • Liberzon, D. Morse, A. S. 1999 . Basic problems in stability and design of switched systems, IEEE Contr. Systems Magazine 19: 59-70.
  • Shorten, R., Wirth, F., Mason, O., Wulff, K. King, C. 2007 . Stability criteria for switched and hybrid systems, SIAM Review 49: 545-592.
  • Spinelli, W., Bolzern, P. Colaneri, P. 2006 . Computation of lower bounds for the optimal quadratic cost of linear switched systems, Proceedings of the 2006 American Control Conference pp. 5444-5449.
  • Wirth, F. 2005 . A converse Lyapunov theorem for linear parameter varying and linear switching systems, SIAM Journal Contr. and Optimization 44: 210-239.
  • Xie, G. Wang, L. 2004 . Periodical stabilization of switched linear systems, Journal of Computational and Applied Mathematics 181: 176-187.

apêndice

. Por hipótese, . Defina a função como sendo

Seja f(x,i): n × . Por hipótese, f(x,i) tem derivadas parciais ∂f/∂xi contínuas para todo i. Defina a função ν(x):n como sendo

  • 1
    Para maiores detalhes o leitor deve consultar o
    apêndiceapêndice→ . Por hipótese, . Defina a função como sendoSeja f(x,i): n × → . Por hipótese, f(x,i) tem derivadas parciais ∂f/∂xi contínuas para todo i ∈ . Defina a função ν(x):n→ como sendo .
  • Datas de Publicação

    • Publicação nesta coleção
      20 Jan 2009
    • Data do Fascículo
      Dez 2008

    Histórico

    • Recebido
      06 Mar 2007
    • Revisado
      29 Set 2008
    Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
    E-mail: revista_sba@fee.unicamp.br