Acessibilidade / Reportar erro

Rastreamento global via controle por modos deslizantes e observador com ganho dinâmico

Global tracking via sliding mode control and dynamic gain observer

Resumos

Uma nova estratégia de controle por modos deslizantes via realimentação de saída é proposta para uma classe de sistemas não-lineares incertos, monovariáveis e variantes no tempo, para a qual um observador da norma do estado possa ser implementado. Esta classe inclui sistemas de fase-mínima com não-linearidades limitadas de modo afim nos estados não-medidos e com taxa de crescimento dependendo não-linearmente da saída medida e de estados internos relacionados com a dinâmica dos zeros. A superfície de deslizamento é gerada utilizando-se os estados de um observador de alto ganho (HGO), enquanto que a amplitude de controle livre de peaking é obtida a partir de um observador da norma do estado. Diferentemente das outras soluções semi-globais encontradas na literatura de controle por modos deslizantes disponíveis para a classe de plantas considerada aqui, o esquema proposto é livre de peaking e alcança o rastreamento global com respeito a um pequeno conjunto residual. A idéia chave é projetar um HGO com ganho variável, implementado a partir de sinais medidos.

sistemas não-lineares incertos; controle por modos deslizantes; realimentação de saída; rastreamento global; observador de alto ganho e da norma


A novel output-feedback sliding mode control (SMC) strategy is proposed for a class of single-input-singleoutput (SISO) uncertain time-varying nonlinear systems for which a norm state estimator can be implemented. Such a class encompasses minimum-phase systems with nonlinearities afinely norm bounded by unmeasured states with growth rate depending nonlinearly on the measured system output and on the internal states related with the zero-dynamics. The sliding surface is generated by using the state of a high gain observer (HGO) while a peaking free control amplitude is obtained via norm observer. In contrast to the existing semi-global SMC solutions available in the literature for the class of plants considered here, the proposed scheme is free of peaking and achieves global tracking with respect to a small residual set. The key idea is to design a time-varying HGO gain implementable only from measurable signals.

uncertain nonlinear systems; sliding mode control; output-feedback; global tracking; high gain and norm observer


TEORIA DE CONTROLE

Rastreamento global via controle por modos deslizantes e observador com ganho dinâmico

Global tracking via sliding mode control and dynamic gain observer

Alessandro Jacoud PeixotoI; Liu HsuzII; Tiago Roux OliveiraIII

IDep. de Engenharia Eletrônica e de Computação -DEL, Universidade Federal do Rio de Janeiro -UFRJ, Rio de Janeiro, RJ, Brasil. jacoud@poli.ufrj.br

IIPrograma de Engenharia Elétrica -PEE/COPPE, Universidade Federal do Rio de Janeiro -UFRJ, Rio de Janeiro, RJ, Brasil. liu@coep.ufrj.br

IIIDep. de Engenharia Eletrônica e Telecomunicações -DETEL, Universidade do Estado do Rio de Janeiro -UERJ, Rio de Janeiro, RJ, Brasil. tiagoroux@uerj.br

RESUMO

Uma nova estratégia de controle por modos deslizantes via realimentação de saída é proposta para uma classe de sistemas não-lineares incertos, monovariáveis e variantes no tempo, para a qual um observador da norma do estado possa ser implementado. Esta classe inclui sistemas de fase-mínima com não-linearidades limitadas de modo afim nos estados não-medidos e com taxa de crescimento dependendo não-linearmente da saída medida e de estados internos relacionados com a dinâmica dos zeros. A superfície de deslizamento é gerada utilizando-se os estados de um observador de alto ganho (HGO), enquanto que a amplitude de controle livre de peaking é obtida a partir de um observador da norma do estado. Diferentemente das outras soluções semi-globais encontradas na literatura de controle por modos deslizantes disponíveis para a classe de plantas considerada aqui, o esquema proposto é livre de peaking e alcança o rastreamento global com respeito a um pequeno conjunto residual. A idéia chave é projetar um HGO com ganho variável, implementado a partir de sinais medidos.

Palavras-chave: sistemas não-lineares incertos, controle por modos deslizantes, realimentação de saída, rastreamento global, observador de alto ganho e da norma.

ABSTRACT

A novel output-feedback sliding mode control (SMC) strategy is proposed for a class of single-input-singleoutput (SISO) uncertain time-varying nonlinear systems for which a norm state estimator can be implemented. Such a class encompasses minimum-phase systems with nonlinearities afinely norm bounded by unmeasured states with growth rate depending nonlinearly on the measured system output and on the internal states related with the zero-dynamics. The sliding surface is generated by using the state of a high gain observer (HGO) while a peaking free control amplitude is obtained via norm observer. In contrast to the existing semi-global SMC solutions available in the literature for the class of plants considered here, the proposed scheme is free of peaking and achieves global tracking with respect to a small residual set. The key idea is to design a time-varying HGO gain implementable only from measurable signals.

Keywords: uncertain nonlinear systems, sliding mode control, output-feedback, global tracking, high gain and norm observer.

1 INTRODUÇÃO

Diversas abordagens para lidar com o problema de rastreamento via controle por modos deslizantes e realimentação de saída (output-feedback sliding mode (OFSM) control) para sistemas incertos com grau relativo arbitrário vêm sendo propostas na literatura de controle (Yu & Xu, 2002; Edwards et al., 2006; Sabanovic et al., 2004; Hsu et al., 2002; Hsu et al., 2006). Dentre essas estratégias, destacam-se aquelas que utilizam HGOs (Oh & Khalil, 1997; Cunha et al., 2009) no projeto de controle. Outras abordagens baseadas no controle por modos deslizantes de alta ordem (higher order sliding mode -HOSM) conseguem atingir rastreamento exato através dos bem conhecidos diferenciadores robustos e exatos (robust exact differentiators - RED) de Levant (2003). Contudo, propriedades de estabilidade e/ou convergência desses esquemas de controle são garantidas apenas localmente. Como discutido na introdução deste artigo, a maioria das estratégias baseadas em OFSM obtém resultados globais apenas sob severas hipóteses tais como campos vetoriais limitados linearmente ou uniformemente limitados (Hsu et al., 2002; Hsu et al., 2006; Cunha et al., 2009).

Plantas não-lineares mais gerais foram tratadas em (Hsu et al., 2006; Oh & Khalil, 1997; Esfandiari & Khalil, 1992; Oliveira et al., 2007; Oliveira et al., 2010a), entretanto apenas rastreamento semi-global pôde ser concluído. Isto não é surpreendente visto que, como mostrado em (Mazenc et al., 1994), para sistemas com não-linearidades polinomiais nos estados não-medidos, o problema de estabilização ou rastreamento global via realimentação de saída pode não ter solução. Além do controle por modos deslizantes, muitas outras abordagens para solucionar este problema foram propostos baseados em backstepping, HGOs com ganho variável (Praly, 2001; Krishnamurthy et al., 2002; Krishnamurthy et al., 2003; Lei & Lin, 2005; Ahrens & Khalil, 2007), homogeneidade (Andrieu et al., 2007; Andrieu et al., 2009) ou algum tipo de adaptação (Marino & Tomei, 1995). Contudo, nenhum resultado global foi apresentado para a classe de sistemas considerada no presente artigo no domínio de OFSM, onde a robustez e a possibilidade de obter excelentes respostas transitórias são vantagens reconhecidas e importantes.

Acredita-se que a classe de sistemas abordada aqui está no estado da arte do controle por realimentação de saída com resultados globais comumente considerada por outros autores (Praly, 2001; Lei & Lin, 2005; Andrieu et al., 2007; Andrieu et al., 2009; Praly & Jiang, 2004; Kaliora et al., 2006). Nós tratamos de plantas não-lineares variantes no tempo, de fase mínima, afins no controle, transformáveis para a forma normal e para as quais é possível implementar um observador da norma do estado. Essa classe inclui sistemas nas formas output-feedback e parametric strict feedback, sistemas triangulares com condição de crescimento linear no estado nãomedido e taxa de crescimento possivelmente dependente de estados da dinâmica interna, da saída e do tempo. Não-linearidades polinomiais nos estados não-medidos da dinâmica interna e da saída da planta são também permitidas.

Neste artigo, nós estendemos a aplicabilidade dos resultados utilizando HGO com ganho dinâmico originalmente propostos por Peixoto et al. (2007), e anteriormente restritos a sistemas com crescimento linear nos estados não-medidos e taxa de crescimento constante e conhecida, para uma classe mais ampla de nãolinearidades. O resultado principal é mostrar que o controle por OFSM baseado em um HGO com ganho dinâmico pode também ser usado para a classe no estado da arte de sistemas não-lineares, garantindo rastreamento global e prático. Para obter este novo resultado, a principal modificação com relação ao esquema proposto em Peixoto et al. (2007) reside na capacidade de se obter um majorante para a norma do estado da classe de sistemas não-lineares mais geral considerada neste trabalho, por meio de uma nova formulação de um estima-dor para a norma do estado. Isto permite desenvolver uma novo projeto para o ganho variante no tempo do HGO. Note que, diferentemente da maioria dos esquemas existentes, o ganho do HGO não é atualizado através da solução da equação de Riccati (Praly, 2001; Andrieu et al., 2007; Kaliora et al., 2006) mas, ao contrário, nós utilizamos funções simples (e.g., polinomiais) baseadas em sinais medidos, além de técnicas de majoraçãodominação (domination) (Lei & Lin, 2005; Andrieu et al., 2007; Andrieu et al., 2009). Aparentemente, esse é o primeiro trabalho a conseguir esses resultados em OFSM para a classe de plantas aqui considerada.

Uma desvantagem das estratégias de controle baseadas em HGO é o fenômeno de peaking (Sussmann & Kokotović, 1991), que pode degradar o desempenho do sistema ou mesmo levar à instabilidade. Técnicas para se evitar o peaking através de saturação do sinal de controle já haviam sido propostas em (Oh & Khalil, 1997; Esfandiari & Khalil, 1992), porém essa abordagem leva apenas a resultados locais ou semi-globais. Aqui, seguindo (Cunha et al., 2009), o peaking no sinal de controle é evitado utilizando-se sinais medidos que não são baseados em alto ganho para gerar a magnitude da lei de controle por modos deslizantes. As estimativas do HGO são utilizadas apenas para formar a superfície de deslizamento. Desta forma, um eventual peaking (Sussmann & Kokotović, 1991) na variável de deslizamento é bloqueado pela convencional função sinal utilizada para implementar o sinal de controle por modos deslizantes, visto que a magnitude do sinal de controle é função apenas de sinais disponíveis bem condicionados (sem peaking ).

Estabilidade global com respeito a um conjunto compacto e convergência exponencial para um conjunto residual pequeno no espaço de estado do erro são provadas. Exemplos acadêmicos ilustram a classe de sistemas e o comportamento dinâmico do ganho do HGO.

2 PRELIMINARES

As seguintes notações e terminologia serão utilizadas ao longo do texto:

  • A norma-2 (Euclidiana) de um vetor x = [x1x2 ··· xn]Te a correspondente norma induzida de uma matriz A são denotadas por |x| e |A|, respectivamente. O símbolo λ[A] denota o espectro de A e λm[A]= – maxi{Re{λ[A]}}.

  • A norma

    e de um sinal x(t)né definida como ║xt║ :=sup0 < t < t |x(t)|.

  • Funções classe e são definidas de acordo com (Khalil, 2002, p. 144). ISS, OSS e IOSS significam Input-State-Stable (ou Stability), Output-State-Stable (ou Stability) e Input-Output-State-Stable, respectivamente (Sontag & Wang, 1995).

  • (i) α denota funções classe-; (ii) β denota funções classe-; (iii) π denota funções classe-; (iv) Ψ denota funções classe- conhecidas; (v) φ e denotam funções não-negativas conhecidas.

Considere sistemas não-lineares SISO da forma

onde u é a entrada de controle (descontínua), y é a saída medida, x é o estado e as funções incertas f(·, ·),g(·, ·) e h(·, ·) são suficientemente suaves para garantir existência local e unicidade de solução a partir de qualquer condição inicial (x0,t0). Para cada solução de (1) existe um intervalo de tempo máximo de definição dado por [0,tM ), onde tM pode ser finito ou infinito.

Portanto, o escape em tempo finito não pode ser excluído a priori. A definição de solução de Filippov é adotada (Filippov, 1964), assim como o conceito de controle equivalente estendido (Hsu et al., 2002, Section 2.3). Denota-se o sinal de controle equivalente (contínuo por partes) simplesmente por u(t).

Nossa estratégia de realimentação de saída conta com a implementação de um observador ou estimador da norma do estado da planta x. Na definição a seguir:

(i) seja u a entrada da planta;

(ii) y é a saída da planta;

(iii) γ0 é uma função suave;

(iv) φ0(·, ·,t)e 0(·,t) são funções não-negativas, contínuas por partes e limitadas em t (como definido em (Kaliora et al., 2006)), além de serem contínuas em seus outros argumentos.

Definição 1 Um observador da norma para o sistema (1)–(2) é um sistema dinâmico de ordem-m da forma:

com estados ω1, ω2m–1 e constantes positivas φ1,φ2 tais que para τ ∈ [0,τM ):

(i) se |φ0| é uniformemente limitada por uma constante co > 0, então |ω2| pode escapar no máximo exponencialmente e existe (Co) tal que a dinâmica ω2 é BIBS (Bounded-Input-Bounded-State) estável w.r.t. φo para τ2;

(ii) para cada x(0), ω1(0), ω2(0), existe 0 tal que

onde πo := β0(|ω1(0)| + |ω2(0)| + |x(0)|)e-λOT com βo e constante positiva λo.

3 FORMULAÇÃO DO PROBLEMA

Considera-se o problema de rastreamento global de sistemas da forma (1)–(2) transformáveis para a forma normal (Khalil, 2002):

onde o estado transformado é definido como

O subsistema-η representa a dinâmica interna com η ∈

n–pe o estado da dinâmica externa (ξ) é dado por

O par (Ap, bp) está na forma canônica de Brunovsky, i.e,

e cp =[1 0 ··· 0], além disso, d(x, t) é considerada como uma perturbação não-linear casada e kp(x, t) é o ganho de alta frequência (high frequency gain - HFG) da planta assumido não-nulo. Note que é assumido, portanto, que a planta (1)–(2) tem um grau relativo ρ forte1 1 Esta terminologia é utilizada em (Diao & Passino, 2001), onde a dependência do tempo é considerada na então chamada"derivada de Lie modificada". .

Na seguinte hipótese, formula-se as restrições impostas sobre T (x, t), kp(x, t)e d(x, t), onde a dependência em y = h(x, t) é explicitamente dada a fim de obtermos majorantes menos conservadores. Antes de tudo, para i =1, 2, 3, sejam:

(a) φi (|x|, y, t) funções não-negativas, crescentes e contínuas em |x|, contínuas em y, limitadas (majoradas) e contínuas por partes em t;

(b)

i(y, t) funções não-negativas contínuas em y e limitadas e contínuas por partes em t;

(c) αi(|x|) funções classe-localmente Lipschitz.

Hipótese 1 Existem funções conhecidas φi, i , αi e uma constante positiva conhecida cp tais que as seguintes desigualdades são verificadas ∀x,y , ∀t ∈ [0,tM ):

onde φi satisfaz φi (|x|, y, t) < αi(|x|)+ i(y, t), βT é alguma função classe- e γT é uma função escalar não-negativa e contínua em y e contínua por partes e uniformemente limitada em t.

O limitante inferior para |T| assegura que se estiver limitado, então x também estará e o limitante inferior para kp garante que ele é positivo (sem perda de generalidade)2 2 O caso com sgn(kp) desconhecido (direção de controle desconhecida) poderia ser considerado utilizando-se a generalização da técnica de funções de monitoração para grau relativo arbitrário introduzida em (Oliveira et al., 2007). . Por outro lado, as funções que limitam superiormente ou majoram T, kp e d são utilizadas para obtermos limitantes em norma implementáveis para ξ, kp e d a partir do vetor de estado ω do observador da norma (3)–(4). Vale ressaltar que a transformação T (x, t) não é utilizada para obter ω. De modo geral, os majorantes dados na Hipótese 1 impõem restrições significativas apenas com respeito a dependência no tempo, visto que f(x, t), g(x, t) e h(x, t) são suficientemente suaves (por hipótese) para que T, kp e d sejam contínuos em x.

Observação 1 (Forma Normal) Para plantas invariantes no tempo, a hipótese de grau relativo uniforme (Khalil, 2002; Isidori, 1995) é uma condição necessária e suficiente para a existência de uma mudança de coordenadas local (difeomorfismo local) que transforma (1)–(2) em (6)–(7). Aqui, não é requerido que o mapeamento T (x, t) (8) seja invertível, mas somente uma transformação global. Uma condição suficiente para assegurar que a planta variante no tempo (1)–(2) seja transformável na forma normal é dada no Apêndice AApêndice A + para (+βA fim de considerar explicitamente a dependência do tempo de f(x, t) em (1), seja: βk := Lf βk–1 + + para K ∈ {1,...,p} e β0 := 0. Uma condição suficiente para garantir que a planta variante no tempo (1)–(2) é transformável para a forma normal é dada por: Lg[h + βk] ≡ 0 (k ∈ {0,...,p – 2}), onde a derivada de Lie de uma função h ao longo de um campo vetorial f é denotada por Lf h, como em (Khalil, 2002, pp. 510). Neste caso, a transformação T (x, t)=[ηT (x, t)] é tal que Tξ := [h+β0, Lf h+β1, ... h+βp–1]T. Adicionalmente, o HFG da planta kp(x, t)= Lg[h+βp–1], a perturbação de entrada d(x, t)=(+βp) / kp T devem satisfazer a Hipótese 1. .

Adicionalmente, assume-se que:

Hipótese 2 (Fase Mínima) Existe uma função de armazenamento V (η) satisfazendo β(|η|) < V (η) < (|η|) com β, , tal que:

x, y , ∀t ∈ [0,tM ), para algum β0∈ K e alguma função escalar não-negativa φ0 (|ξ|,t), contínua em |e| e contínua por partes e limitada em t.

A Hipótese 2 garante que a dinâmica interna (6) tem uma propriedade semelhante

a ISS com respeito a uma função apropriada de ξ e t. Por essa razão, isso corresponde à uma generalização do conceito de plantas de fase mínima e possibilita concluirmos que se ξ estiver uniformemente limitado, então η também estará.

Hipótese 3 (Observabilidade da Norma) A planta (1)–(2) admite um observador da norma (Definição 1) para funções γ0, φ0, 0 conhecidas e constantes τ1, τ2 > 0.

E bem conhecido da literatura que, no caso invariante no tempo, se a planta (1)–(2) for IOSS (Sontag & Wang, 1997) então ela admite um observador da norma de acordo com a Hipótese 3. Na Seção 8, apresenta-se uma classe mais geral de plantas não-lineares e variantes no tempo para a qual é possível encontrarmos um observador da norma como (3)–(4). Tal classe engloba plantas com condição de crescimento linear nos estados nãomedidos e taxa de crescimento possivelmente dependente de η, y e t. E importante salientar que não-linearidades fortes (polinomiais) em η e y são permitidas.

3.1 Problema de Rastreamento Global

O objetivo é encontrar uma lei de controle dinâmica u via realimentação de saída para levar o erro de rastreamento ou de saída

exponencialmente para zero ou alguma vizinhança pequena de zero (rastreamento prático), partindo-se de quaisquer condições iniciais da planta e do controlador e mantendo todos os sinais da malha-fechada limitados uniformemente, apesar das incertezas do sistema. A trajetória desejada ym(t) é assumida ser gerada pelo seguinte modelo de referência:

onde em é constante, Kmp é tal que Am seja Hurwitz e r(t) é assumida contínua por partes e uniformemente limitada.

3.2 Do Rastreamento para a Regulação

Subtraindo (12) de (7) tem-se

onde ξe := ξ – ξm é o estado do erro de rastreamento, = [1 0 ··· 0] (então e = ξ1 - ξm1 = y – ym) e a perturbação equivalente de entrada de é definida por

O problema de rastreamento pode ser formulado como um problema de regulação que consiste em encontrar uma lei de controle por modos deslizantes via realimentação de saída (OFSM) u tal que e seja regulado globalmente para uma vizinhança de zero (rastreamento prático). Note que, projetar u apenas para assegurar a convergência de e para uma vizinhança de zero não garante que os sinais em malha fechada estejam uniformemente limitados. O problema de rastreamento prático é projetar u (OFSM) de tal forma que, para quaisquer condições x(0),ω1(0),ω2(0): (i) as soluções de (3), (4), (6) e (7) sejam uniformemente limitadas e (ii) a saída e = ξ1 – ξm1 de (13), i.e., o erro de rastreamento (11), tenda para uma vizinhança de zero quando t → ∞.

3.3 Limitantes Auxiliares via Observador da Norma

Os seguintes majorantes para ξ, kp e d são obtidos, a menos de termos exponencialmente decrescentes, a partir das funções limitantes dadas na Hipótese 1 e do observador da norma formulado na Definição 1:

onde ψi(ω, t) := φi(20, y, t)+ i(y, t)(i =1, 2, 3) e π = β1 (|ω(0)| + |x(0)|)e–λot com algum β1 e λ0 na Definição 1 (detalhes no Apêndice CApêndice C). Assim, com cp definido na Hipótese 1 e a partir de (14) pode-se verificar que |de|<|d|+(|Km||ξ|+km|r|)/cp. Além disso, de (15) e (17), a seguinte desigualdade se verifica:

onde δ é uma constante não-negativa arbitrária,

e π2 := |Km1/cp + π1.

4 LEI DE CONTROLE POR MODOS DESLIZANTES E REALIMENTAçÃO DE SAIDA

Quando apenas y está disponível para realimentação, pode-se escolher

como a superfície de deslizamento, onde S é tal que (Am,bp,S) é estritamente real positivo (strictly positive real -SPR) e é uma estimativa de ξ (9) fornecida pelo HGO. A lei de controle u é dada por

Assim, definindo o erro de estimação como

o seguinte lema pode ser enunciado.

Lema 1 (Propriedade ISS de || para ξe) Considere a dinâmica que governa ξe em (13) com saída = Sξe –S, u dado em (21), em (19) e de em (14). Então, (13) é ISS com respeito a e˜e e a seguinte desigualdade se verifica

sendo πe := βe(|ω(0)| + |x(0)| + |ξe(0)|)e-λet, βe, 0 < λe < min{λm[Am],λ0}, λ0 dada na Definição 1 e ke > 0 uma constante apropriada.

Prova: Ver Apêndice

Nosso objetivo é fornecer uma estimativa por meio de um HGO tal que a norma do erro de observação |(t)| seja arbitrariamente pequena e utilizar o Lema 1 para concluir o rastreamento prático e global. Como demonstrado em (Peixoto, 2007), um HGO com ganho constante não é capaz de atender de forma global o objetivo traçado para uma classe geral de plantas nãolineares e desta forma, seguindo a filosofia apresentada em (Peixoto et al., 2007), nós iremos adotar um HGO com ganho variável para atingirmos o rastreamento global.

Um eventual peaking (Sussmann & Kokotović, 1991) em é bloqueado pela função sgn(·) em (21) e o sinal de controle u é livre de peaking visto que (ω, t) é implementado utilizando-se apenas sinais disponíveis bem condicionados (sem peaking). O esquema proposto é representado na Fig. 1.


5 OBSERVADOR DE ALTO GANHO (HGO) COM GANHO VARIÁVEL

O HGO é dado por

onde Lo e Hµ são dados por

O ganho do observador Lo é tal que sp+l1sp-1+...+ lp é Hurwitz. Neste artigo, ao invés de usarmos um parâmetro µ constante, introduzimos um parâmetro µ = µ(t) ≠ 0, ∀t ∈ [0,tM ) variável, da forma

onde ψµ, chamada função de dominação, é uma função não-negativa (a ser definida) contínua em seus argumentos e >0 é uma constante de projeto.

Para cada trajetória do sistema, µ é absolutamente contínua e µ < . Note que µ é limitada para t em qualquer sub-intervalo finito de [0,tM ). Portanto,

para algum t*∈ [0,tM ) e µ ∈ (0,).

Conside a planta SISO não-linear (1)–(2) transformável na forma normal (6)–(7) sob as Hipóteses 1–3, lei de controle (21), com ∂ dado por (19) e observador de alto ganho (23) com µ sendo dado por (25) e função de dominação apropriada ψ. Então, para constantes τ2 > 0 suficientemente pequenas, são garantidas estabilidade assintótica global (global asymptotic stability GAS) do sistema do erro com respeito a um conjunto compacto e convergência exponencial do estado do sistema do erro para um conjunto residual de ordem , com ambos os conjuntos sendo independentes das condições iniciais do sistema. Além disso, todos os sinais do sistema em malha fechada são uniformemente limitados. A análise de estabilidade detalhada e o enunciado formal do resultado principal (Teorema 1) serão apresentados posteriormente na Seção 6.

5.1 Dinâmica do Erro de Observação

A transformação (Cunha et al., 2009; Oh & Khalil, 1997)

é fundamental para representar a dinâmica de em um sistema de coordenadas conveniente que nos permite mostrar que fica arbitrariamente pequeno, a menos de termos exponencialmente decrescentes. Primeiro, a partir de (10), (24) e (27), note que:

onde

Ao :=Ap –Locp e Δ:=diag(1 – p, 2 – p, . . . , 0) .

Em seguida, subtraindo-se (23) de (7) e aplicando-se as relações acima, a dinâmica de (22) na nova coordenada ζ (27) é dada por:

5.2 Projeto da Função de Dominação

O ganho do HGO é inversamente proporcional ao pequeno parâmetro µ, e é permitido ser variante no tempo a fim de garantir o rastreamento global. Nesta seção, nossa tarefa é estabelecer as propriedades que a função e dominação ψµ(ω, t) em (25) deve possuir para que µ|υ| e || sejam suficientemente pequenas, ao menos após um um intervalo de tempo finito. Consequentemente, após um tempo finito, não afeta a estabilidade de Ao em (31) e ζ ou podem ser feitos arbitrariamente pequenos, a menos de termos exponencialmente decrescentes.

5.2.1 Limitantes Superiores Auxiliares

Note que, a partir de (21), tem-se |µ(t)|< ( ω, t). Assim, a partir dos limitantes superiores (16) e (17), o sinal υ (32) satisfaz

onde ψυ := ψ2 + + + ψ2ψ3 + + é conhecido e π3 := . Então, de (25) e (33), pode-se escrever

Com o intuito de desenvolver um majorante para ||, nós precisaremos de um limitante superior para ||. A partir de (9), tem-se ||<|ξ| e, de (15), pode-se verificar que ||< ψ1(ω, t)+ π1. Além disso, da Definição 1 e de (21), 1 e 2 satisfazem τ1|1|<|1| + (ω, t) e τ2|2|<|γo2)| + τ2o|, respectivamente. Portanto, pode-se concluir que

onde ψω(ω, t) := ψ1 + |ω1|/τ1 + /τ1 + |γo|/τ2 + |φo| é conhecido. Finalmente, multiplicando-se (25) e (35), conseguimos

5.2.2 Propriedades da Função de Dominação

Nós começamos escolhendo a função de dominação ψµ em (25) para que as seguintes propriedades sejam satisfeitas com ψυ em (33) e ψω em (35):

(P0)ψυ<cµ0(1 + ψµ) and ψω<cµ0(1 + ψµ), ∀t ∈ [0,tM ), sendo cµ0> 0 uma constante conhecida.

Se ψµ satisfaz (P0) então, a partir de 34) e (36), µ|υ| e µ|| podem ser limitadas por

A fim de obtermos um majorante para ||, pode ser calculado diferenciando-se (25):

Note que, é um sinal contínuo por partes que pode ser limitado superiormente por

Nossa estratégia é projetar ψµ(ω, t) tal que a seguinte propriedade adicional seja satisfeita:

(P1) || < cµ1 (1+ψµ) and || < cµ1 (1+ψµ), ∀t ∈ [0,tM ), sendo cµ1> 0 uma constante conhecida.

Essa propriedade é trivialmente satisfeita por uma função polinomial ψµ com coeficientes positivos (vide Seção 5.2.3).

Agora, com ψµ satisfazendo (P1), tem-se que:

Consequentemente, de (41), (37) e (38) a seguinte desigualdade pode ser obtida:

onde π4 := cµ1π1 + π3.

Note que, a partir de (5) e da Hipótese 1, se qualquer sinal do sistema em malha fechada escapa em tempo finito, então ω também escapa. Realmente, de acordo com a Hipótese 3, o sistema goza da propriedade denominada unboundedness observability (UO) (Angeli & Sontag, 1999). Nós usaremos este fato para projetar ψµ(ω, t) de modo que se ω escapa em algum tempo finito então ψµ(ω, t) também escapa não posteriormente a este instante. A partir de (25), isso irá garantir que o segundo termo no lado direito de (42) será de ordem (), antes de qualquer eventual escape em tempo finito.

Com essa finalidade, ψµ deve ser projetado para satisfazer a propriedade:

(P2)ωte-λµtψµ (ω, t), ∀ω, ∀t ∈ [0,tM ), sendo λµ uma constante positiva de projeto.

O termo exponencial com taxa λµ atua como um fator de esquecimento que permite um projeto para ψµ menos conservador. Relembrando que π4 pode ser escrito como π4 = β4 (|ω(0)| + |x(0)|)e-λ4t, com β4 e λ4 sendo uma constante positiva, então, se ψµ satisfaz (P2), a seguinte relação pode ser obtida

t ∈ [0,tM ). Pode-se mostrar que (vide Section C) o lado direito de (43) é majorado por , ao menos após algum tempo finito (tµ> 0). Finalmente, se ψµ é projetado para que (P0)–(P2)

com algum β5. Para compreender que (44) e (45) são satisfeitas, veja o Apêndice CApêndice C.

5.2.3 Um Projeto Específico para o Ganho Dinâmico

A hipótese a seguir é útil para determinar ao menos uma classe específica de µ's variantes no tempo, satisfazendo as propriedades listadas acima.

Hipótese 4 Existe um polinômio µ (|ω|) em |ω|, com coeficientes reais positivos, tal que as funções φo,o (Hipótese 3) e as funções limitantes φi,i (Hipótese 1) satisfazem (i =1, 2, 3):

Agora, relembrando que ψυ (ω, t) em (33) e ψω (ω, t) em (35) são dadas por ψυ (ω, t)= ψ2 + + + ψ2ψ3 + + e ψω(ω, t)= ψ1 + |ω1|/τ1 + 1 + |γo|/τ2 + |φo|, respectivamente, onde ψi = φi (2 , y, t)+ i (y, t)(i = 1, 2, 3) em (15)–(17). Então, com a Hipótese 4, pode-se facilmente obter um polinômio pµ(|ω|) em |ω|, com coeficiente reais positivos, tal que:

Aqui, nós escolhemos ψυ como:

onde λµ > 0 é uma constante de projeto. Não é difícil verificar que (47) satisfaz (P0) e (P2). Para compreender como (P1) também é satisfeita, veja o Apêndice CApêndice C.

De acordo com a Hipótese 4, assume-se a existência de um mesmo polinômio como função de majoração para as funções φo,oi e i, o que pode ser conservador no sentido de se obter valores muito conservadores de pµ e, consequentemente, valores muito pequenos para µ(t). Vale ressaltar que essa hipótese não é tão restritiva visto que apenas condições de crescimento polinomial são impostas à φo, o, γo, φi, i.

6 ANÁLISE DE ESTABILIDADE E RESULTADOS PRINCIPAIS

A fim de considerar todas as condições iniciais de todos os sinais envolvidos no sistema do erro (13) e (31), seja:

na qual Z0 (0) := [ηT(0) ωT(0)] e λ > 0 é uma constante genérica. A análise de estabilidade do controlador em malha fechada é conduzida no Apêndice DApêndice DIntroduzindo a transformação de coordenadas e = Tnξe, com ξn :=[ I ST ]T, o sistema (13) pode ser levado para a forma normal. Logo, pode-se concluir que (13) é OSS com respeito à saída de grau relativo unitário Sξ, ou seja, ξe e e satisfazem através dos seguintes passos:

Passo-1 Primeiramente, nós demonstramos que |z(t)| é uniformemente limitado por uma função classe- de |Z(0)|, ∀t ∈ [0,tµ).

Passo-2 Depois, para t ∈ [tµ,tM ) nós provamos que a norma do erro de observação é limitada por |(t)| < βz1 (|Z(0)|)e-λz1t + (), onde λz1 > 0 é uma constante e βz1, desde que seja escolhido suficientemente pequeno e (P0)–(P1) sejam satisfeitas.

Passo-3 Aplicando-se o Lema 1, pode-se também verificar que |ξe| , |z(t)| < βz2 (|z(0)|)e-λz2t + (), onde λz2 > 0 é uma constante e βz2. Além disso, z(t) não pode escapar em tempo finito.

Passo-4 Finalmente, verifica-se que nenhum sinal da malha fechada pode escapar em tempo finito e que são uniformemente limitados ∀t, contanto que τ2 (na Definição 1) seja escolhido suficientemente pequeno.

O seguinte teorema resume o resultado principal.

Teorema 1 Considere a planta não-linear SISO (1)–(2) transformável na forma normal (6)–(7) sob as Hipóteses 1–3. Seja a lei de controle dada por (21), com em (19) e considere o observador de alto ganho (23) com µ dado por (25) e a função de dominação ψµ projetada tal que as propriedades (P0)–(P2) sejam verificadas. Então, para constantes τ2, > 0 suficientemente pequenas, existem βz(·) ∈ e constantes positivas a, b tais que o estado completo do erro z (48) satisfaz

t > 0 e ∀z(0), i.e., GAS uniforme do sistema do erro com respeito ao conjunto compacto {z : |z| < b} e convergência exponencial de z(t) para um conjunto residual de ordem () são garantidas, com ambos os conjuntos sendo independentes das condições iniciais. Além disso, todos os sinais do sistema em malha fechada são uniformemente limitados.

Prova: Ver Apêndice DApêndice DIntroduzindo a transformação de coordenadas e = Tnξe, com ξn :=[ I ST ]T, o sistema (13) pode ser levado para a forma normal. Logo, pode-se concluir que (13) é OSS com respeito à saída de grau relativo unitário Sξ, ou seja, ξe e e satisfazem .

O fenômeno de chattering de frequência finita (Edwards & Spurgeon, 1998) é evitado e um modo deslizante ideal é produzido graças a uma malha de deslizamento ideal formada em torno da função relé (vide Fig. 1), de acordo com o seguinte corolário.

Corolário 1 (Modo Deslizante Ideal)

Adicionalmente as hipóteses do Teorema 1, se

> |Km||ξm| + |km||r| + δ com δ > 0, então o modo deslizante = 0 é alcançado em tempo finito.

Prova: Ver Apêndice DApêndice DIntroduzindo a transformação de coordenadas e = Tnξe, com ξn :=[ I ST ]T, o sistema (13) pode ser levado para a forma normal. Logo, pode-se concluir que (13) é OSS com respeito à saída de grau relativo unitário Sξ, ou seja, ξe e e satisfazem .

Observação 2 (Chattering no Controle)

A importância da existência do modo deslizante ideal já foi discutida em vários trabalhos, e.g., (Utkin, 1992; Bondarev et al., 1985; Hsu, 1997). Isto se deve porque, na ausência de ruído, a frequência do chattering pode ser arbitrariamente aumentada reduzindo-se o período de amostragem na implementação digital em tempo real do esquema de controle. Em muitas aplicações, como em conversores ou acionamentos elétricos, o chattering com frequência suficientemente alta é aceitável e preserva as vantagens do controle por modos deslizantes. Ao contrário, quando filtros diferenciadores causais lineares são utilizados para reconstruir os estados requeridos na função de chaveamento , pequenos e inevitáveis atrasos são introduzidos na malha de alta frequência e isso geralmente leva ao chattering com frequência limitada, independentemente do período de amostragem, o que deteriora o desempenho do controle por modos deslizantes.

Observação 3 (Ausência de Peaking) Pode-se concluir que ξe é livre de peaking notando-se que (13) é ISS com respeito a u e que a função sgn(·) em u (21) bloqueia qualquer eventual peaking presente em para u.

7 ALGORITMO DO CONTROLADOR

O projeto completo do controlador é resumido na Tabela 1. Os parâmetros de projeto podem ser obtidos como a seguir.

Primeiramente, nós projetamos o observador da norma para a o estado da planta x, de acordo com a Definição 1, e transformamos o sistema original para a forma normal. A partir da funções limitantes o, φi, i (i =1, 2, 3), dadas nas Hipóteses 1–3, obtém-se: as funções ψi, a função de modulação (ganho de controle) (19) e as funções limitantes ψω e ψυ .

Depois, projeta-se a função de dominação ψµ satisfazendo as propriedades (P0)–(P2). A constante λµ > 0 é arbitrária e Lo é tal que sp+l1sp-1+...+lβ seja Hurwitz. O HGO pode ser implementado a partir de (23). Assim, a lei de controle (21) é implementada com superfície de deslizamento (20) escolhida para que (Am,bp,S) seja SPR.

A partir das funções φoo e da constante τ1 dada na Hipótese 3, implementa-se o observador da norma. Finalmente, por simulação, nós iniciamos o algoritmo com valores não tão pequenos de , τ2 e depois diminuímos até que um rastreamento aceitável seja obtido. Posteriormente, nós diminuímos τ2 a fim de assegurar que ω2 seja limitado (vide Definição 1). Note que a análise de estabilidade (Teorema 1) assegura a existência de e τ2 suficientemente pequenos para se obter rastreamento aceitável e todos os sinais em malha fechada limitados uniformemente, independentemente das condições iniciais. Entretanto, vale ressaltar que uma determinada sintonia de , τ2 pode ser válida apenas para as condições iniciais utilizadas no procedimento de sintonia descrito.

O projeto da função de modulação pode ser conservador no sentido de gerar amplitudes elevadas do sinal de controle, podendo eventualmente saturar o atuador durante um transitório em um experimento real. Além disso, valores muito pequenos de e τ2 pode inviabilizar a implementação digital do HGO e do estimador da norma, respectivamente. Por outro lado, de acordo com o Teorema 1, o erro de rastreamento converge para um conjunto residual de ordem () uma vez escolhidos valores de e τ2 suficientemente pequenos e uma função de modulação apropriada. Portanto, fica evidente os impactos do conservadorismo sobre o rastreamento.

8 UMA CLASSE ILUSTRATIVA DE PLANTAS NÃO-LINEARES

Nós podemos controlar plantas (1)–(2) da forma

transformáveis para a forma normal (vide Observação 1) satisfazendo a Hipótese 1. O estado x é particionado em xT:= [ ηT υ], com υ ∈ p ,e kµ > 0 sendo uma constante. Note que esse sistema não está nem na forma triangular nem é invariante no tempo como em (Praly & Jiang, 2004).

Agora, nós formularemos condições suficientes para ΦT = [Φ1 ... Φp] tais que (50)–(51) satisfaça a hipótese de fase mínima (Hipótese 2) e a hipótese sobre a existência de um observador da norma (Hipótese 3).

Assim como em (Qian & Lin, 2002; Praly & Jiang, 2004; Choi & Lim, 2005), considera-se que:

(C0) (Condição de Triangularidade) Para i =1,..., ρ:

|Φi| < φr(|η|, y, t)(|υ1| + ... + |υi|)+ φυ(|η|, y, t) ,

t ∈ [0,tM ), onde r, υ são funções conhecidas nãonegativas, contínuas em y e contínuas por partes e limitadas em t satisfazendo φr(|η|, y, t) < Ψr(|η|)+ r(y, t) e φυ(|η|, y, t) < Ψυ(|η|)+ υ(y, t) com funções Ψr, Ψυlocalmente Lipschitz também conhecidas.

Para o subsistema η, nós admitimos que pode-se obter uma função de armazenamento V (η) satisfazendo α (|η|) < V (η) < (|η|), com α (σ) = λσ2, (σ) = σ2 e λ, λ conhecidos de modo que a seguinte condição é verificada.

(C1) Existem funções conhecidas não-negativas φη(y, t), contínuas em y, contínuas por partes e limitadas em t e um α ∈ também conhecido tal que ∀t ∈ [0,tM ):

onde a função classe-α o -1 é stiffening3 3 Assim como em (Arcak et al., 2002), nós dizemos que α 1 (σ) é stiffening se para todo λ > 0, existe ε > 0 tal que σ > ε ⇒ α 1 (σ) > λ σ. Uma condição menos conservadora sobre α o -1 tal qual a condição ULLB (ultimately linearly lower bounded) introduzida em (Oliveira et al., 2010b; Oliveira et al., 2009) poderia ser utilizada ao invés da restrição stiffening. 4 Para evitarmos a derivada de Dini, poderíamos ter utilizado a relação ab : a 2 + b 2, válida 'a,b > 0, à custa de algum conservadorismo. no intervalo (0, ∞).

Note que, (C1) implica na Hipótese 2. Além disso, (C0) e (C1) nos permitem implementar o seguinte observador da norma de 3ªordem para x:

que está em concordância com a Definição 1. A dinâmica de ω21 fornece um majorante para |η|, enquanto que a dinâmica de ω22 provê um majorante para |υ|, de modo que:

sendo c0, c1, c2 constantes não-negativas, π := β0(|ω(0)| + |x(0)|)e–λot e τ12o constantes positivas de projeto. No Apêndice BApêndice BA partir de (C1), a função α1 é stiffening. Isso garante que α1(σ) > λσ, ∀σ > ε, para qualquer ε > 0 e 0 < λ < α1 (ε) / ε. Além disso, de (52), pode-se escrever < –α1(V)+ φη(y, t) ou, equivalentemente, ˙< –λV +[λV – α1(V)] + φη(y, t). Agora, dado qualquer V , ou V < ε ou V > ε. Consequentemente, ou ˙< –λV +[λε + α1(ε)] + φη ou ˙< – λV + φη, o que nos faz concluir que V˙< – λV +[λε+α1(ε)]+φη. Portanto, usando o Teorema da Comparação (Khalil, 2002), obtém-se , são dados os passos necessários para obtermos as funções φ12, φ3 e φ4 do observador da norma. A seguir, ilustra-se a classe de sistemas através de um exemplo acadêmico não-trivial.

Exemplo 1 (Classe de Sistemas) Considere a seguinte planta não-linear de 4ª ordem e grau relativo ρ = 3:

. O termo cruzado

No próximo exemplo, nós focamos apenas em observar o comportamento variante no tempo de µ(t).

Exemplo 2 (Comportamento do Parâmetro µ)

Considere o caso simples, sem dinâmica dos zeros e grau relativo dois (ρ=2), onde (50)–(51) é reduzido para:

A planta já está na forma normal (6)–(7) (com T = I), na qual ξ = x, kp = ku e kpd = – δ1ξ2 + δ2y2 + δ3 sen(2πδ4t). A Hipótese 1 é satisfeita com: φ1 = γT = 1 = 1, α1 = βT = 0, cp = 1, φ2 = 2 = 2, α2 = 0, α3 =3|x|, 3 =3y2 +2 e α3 = α3 + 3.

Os parâmetros incertos são: 1 < ku < 2, 1 < δ1 ,δ2 < 3,0.5 < δ3 < 2 e 8 < δ4 < 10. Os parâmetros reais da planta, assumidos desconhecidos, são ku = 2, δ1 = 2, δ2 =1, δ3 =0.7e δ4 =10.

Naturalmente, a Hipótese 2 (e (C1)) são inexistentes neste caso. Além disso, visto que δ1 > 0, não é difícil verificar que a Hipótese 3 é satisfeita com o observador da norma de 2ªordem da Tabela 1, sendo: τ1 = τ2 = 1, γo = –ω2, φo =8|ω1| +3y2 +2 e o =2|ω1| + |ω2| + |y|. Note que, como υ1 = y é medido, apenas um limitante para a norma de υ2 = y˙é necessário.

Na Tabela 1, o par (Ap,bp) está na forma canônica de Brunovsky (com p = 2) e a trajetória desejada ym é gerada com km = 4, Am = Ap + bpKm, Km =[ –4 –2] e r = sgn(sen(0.5πt)). As funções de modulação e dominação são dadas por = 15|ω1| +7.4|ω2| +4.4|y| + 3y2 +4|r| +2.1 e ψµ = 56|ω1|+28|ω2| +13|y| +15y2 +22, respectivamente. Além disso, o HGO e a superfície de deslizamento são implementados com l1 = 2, l2 =1e S =[ 2 1].

Para y(0) =0 e (0) = 0, com um constante e grande valor de µ(t)= =1, uma aparente degradação na precisão do rastreamento em malha fechada (y nem mesmo converge para ym) é observado na Fig. 2 (a). Além disso, para y(0)=5 e (0) = 0, a saída da planta escapa em t ≈ 1.79s (curva não mostrada). Por outro lado, quando o parâmetro µ(t) variante no tempo é implementado com o mesmo grande valor em = 1, a saída da planta converge para a trajetória desejada a partir de y(0) = 5, como mostrado na Fig. 2 (b). Neste caso, a evolução de µ(t) ao longo do tempo é mostrada na Fig. 2 (c), a partir da qual pode-se verificar que uma constante µ = = 0.0005 poderia ser usada. Entretanto, esse valor não é conhecido a priori. Além do mais, muito cuidado deve ser tomado ao reduzir , visto que existe um compromisso entre robustez a ruído de medição e a precisão do rastreamento. Até o presente momento, não existe estratégia de controle por modos deslizantes que seja imune a ruído de medição. Isto ainda é mais crítico em esquemas via realimentação de saída baseados em diferenciadores e observadores de alto ganho, como é caso do esquema proposto neste trabalho. Por outro lado, os testes experimentais realizados com esquemas também baseados em alto ganho (Cunha et al., 2005) indicam que a robustez do algoritmo proposto com respeito à ruído de medição é, até certo ponto, aceitável. Apesar disso, uma melhor avaliação da influência do ruído de medição no desempenho do sistema de controle se faz necessária.


é apresentada. A


9 CONCLUSÕES

O desafiador problema de rastreamento global para sistemas SISO não-lineares incertos e variantes no tempo foi resolvido através do controle por modos deslizantes utilizando somente realimentação de saída. Foi considerada uma ampla classe de plantas que incluem não-linearidades majoradas de forma afim no estado não-medido com taxa de crescimento dependente nãolinearmente de estados internos e da saída medida. Este artigo mostra que é possível aplicar técnicas de dominação e projetar um HGO com ganho dinâmico a fim de obter rastreamento global e prático via controle por modos deslizantes e realimentação de saída, livre de peaking. Acreditamos que esse seja o primeiro resultado global no contexto de SMC para a classe de sistemas considerada.

AGRADECIMENTOS

Este trabalho contou com o apoio financeiro da FAPERJ, da CAPES e do CNPq.

Artigo submetido em 29/03/2010 (Id.: 01122)

Revisado em 20/09/2010

Aceito sob recomendação do Editor Associado Prof. Luis Fernando Alves Pereira

Neste apêndice, considera-se sistemas na forma (50)–(51) satisfazendo (C0) e (C1) da Seção 8. A seguir, nós fornecemos os passos para a obtenção do observador da norma (53)–(55), de acordo com a Definição 1.

  • Limitante para |η|:

    obtendo

    c

    0

    e

    φ

    1

    em (54)

onde φ1 = φη + c0∈ + α1(ε), c0 = λ são conhecidos e o operador * denota a convolução pura. Relembrando que λ|η|2 < V , então pode-se obter |η|< + π0, com ω21 em (54) e π0 sendo um termo exponencialmente decrescente dependente de |η(0)| e |ω21(0)|.

  • Limitante para |

    υ|:

    obtendo φ

    2

    e φ

    3

    em (55)

Será util reescrever (51) na forma compacta

onde (Ap, bp) é o par canônico de Brunovsky e aplicar a mudança de variável = υ – bpkuτ1ω1 para obtermos:

Pela observabilidade do par (Ap,cp), onde cp = [1 0 ... 0], existe uma matriz P = PT > 0 e um vetor coluna arbitrário L satisfazendo + PAL = –I, sendo AL = Ap – Lcp uma matriz Hurwitz.

Agora, considerando T1 := diag(1, ε, ε2,...,εp–1) e uma constante ε > 0 qualquer, as seguintes propriedades podem ser checadas: (i) T1Ap = ε–1Ap, (ii) cp = cp e (iii) T1bp = bpεp–1 . Assim, somando e subtraindo o termo (εT1)–1Lcp na dinâmica de , pode-se escrever = [Ap – (εT1)–1 Lcp] + bpkuω1 + ϕ +(εT1)–1Ly. Além disso, aplicando-se a transformação = T1 e considerando as propriedades (i)–(iii) acima, tem-se que

O passo chave é notar que, devido à condição de triangularidade (C0):

onde k é independente de ε. Em seguida, utilizando-se a derivada de Dini

onde π1 é um termo exponencialmente decrescente e a função não-negativa 1, assim como, as constantes nãonegativas c1,c2 são todas conhecidas, satisfazendo c1< 1/(2λmax(P)), c2< |P|kvmin(P) e [|bpεp–1kuω1 + ε–1Ly| + φv] c3 < 1 + π1, com c3< |P|.

Portanto, dado qualquer V , ou

Agora, considere

com as funções não-negativas φ2, φ3 em (55) a serem determinadas. Assim, (55) pode ser escrita como

como γ(σ) := 1 – e-σ. Consequentemente, utilizando-se a função limitante Ψr, dada em (C0), devemos escolher 4 em (61) (e as funções φ2, φ3) a fim de satisfazer:

  • Limitante para |

    υ|

O limitante para o subsistema-υ pode ser obtido considerando-se dois casos para a taxa de crescimento φr (|η|, y, t): φr > kr e φr < kr, onde kr = 3/(c2τ2) e τ2 é a constante positiva de projeto em (62).

Caso 1: Neste caso, tem-se 3/τ2< c2kr +1 < c2φr + 1 < 4. Deste modo, pode-se verificar que

Agora, considere W := ln(V + 1) (Kaliora et al., 2006). Então, = / (V + 1) e, a partir de (60), pode-se escrever

com ε = c1τ2, 3 := 1|ε=c1τ2 e notando-se que V/(V + 1) , 1/(V + 1) < 1.

Agora, dado qualquer W , temos duas possibilidades: W < ω22 ou W > ω22. Considerando o último caso, pode-se escrever –γ(ω22) > –γ(W ), visto que γ é uma função crescente. Por essa razão, a partir de (64) e (62), tem-se que 22> – π1. Além do mais, de (63), 22 também satisfaz 22> 1/τ2. Consequentemente, somando as duas ultimas desigualdades obtém-se

Recordando que π1 = β1e-λ1τ e fazendo = W + π11, para alguma constante positiva λ1 e β1 ∈ . Então, tem-se – 2ω22< , a partir do qual pode-se concluir que, < 2ω22 – T2 + |(0) – 2ω22(0)|. Note que, é sempre possível encontrar um termo exponencialmente decrescente que seja um majorante para a função afim no tempo acima, i.e., –t2 +|(0)–2ω22(0)| < π2, onde π2 := β2(|(0)| + |ω22(0)|)e–λ2t, com β2 e alguma constante λ2 > 0. Finalmente, dado W , pode-se concluir que W < 2|ω22| + π2 + π11 e, utilizando o Teorema da Comparação (Khalil, 2002) e relembrando que V = eW – 1, podemos escrever

sendo π3 um termo exponencial decrescente.

Caso 2: Assuma que φr< kr e faça ε = c1/(c2kr + 2) em (60). Desta forma, pode-se escrever:

na qual

2 = 1|ε=c1/(c2 kr+2). Neste caso, somando os dois limitantes obtidos de (66), podemos escrever também

sendo π4 um termo exponencial decrescente. Assim, a partir de (65) e (67) tem-se

com ε = c1/(3/τ2 + 2) e utilizando-se a desigualdade de Rayleigh, pode-se obter um limitante superior para υ.

Finalmente, juntando-se os majorantes para |υ| e |η|, podemos obter a função não-negativa φ4 e as constantes não-negativas em (56).

  • Demonstrações das Desigualdades (15), (16) e (17)

  • Demonstrações das Desigualdades (44) e (45)

. Agora, considere que β

  • Provando que (47) Satisfaz (P1)

|

  • Prova do Lema 1

com k1 > 0 sendo uma constante e π1 = β1(|ξe(0)|) e-λmt um termo exponencialmente decrescente com alguma função β1 e 0 < λm < λm[Am]. Note que, para todo , ou |Sξe|<|S| ou |Sξe| > |S|. Sendo assim, ou |Sξe|<|S| ou sgn() = sgn(Sξe). Considere o último caso.

Utilizando-se a função de energia V = Pξe, onde P = PT > 0 é a solução de P + PAm = –I, pode-se assegurar que a derivada temporal de V ao longo das soluções de (13) satisfaz

em (19) satisfaz (18), tem-se que

  • Prova do Teorema 1

Passo-1: A partir da Definição 1, da Hipótese 1 e de (44), pode-se verificar que |z(t)| > β1(|z(0)|) + K1, ∀t ∈ [0, tµ], onde β1 e K1> 0 é uma constante.

Passo-2: Considere a dinâmica-ζ (31) e a função de armazenamento V = ζTPζ, onde P = PT > 0 é a solução de P + PAo = –I. Então, a derivada temporal de V ao longo das trajetórias de (31) satisfaz µ= –|ζ|2 +()[2ζTPΔζ]+(µν)[2ζTPbp]. Agora, projetando para satisfazer (P0)–(P2), (45) é válida e a seguinte desigualdade é verificada ∀t ∈ [tµ,tM): µ

< –|ζ|2 + ()k1|ζ|2 + ()k2|ζ|, sendo k1 := 2|P ||Δ| e k2 := 2|P||bp|. Além disso, visto que ab < a2 + b2, para quaisquer números a, b reais positivos, então

da qual pode-se concluir que µ

< –λ1V + (), com uma constante apropriada λ1 > 0. Agora, seja V < 2()/λ1 ou µ< –µ1V/2. Considere o ultimo caso. Como µ <, logo < –λ1V/(2). Consequentemente, conclui-se que |ζ| , || < β2(|ζ(0)|)e–λ2t + (), ∀t ∈ [tµ,tM ), com uma constante apropriada λ2 > 0 e algum β2. Na ultima desigualdade, o limitante para || foi obtido notando-se que = ζ implica em || < |ζ|, visto que || < 1 para µ<1.

Passo-3: A partir do Lema 1, existe uma propriedade ISS de || para ξe e, considerando o majorante dado no Passo-1, pode-se concluir que |ξe|, |z(t)| < [β3(|z(0)|)+ k3]e-λ3t + (), ∀t ∈ [0,tM ), com constantes apropriadas λ3 > 0, k3> 0 e algum β3. Assim, |z(t)| não pode escapar em tempo finito, sendo uniformemente limitado em := [0,tM ) (UB).

Passo-4: Uma vez que z(t) é UB, então ξe, σ = Sξe, ζ e ξ = ξe + ξm são UB e, a partir da Hipótese 2, η, são também UB. Além disso, de acordo com o limitante inferior para |T (x, t)| dado na Hipótese 1 tem-se que x é UB. Assim, as funções limitantes superiores dadas na Hipótese 1 garantem que d, kp,de são também UB. Agora, reescrevendo (13) na forma normal, pode-se escrever = –λ4σ + k4(u + de), para algumas constantes λ4, k4 > 0. Além disso, pela linearidade da solução da ultima equação, pode-se tamém escrever σ = σ1 + σ2, onde 1= –λ4σ1 + k4u e 2 = –λ4σ2 +k4de, com condições iniciais apropriadas. Portanto, visto que σ e de são UB, σ2 e σ1 também são. Neste caso, qualquer sinal satisfazendo 3 = –λ5σ3 +k5u, onde λ5,k5 > 0 são constantes, é também UB, em particular, ω1 definido em (3). Como y, ω1 são UB e φo é contínuo por partes em seus argumentos, então a dinâmica-ω2, na Definição 1, não pode escapar em tempo finito. Finalmente, pode-se concluir que todos os sinais do sistema não podem escapar em tempo finito, i.e., tM→ ∞. Assim sendo, a partir do Passo-3, pode-se verificar diretamente que o sistema do erro é GAS com respeito a um conjunto compacto {z : |z|< b} e que z(t) é exponencialmente convergente para um conjunto residual de ordem ().

(|

  • Prova do Corolário 1

=

  • Ahrens, J. H. & Khalil, H. K. (2007). Closed-loop behavior of a class of nonlinear systems under ekf-based control, IEEE Trans. Aut. Contr 52(3): 536540.
  • Andrieu, V., Praly, L. & Astolfi, A. (2007). Asymptotic tracking of a state trajectory by output-feedback for a class of non linear systems, CDC, New Orleans (LA), pp. 52285233.
  • Andrieu, V., Praly, L. & Astolfi, A. (2009). High gain observers with updated gain and homogeneous correction terms, Automatica 45(2): 422428.
  • Angeli, D. & Sontag, E. (1999). Forward completeness, unboundedness observability, and their Lyapunov characterizations, Systems & Contr. Letters 38(5): 209217.
  • Arcak, M., Larsen, M. & Kokotović, P. (2002). Boundedness without absolute stability in systems with stiffening nonlinearities, European J. of Control. 8(3): 243250.
  • Bondarev, A. G., Bondarev, S. A., Kostyleva, N. E. & Utkin, V. I. (1985). Sliding modes in systems with asymptotic state observers, Autom. Remote Control 46(6): 679684.
  • Choi, H.-L. & Lim, J.-T. (2005). Global exponential stabilization of a class of nonlinear systems by output feedback, IEEE Trans. Aut. Contr. 50(2): 255257.
  • Cunha, J. P. V. S., Costa, R. R., Lizarralde, F. & Hsu, L. (2009). Peaking free variable structure control of uncertain linear systems based on a high-gain observer, Automatica 45: 1156 1164.
  • Cunha, J. P. V. S., Hsu, L., Costa, R. R. & Lizarralde, F. (2005). Controle de sistemas lineares incertos por modos deslizantes e observador de alto ganho sem peaking, Controle & Automação 16(4): 499466.
  • Diao, Y. & Passino, K. M. (2001). Adaptive control fo a class of nonlinear time-varying systems, Proc. American Contr. Conf., Arlington, pp. 41614166.
  • Edwards, C., Colet, E. F. & Fridman, L. (eds) (2006). Advances in Variable Structure and Sliding Mode Control, Springer-Verlag.
  • Edwards, C. & Spurgeon, S. K. (1998). Sliding Mode Control: Theory and Applications, Taylor & Francis Ltd.
  • Esfandiari, F. & Khalil, H. K. (1992). Output feedback stabilization of fully linearizable systems, Int. J. Contr. 56: 10071037.
  • Filippov, A. F. (1964). Differential equations with discontinuous right-hand side, American Math. Soc. Translations 42(2): 199231.
  • Hsu, L. (1997). Smooth sliding control of uncertain systems based on a prediction error, Int. Journal of Robust and Nonlinear Control 7: 353372.
  • Hsu, L., Cunha, J. P. V. S., Costa, R. R. & Lizarralde, F. (2002). Multivariable output-feedback sliding mode control, in X. Yu & J.-X. Xu (eds), Variable Structure Systems: Towards the 21st Century, Springer-Verlag, pp. 283313.
  • Hsu, L., Peixoto, A. J., Cunha, J. P. V. S., Costa, R. R. & Lizarralde, F. (2006). Output feedback sliding mode control for a class of uncertain multivariable systems with unmatched nonlinear disturbances, Advances in Variable Structure and Sliding Mode Control, Springer-Verlag, pp. 195225.
  • Isidori, A. (1995). Nonlinear Control Systems, 3rd edn, Springer.
  • Jiang, Z. P., Mareels, I., Hill, D. J. & Huang, J. (2004). A unifying framework for global regulation nonlinear output feedback: from ISS to iISS, IEEE Trans. Aut. Contr. 49(4): 549562.
  • Kaliora, G., Astolfi, A. & Praly, L. (2006). Norm estimators and global output feedback stabilization of nonlinear systems with ISS inverse dynamics, IEEE Trans. Aut. Contr. 51(3): 493498.
  • Khalil, H. K. (2002). Nonlinear Systems, 3rd edn, Prentice Hall.
  • Krishnamurthy, P., Khorrami, F. & Chandra, R. S. (2003). Global high-gain-based observer and backstepping controller for generalized output-feedback canonical form, IEEE Trans. Aut. Contr. 48(12): 22772284.
  • Krishnamurthy, P., Khorrami, F. & Jiang, Z. P. (2002). Global output feedback tracking for nonlinear systems in generalized output-feedback canonical form, IEEE Trans. Aut. Contr. 47(5): 814819.
  • Lei, H. & Lin, W. (2005). Universal output feedback control of nonlinear systems with unknown growth rate, Proceedings of the 16th IFAC World Congress, Prague, Czech Republic.
  • Levant, A. (2003). Higher-order sliding modes, differentiation and output-feedback control, Int. J. Contr. 76(9): 924941.
  • Marino, R. & Tomei, P. (1995). Nonlinear Control Design. Geometric, Adaptive and Robust,1st edn, Prentice Hall.
  • Mazenc, F., Praly, L. & Dayawansa, W. (1994). Global stabilization by output feedback: examples and counterexamples, Systems & Contr. Letters 23: 119125.
  • Oh, S. & Khalil, H. K. (1997). Nonlinear output-feedback tracking using high-gain observer and variable structure control, Automatica 33(10): 18451856.
  • Oliveira, T. R., Peixoto, A. J. & Hsu, L. (2009). Dwell-time and monitoring schemes for peaking avoidance in high-gain observer based output-feedback control, Proc. IEEE Conf. on Decision and Control, Shanghai, pp. 75577562.
  • Oliveira, T. R., Peixoto, A. J. & Hsu, L. (2010a). Controle por realimentação de saída para sistemas incertos fortemente nãolineares, Controle & Automação 21: 6981.
  • Oliveira, T. R., Peixoto, A. J. & Hsu, L. (2010b). Sliding mode control of uncertain multivariable nonlinear systems with unknown control direction via switching and monitoring function, IEEE Trans. Aut. Contr. 55(4): 10281034.
  • Oliveira, T. R., Peixoto, A. J., Nunes, E. V. L. & Hsu, L. (2007). Control of uncertain nonlinear systems with arbitrary relative degree and unknown control direction using sliding modes, Int. J. Adaptive Control Signal Process. 21: 692707.
  • Peixoto, A. J. (2007). Rastreamento de Trajetória por Modos Deslizantes de uma Classe de Sistemas Não-lineares Incertos via Realimentação de Saída, PhD thesis, Ph.D. thesis, Programa de Engenharia Elétrica, COPPE/UFRJ, Rio de Janeiro.
  • Peixoto, A. J., Hsu, L., Costa, R. R. & Lizarralde, F. (2007). Global tracking sliding mode control for uncertain nonlinear systems based on variable high gain observer, Proc. IEEE Conf. on Decision and Control, New Orleans, pp. 20412046.
  • Praly, L. (2001). Asymptotic stabilization via output feedback for lower triangular systems with output dependent incremental rate, Proc. IEEE Conf. on Decision and Control, Orlando, pp. 38083813.
  • Praly, L. & Jiang, Z. (2004). Linear output feedback with dynamic high gain for nonlinear systems, Systems & Contr. Letters 53: 107116.
  • Qian, C. & Lin, W. (2002). Output feedback control of a class of nonlinear systems: a nonseparation principle paradigm, IEEE Trans. Aut. Contr. 47(10): 17101715.
  • Sabanovic, A., Fridman, L. & Spurgeon, S. K. (eds) (2004). Variable Structure Systems: From Principles to Implementation (IEE Control Engineering), Academic Press, Inc.
  • Sontag, E. D. & Wang, Y. (1995). On characterizations of the input-to-state stability property, Systems & Contr. Letters 24: 351359.
  • Sontag, E. D. & Wang, Y. (1997). Output-to-state stability and detectability of nonlinear systems, Systems & Contr. Letters 29: 279290.
  • Sussmann, H. J. & Kokotović, P. V. (1991). The peaking phenomenon and the global stabilization of nonlinear systems, IEEE Trans. Aut. Contr. 36(4): 424440.
  • Utkin, V. I. (1992). Sliding Modes in Control and Optimization, Springer-Verlag.
  • Yu, X. & Xu, J.-X. (eds) (2002). Variable Structure Systems: Towards the 21st Century, Springer-Verlag.

Apêndice A

+ para (

A fim de considerar explicitamente a dependência do tempo de f(x, t) em (1), seja: βk := Lf βk–1 + + para K ∈ {1,...,p} e β0 := 0. Uma condição suficiente para garantir que a planta variante no tempo (1)–(2) é transformável para a forma normal é dada por: Lg[h + βk] ≡ 0 (k ∈ {0,...,p – 2}), onde a derivada de Lie de uma função h ao longo de um campo vetorial f é denotada por Lf h, como em (Khalil, 2002, pp. 510). Neste caso, a transformação T (x, t)=[ηT (x, t)] é tal que Tξ := [h0, Lf h1, ... hp–1]T. Adicionalmente, o HFG da planta kp(x, t)= Lg[hp–1], a perturbação de entrada d(x, t)=(p) / kp T devem satisfazer a Hipótese 1.

Apêndice B

A partir de (C1), a função α1 é stiffening. Isso garante que α1(σ) > λσ, ∀σ > ε, para qualquer ε > 0 e 0 < λ < α1 (ε) / ε. Além disso, de (52), pode-se escrever < –α1(V)+ φη(y, t) ou, equivalentemente, ˙< –λV +[λV – α1(V)] + φη(y, t). Agora, dado qualquer V , ou V < ε ou V > ε. Consequentemente, ou ˙< –λV +[λε + α1(ε)] + φη ou ˙< – λV + φη, o que nos faz concluir que V˙< – λV +[λε+α1(ε)]+φη. Portanto, usando o Teorema da Comparação (Khalil, 2002), obtém-se

Apêndice C

Apêndice D

Introduzindo a transformação de coordenadas

e = Tnξe, com ξn :=[ I ST ]T, o sistema (13) pode ser levado para a forma normal. Logo, pode-se concluir que (13) é OSS com respeito à saída de grau relativo unitário Sξ, ou seja, ξe e e satisfazem

  • 1
    Esta terminologia é utilizada em (Diao & Passino, 2001), onde a dependência do tempo é considerada na então chamada"derivada de Lie modificada".
  • 2
    O caso com sgn(kp) desconhecido (direção de controle desconhecida) poderia ser considerado utilizando-se a generalização da técnica de funções de monitoração para grau relativo arbitrário introduzida em (Oliveira et al., 2007).
  • 3
    Assim como em (Arcak et al., 2002), nós dizemos que α
    1 (σ) é stiffening se para todo λ > 0, existe ε > 0 tal que σ
    > ε ⇒ α
    1 (σ)
    > λ σ. Uma condição menos conservadora sobre α o
    -1 tal qual a condição ULLB (ultimately linearly lower bounded) introduzida em (Oliveira et al., 2010b; Oliveira et al., 2009) poderia ser utilizada ao invés da restrição
    stiffening.
    44 e o limitante superior ψυ dado em (C0), a derivada temporal de V := ao longo da solução da dinâmica de ν satisfaz Para evitarmos a derivada de Dini, poderíamos ter utilizado a relação ab : a
    2 + b
    2, válida 'a,b > 0, à custa de algum conservadorismo.
  • 4
    e o limitante superior ψ
    υ dado em (C0), a derivada temporal de V :=
    ao longo da solução da dinâmica de ν satisfaz
  • Datas de Publicação

    • Publicação nesta coleção
      19 Jul 2011
    • Data do Fascículo
      Jun 2011

    Histórico

    • Aceito
      20 Set 2010
    • Recebido
      29 Mar 2010
    Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
    E-mail: revista_sba@fee.unicamp.br