Observação adaptativa neural com convergência assintótica na presença de parâmetros variantes no tempo e distúrbios

Vargas, José A. Ruiz; Hemerly, Elder M.

doi:10.1590/S0103-17592008000100002

Resumos

Neste artigo é proposto um esquema baseado em redes neurais para estimação adaptativa dos estados de uma classe de sistemas não-lineares contínuos, incertos, variantes no tempo e sujeita a distúrbios. Prova-se, via argumentos usuais de Lyapunov e uma técnica de limitação adaptativa (adaptive bounding technique), que o erro residual de observação converge para zero, inclusive na presença de erros de aproximação e distúrbios, enquanto os erros de estimação (pesos, parâmetros e função limitadora) permanecem limitados. Um exemplo de simulação é apresentado para ilustrar a aplicação e desempenho do esquema proposto.

Observadores adaptativos; sistemas não-lineares; redes neurais artificiais; métodos de Lyapunov

In this paper a scheme based on neural networks for adaptive observation of a class of uncertain continuous nonlinear systems in the presence of time-varying parameters and non-vanishing disturbances is proposed. Using standard Lyapunov procedures and an adaptive bounding technique, the state error convergence to zero is proved, even when approximation error and disturbances are present, while guaranteeing uniform ultimate boundedness of all others estimation errors (weight, parameter and bounding function). A simulation example to illustrate the application and performance of the proposed algorithm is provided.

Adaptive observers; nonlinear systems; neural networks; Lyapunov methods

SISTEMAS INTELIGENTES

Observação adaptativa neural com convergência assintótica na presença de parâmetros variantes no tempo e distúrbios

José A. Ruiz Vargas; Elder M. Hemerly

Departamento Sistemas e Controle, Instituto Tecnológico de Aeronáutica, 12228-900 São José dos Campos, São Paulo, Brasil vargas@ieee.org, hemerly@ita.br

RESUMO

Neste artigo é proposto um esquema baseado em redes neurais para estimação adaptativa dos estados de uma classe de sistemas não-lineares contínuos, incertos, variantes no tempo e sujeita a distúrbios. Prova-se, via argumentos usuais de Lyapunov e uma técnica de limitação adaptativa (adaptive bounding technique), que o erro residual de observação converge para zero, inclusive na presença de erros de aproximação e distúrbios, enquanto os erros de estimação (pesos, parâmetros e função limitadora) permanecem limitados. Um exemplo de simulação é apresentado para ilustrar a aplicação e desempenho do esquema proposto.

Palavras-chave: Observadores adaptativos, sistemas não-lineares, redes neurais artificiais, métodos de Lyapunov

ABSTRACT

In this paper a scheme based on neural networks for adaptive observation of a class of uncertain continuous nonlinear systems in the presence of time-varying parameters and non-vanishing disturbances is proposed. Using standard Lyapunov procedures and an adaptive bounding technique, the state error convergence to zero is proved, even when approximation error and disturbances are present, while guaranteeing uniform ultimate boundedness of all others estimation errors (weight, parameter and bounding function). A simulation example to illustrate the application and performance of the proposed algorithm is provided.

Keywords: Adaptive observers, nonlinear systems, neural networks, Lyapunov methods.

1 INTRODUÇÃO

Observadores são estimadores de estado para sistemas determinísticos, isto é, sistemas nos quais os ruídos de processo e de medidas não são significativos. Introduzidos por Luenberger (1966), os observadores de estado possuem diversas aplicações práticas, tais como monitoramento, controle e detecção de falhas. São empregados para obter uma estimativa do vetor de estado verdadeiro x a partir das saídas disponíveis, em situações usuais nas quais o número de sensores (q) é menor que a dimensão do vetor de estado (n). Tipicamente se tem q < n, devido à dificuldade de instalação ou elevado custo do sensor. Assim, pode-se entender o observador como sendo um software que substitui um componente de hardware. Deste modo, o sucesso desta substituição depende basicamente da qualidade do modelo do sistema. Portanto, o uso de observador é justificado para classes de sistemas para os quais é possível uma modelagem acurada o suficiente. Caso contrário, faz-se necessário utilizar um observador adaptativo, no qual as tarefas de reconstrução do estado e de modelagem são executadas simultaneamente.

Há na literatura pelo menos três metodologias para projeto de observadores adaptativos. A primeira é baseada em uma transformação de estado não-linear, de forma a se obter uma equação de erro linear, que possibilita que técnicas lineares possam ser empregadas (Marino & Tomei, 1995; Bastin & Gevers, 1988). Por exemplo, em Marino & Tomei, (1995), foram estabelecidas as condições para a existência desta transformação. A segunda metodologia emprega o sistema original, mas sujeito a hipóteses convenientes, na seleção da estrutura do observador e obtenção de equação de erro (Rajamani, 1995; Cho & Rajamani, 1997; Zhu & Han, 2002). O terceiro método de projeto é baseado em aproximadores on-line, como por exemplo RNAs e sistemas nebulosos, para parametrização do sistema. Como exemplos desta abordagem podem ser citados Zhu et alii, (1997), Kim et alii, (1997), Vargas & Hemerly, (1999), Choi & Farrel, (2001). Convém ressaltar que as duas primeiras metodologias requerem o conhecimento prévio da estrutura do sistema, enquanto que a terceira não, uma vez que os aproximadores on-line têm estrutura conhecida a priori.

Em particular, as principais características que fundamentam o emprego de RNAs em observação adaptativa incluem: 1) RNAs têm estrutura conhecida, 2) RNAs podem aproximar sistemas não-lineares complexos via aprendizagem, sempre que satisfeitas as hipóteses de aproximação universal e regularidade (Polycarpou & Ioannou, 1991), e 3) RNAs são adequadas ao processamento paralelo e exibem tolerância a falhas. Portanto, mediante o emprego de RNAs o problema de determinação de estrutura é simplificado, sendo o observador escolhido com base na parametrização neural, onde seus pesos são ajustados com leis de adaptação projetadas usualmente com base na análise de estabilidade. Como exemplos podem ser citados Zhu et alii, (1997), Kim et alii, (1997), Vargas & Hemerly, (1999), Choi & Farrel, (2001), onde foi considerada a observação adaptativa de varias classes de sistemas incertos contínuos com parâmetros constantes e desconhecidos, sendo os pesos dos observadores neurais empregados ajustados com leis de adaptação projetadas com base na análise de estabilidade. Em todos estes trabalhos, contudo, unicamente foi provado que os erros de observação residuais são limitados e, em geral, de magnitude proporcional a limitantes superiores dos erros de aproximação e distúrbios. A não garantia de convergência assintótica na presença de distúrbios não é um problema exclusivo da observação neural. Trabalhos recentes em observação não-linear baseada no conhecimento prévio da dinâmica dominante do sistema, vide Zhang, (2002), Marino, et alii, (2001), Wang & Gao, (2003), e suas referências, também apresentam esta peculiaridade.

Por exemplo, em Marino et alii, (2001), foi proposto um observador adaptativo para uma classe de sistemas não-lineares multiple-input single output (MISO), cuja estrutura assume-se conhecida a priori. Embora as hipóteses restritivas de conhecimento prévio da estrutura e saída escalar facilitem o projeto do observador, somente foi provado que o erro de observação converge para zero sob a hipótese crucial de inexistência ou convergência assintótica para zero dos distúrbios. Convém ressaltar que observadores adaptativos contínuos em malha aberta para sistemas não-lineares incertos muliple-input multipl-output (MIMO), que assegurem convergência assintótica do erro de observação para zero, inclusive na presença de distúrbios limitados, até onde os autores conhecem, são inexistentes na literatura.

Motivado pelos fatos anteriores, neste artigo é proposto um esquema, baseado em RNAs, para observação assintótica de uma classe de sistemas não-lineares MIMO, nos quais os parâmetros e distúrbios são limitados, desconhecidos e variantes no tempo. Mais precisamente, o observador proposto assegura, ao contrário dos propostos em Zhu et alii, (1997), Kim et alii, (1997), Vargas & Hemerly, (1999), Choi & Farrel, (2001), Zhang, (2002), Marino et alii, (2001), e Wang & Gao, (2003), que o erro de observação converge assintóticamente para zero, inclusive na presença de erros de aproximação e distúrbios limitados. Para tanto, o sistema incerto foi parametrizado via RNAs lineares nos pesos, para contornar o empecilho do sistema incerto ter estrutura maiormente desconhecida. Desta forma o sistema parametrizado forneceu parte da estrutura do observador. Adicionalmente, um ganho de realimentação dinâmico foi também introduzido no observador para melhoria de desempenho, ao contrário do observador de Luenberger que emprega um ganho de realimentação constante (Luenberger, 1966). Com base na análise de estabilidade e usando uma técnica de limitação adaptativa (Polycarpou, 1996), mecanismos de adaptação são projetados para os parâmetros, pesos e ganho de realimentação, objetivando garantir que o observador seja assintoticamente estável, isto é, a convergência do erro de observação para zero. O observador proposto estende os resultados prévios em Rajamani, (1995), Cho & Rajamani, (1997), Zhu & Han, (2002), Zhu et alii, (1997), Kim et alii, (1997), Vargas & Hemerly, (1999), Choi & Farrel, (2001), Zhang, (2002), Marino et alii, (2001), e Wang & Gao, (2003), uma vez que tem aplicação mais ampla, pois não requer o conhecimento prévio das não-linearidades do sistema, e assegura convergência assintótica do erro de observação para zero, inclusive na presença de distúrbios.

A principal contribuição deste trabalho é a proposição de uma metodologia, para a estimação do estado de uma classe de sistemas incertos MIMO, que assegura a convergência assintótica do erro de observação, apesar da presença de parâmetros variantes no tempo, erros de aproximação e distúrbios. Adicionalmente, uma vez que a metodologia de projeto proposta também pode ser usada sem RNAs, por exemplo quando as não-linearidades dominantes têm estrutura conhecida a priori, como em Marino & Tomei, (1995), Bastin & Gevers, (1988), Rajamani, (1995), Cho & Rajamani, (1997), Zhu & Han, (2002), Zhang, (2002), Marino, et alii, (2001), e Wang & Gao, (2003), o presente trabalho estende o estado da arte em observação adaptativa baseada em RNAs e, em particular, em observação não-linear.

O restante do trabalho é organizado conforme a seguir. Na Seção 2 são apresentadas as classes de RNAs utilizadas na parametrização das não-linearidades desconhecidas. Na Seção 3 o problema de observação adaptativa é formulado. Já na Seção 4 o modelo para identificação e os erros associados são apresentados. Na Seção 5 é apresentado o principal resultado do artigo, a prova de estabilidade assintótica do erro de observação. Um exemplo de simulação é discutido na Seção 6. Finalmente, na Seção 7, as principais contribuições do trabalho são resumidas.

2 REDES NEURAIS ARTIFICIAIS PARAMETRIZÁVEIS LINEARMENTE

As redes neurais parametrizáveis linearmente (RNAPLs) podem ser expressas matematicamente como

onde W Î ^_r, z Î e p :

é um vetor de funções básicas que pode ser considerado como uma função vetorial não-linear, cujos argumentos são pré-processados por uma função escalar s(·), e n, L_r, L_z são inteiros estritamente positivos. As funções escalares s(·) usualmente utilizadas incluem sigmoide, tanh, gaussiana, Hardy's, inverse Hardy's multiquadratic, etc (Ge et alli, 2002). Entretanto, neste artigo considera-se somente a classe de RNAPLs nas quais s(·) é limitado, uma vez que neste caso tem-se,

sendo p₀ uma constante estritamente positiva.

A classe de RNAPLs consideradas neste trabalho inclui radial basis function neural networks (RBFNNs) (Sanner & Slotine, 1992), wavelet networks (Zhang & Benveniste, 1992), high order neural nertworks (HONNs) (Kosmatopoulos et alli, 1995), e também outros aproximadores parametrizáveis linearmente como Takagi-Sugeno fuzzy systems (Wang, 1994), os quais satisfazem a propriedade de aproximação universal e regularidade (Polycarpou & Ioannou, 1991):

Propriedade 1: Para quaisquer constante e₀ > 0 e função f Î C[W] existe uma matriz W^* = W, onde W^* é uma matriz ''ótima'' e L_r é suficientemente grande, tal que,

onde C[W] denota o espaço de funções contínuas definidas em um domínio compacto W Ì Âⁿ, |·| denota o valor absoluto se o argumento é um escalar. Se o argumento é uma função vetorial em Âⁿ então |·| denota qualquer norma em Âⁿ.

Propriedade 2: A saída da RNA é continua com respeito aos seus argumentos e satisfaz a condição de Lipschitz localmente para todo (z, W) finito.

3 FORMULAÇÃO DO PROBLEMA

Considere a classe de sistemas não-lineares representada por

onde x Î X é o vetor de estados de dimensão n, u Î U é um vetor de entradas admissíveis de dimensão m, y Î Y é o vetor de saídas de dimensão q, q Î V é um vetor de parâmetros (variante no tempo e incerto) de dimensão p, f : X × U Â^r e g_i : X × U Â^r, "i = 1,2, ..,p são mapeamentos contínuos desconhecidos, h : X × U × V × [0, ¥) Â^r é um vetor de distúrbios desconhecido, A, B e C são matrizes conhecidas de dimensões apropriadas. Com a finalidade de ter o problema bem colocado, assuma que X, U, V são conjuntos compactos e que f, g_i e h são Lipschitz localmente com respeito a x em X × U × V × [0, ¥), tal que (4) tem uma única solução passando por x(0).

Assume-se que as seguintes hipóteses possam ser estabelecidas

Hipótese 1: Na região X × U × V × [0, ¥)

onde ||·||é a norma Euclideana e h₀ é uma constante positiva.

Hipótese 2: O parâmetro q(t) = [q₁(t) q₂(t) ... q_p (t)]^T é tal que q Î C¹, isto é, q possui primeira derivada temporal continua, q_i(t) têm sinal constante conhecido e (t) / dt < 0 "i = 1,2, ..,p.

Hipótese 3: Existe uma matriz simétrica positiva definida P Î Âⁿ^×n e uma matriz de ganho L Î Â^n×q tais que

onde r₁ e r₂ são constantes estritamente positivas, Q é uma matriz positiva definida e cada linha de C^* está no span das linhas de C.

Comentário 1: A Hipótese 1, a qual impõe um limitante superior sobre a norma dos distúrbios, é completamente usual em identificação. A Hipótese 2 impõe que a ''energia' de q seja constante ou continuamente dissipada, o qual implica

para alguma constante positiva b₀.

Comentário 2: A Hipótese 3 impõe que o par (A, C) seja detectável e a parte linear do sistema dissipativa (strictly positive real (Ioannou & Sun, 1996)). Em Rajamani, (1998), são fornecidas condições necessárias e suficientes sobre L para assegurar que (7) seja verificada: L é escolhida tal que (A - LC) é estável e

onde s(·) denota o valor singular mínimo de uma matriz e j = .

Objetiva-se projetar um observador adaptativo para (4), baseado em RNAPLs, o qual assegure a convergência assintótica do erro residual de observação para zero, apesar da presença de erros de aproximação e distúrbios limitados.

4 MODELO PARA IDENTIFICAÇÃO E EQUAÇÃO DO ERRO DE OBSERVAÇÃO

Nesta seção é proposta a estrutura do observador e, com base na mesma, é obtida a equação do erro de observação associada com o problema.

Com base em (3), usando-se RNAPLs, os mapeamentos f(x, u) e g_i(x, u) podem ser substituídos por p_f (x, u) e p_gi (x, u) mais os erros de aproximação e_f (x, u) e e_gi (x, u). Mais exatamente, (4) pode ser escrita como

onde Î e Î são matrizes ''ótimas'', requeridas somente para propósitos analíticos, que podem ser definidas como

com G_f = G_gi = , ||·||_F é a norma de Frobenius, e são constantes estritamente positivas, as quais dependem das leis de ajuste dos pesos, _f e _gi são estimações de e , respectivamente. Os erros de aproximação e_f (x, u) e e_gi (x, u), correspondentes a e , podem ser definidos como

Uma vez que X, U são conjuntos compactos e usando-se (2), na região X × U tem-se

onde e_f₀ e e_gi₀ são constantes positivas.

Comentário 3: É importante ressaltar que e e_f (x, u) ( e e_gi (x, u)) podem não ser únicos. Entretanto, ||e_f (x, u) || (||e_gi (x, u)||) é único por (12).

A estrutura (11) sugere um observador da forma

onde é o estado estimado, = - x é o erro de observação, é o vetor de parâmetros estimado, = C - y é o erro de estimação da saída, e l são, respectivamente, uma função escalar (limitadora) e vetorial, as quais serão definidas apropriadamente na próxima seção (vide (28) e (24)). Mostrar-se-á na próxima seção que o observador (15), com mecanismos de adaptação adequadamente projetados para _f , _gi , , e l, assegura a convergência do erro de observação para zero, inclusive na presença de erros de aproximação e distúrbios.

Comentário 4: É importante ressaltar que o termo C^* em (15), onde não é disponível para medições, pode ser determinado via , uma vez que C^* está no espaço gerado pelas linhas de C e, portanto, existe uma matriz T tal que C^* = TC. Objetivando-se determinar T, note que a matriz C pode ser decomposta em valores singulares como

donde a inversa generalizada ou pseudo-inversa de C resulta,

onde U Î Â^q^×q e V Î Â^n×n são matrizes ortogonais,

são os valores singulares de C, k é o posto de C e

(Noble & Daniel, 1977). Então, T = C^*C⁺ , pois esta matriz satisfaz a equação C^* = TC, e conseqüentemente C^* = TC = T.

Com base em (11) e (15), obtém-se a equação do erro de observação

5 LEIS DE ADAPTAÇÃO PARA OS PESOS E ANÁLISE DE ESTABILIDADE

Nesta seção, objetivando-se assegurar a convergência do erro de predição, são projetadas as leis de adaptação para os pesos, parâmetros e função de realimentação l em (15). Para tanto, empregam-se argumentos usuais de Lyapunov e uma técnica de limitação adaptativa (Polycarpou, 1996), para assegurar estabilidade assintótica do erro de observação e limitação dos erros de estimação dos pesos, parâmetros e função limitadora. Basicamente, a técnica de limitação adaptativa permite assegurar que o limitante superior de , a derivada em relação ao tempo de uma candidata a função de Lyapunov V, seja zero. Isto é forçado pela introdução de um sinal auxiliar ou função limitadora no termo de realimentação dinâmico l do observador. A função limitadora é projetada com base na análise de estabilidade.

Inicialmente, objetivando-se provar que os erros estimação são ultimamente limitados (Ioannou & Sun, 1996), considere o vetor composto de erros

e a maior bola na região de operação

de forma que para todo Î B_R tem-se que (x, u) Î X × U, onde = - y^* , sendo y^* e R constantes estritamente positivas.

Hipótese 4: Assuma que

onde

l_min (G) (l_max (G) ) é o menor (maior) autovalor de uma matriz quadrada G, a_f, a_gi, a_y, a_q, y₀, y₁ são constantes estritamente positivas, a₁ = l_min (Q), c_f_min = l_min (C_f), C_f = diag(c_fj, j = 1,2, .., n), c_gi_min = l_min (C_gi), C_gi = diag(c_gij, j = 1,2, .., n), c_gij > 0,c_q_min = l_min (C_q), C_q = diag(c_q_i, i = 1,2, .., p) e c_q_i > 0.

Considere também a seguinte função positiva definida (função de Lyapunov candidata (Ioannou & Sun, 1996))

onde tr(·) é o operador traço, e defina o máximo e mínimo valores de V sobre os contornos de B_g₀ = {| |||| < g₀ } e B_R, respectivamente, como V_M = V = T_M e V_m = V = R²T_m. Defina também os conjuntos W_M = {| V < V_M} e

Comentário 5: Uma vez que V_M < V_m pela Hipótese 4, conclui-se que W_M Ì W_m.

O resultado principal do trabalho é estabelecido e provado na seqüência.

Teorema 1: Considere a classe de sistemas não-lineares incertos descrito por (4), satisfazendo as Hipótese 1-4, o observador (15) com

e as leis adaptativas,

Se os erros iniciais pertencem ao conjunto (23) e

onde

Então,

(i)(t) é ultimamente limitado.

(ii) lim_t®¥(t) = 0.

Prova: Primeiramente mostra-se que o erro é limitado, independentemente dos outros sinais de erro, o qual permite que desigualdades necessárias para a prova de convergência sejam estabelecidas. Para tanto, considere a função positiva semi-definida (Lyapunov-like (Ioannou & Sun, 1996))

Derivando-se (34) em relação ao tempo e usando-se (29), obtém-se

Portanto, a condição |||| > torna < 0 fora do conjunto compacto = {| |||| < }, onde = max{||(0)||}, o qual assegura a limitação de . Uma vez que (0) Î pode ser concluído que

Com base em (8), (36) e a Propriedade 2, podem ser estabelecidas as seguintes desigualdades

onde r₁ = 2( + b₀) ||B||_F r₂ = 2||B||_F sendo g_f e g_gi constantes de Lipschitz estritamente positivas.

Derivando-se agora (22) em relação ao tempo, obtém-se

Substituindo-se (18) e (26)-(29) em (39), advém

Lembrando agora que

_i =

_i - q_i, pode ser estabelecido que

já que

_i a_q^-1

_i> 0, devido à Hipótese 2 e condição (31), as quais asseguram que sgn(

_i) = sgn(

_i), "i = 1, 2, .., p, e

q_ia_q^-1

_i< 0 pela Hipótese 2.

Por outro lado, usando-se (8) e uma propriedade simples do traço resulta,

Também, vide Vargas & Hemerly, (2005), para maiores detalhes, tem-se

Logo, usando-se (37), (38), (41)-(47), ||P|| |||| < ^T(PP + I) /2 e ordenando termos, (40) implica

Definindo-se agora y^* = , (48) reduz-se a

Adicionalmente, completando-se o quadrado e uma vez que

^TQ

> a₁ ||C^*

|| ||

||/||C^*||_F e

^T (t) PBl > 0, "t > 0, decorre

Defina o intervalo [t,t + T] (o intervalo do tempo no qual a estimação é feita), como dois conjuntos disjuntos: W₁ = {[t_i, t_i₊₁] | (t) = 0, t Î [t_i, t_i₊₁]} e . Para completar a prova de estabilidade considere os seguintes dois casos:

(i) Se t Î W₁, com base em (50), tem-se que _f, _gi, e são limitados.

(ii) Se t Î , quaisquer uma das condições: |||| > , ||_f||_F > , ||_gi||_F > , || > ou |||| > , tornam < 0 fora do conjunto B_g₀ = {Î B_R | |||| < g₀ }, onde B_g₀Î B_R por (21). Uma vez que V é positiva definida e é negativa definida fora da região B_g₀ , conclui-se que V é limitada por um constante e conseqüentemente , _f, _gi, e são limitados. Em outras palavras, o fato de que B_g₀ é limitada implica que unicamente poderá ocorrer > 0 para , _f, _gi, e finitos e dentro da região B_g₀, pois em temos < 0 e V tem que parar de crescer para valores finitos de , _f, _gi, e , implicando que , _f, _gi, e são limitados. Objetivando-se provar agora que o erro estendido é ultimamente limitado, escreva (22) como V = ^TT , sendo T uma matriz diagonal, cujos máximo e mínimo autovalores T_M e T_m são fornecidos pela Hipótese 3. Então, uma vez que W_M Ì W_m, vide comentário 5, conclui-se que , e portanto, , _f, _gi, e são ultimamente limitados.

Com a finalidade de provar a convergência assintótica do erro de observação, considere os conjuntos disjuntos W_x e , onde

Adicionalmente, (49) implica

ou, usando-se (8), (24) e (25),

Se Î (ou equivalentemente ||C^*|| > z₀ exp(-z₁t)), (53) implica

pois o termo dentro do colchete do lado direito de (53) é maior que zero e (t) > 0, "t > 0 por (30) e (28).

Por outro lado, se Î W_x a desigualdade (52) implica

onde = max(, (0)).

Com base em (54) e (55) pode ser concluído que

onde I^* =

Uma vez que V é limitada inferiormente e não crescente para t ® ¥, tem-se

onde lim_{t ® ¥}V(t) = V_¥ < ¥. Note ainda que ||||² é uniformemente contínua, uma vez que , _f, _gi, e e l são limitados e, com base em (18), segue que é também limitado. Portanto, aplicando o lema de Barbalat (Ioannou & Sun, 1996), conclui-se que lim_{t ® ¥}(t) = 0.

Comentário 6: Note que as condições (30) e (31) podem ser trivialmente satisfeitas, uma vez que as condições iniciais são escolhidas livremente pelo usuário. A condição (32) pode requerer um procedimento de tentativa e erro, pois em (32) são desconhecidos a priori os pesos ''ótimos'' e limitantes para os erros de aproximação e distúrbios. Contudo, esta deficiência não é peculiar exclusivamente ao esquema proposto, senão à maioria das propostas para identificação baseadas em RNAs. Por exemplo, os esquemas em Polycarpou & Ioannou, (1991), Kosmatopoulos et alli, (1995), e Yu et alli, (2001), Song, (1998), Jagannathan & Lewis, (1996), utilizam a projeção de parâmetros, switching-s e zona-morta, que requerem informação prévia sobre o sistema e erro de modelagem.

Comentário 7: Os resultados apresentados nesta seção, baseados em RNAPLs, podem ser modificados para usar RNAs com uma camada escondida (SLHNNs): usando-se a expansão de Taylor com respeito aos pesos para representar as componentes de alta ordem da SLHNN (Lewis et alli, 1996), e empregando a metodologia desenvolvida.

6 SIMULAÇÕES

Nesta seção são apresentadas simulações com a finalidade de ilustrar os resultados teóricos e a aplicação do esquema proposto. Para tanto, considere o processo descrito por

onde x = [x₁, x₂]^T, x(0) = 0, A = B = e u é um sinal quadrado de amplitude 5 e freqüência 1. Note que o sistema (58)-(59) é da forma (4)-(5), onde o parâmetro q₁ = 2 + exp(-t) satisfaz a Hipótese 2, e por conseguinte, o observador proposto pode ser aplicado.

A primeira fase para implementação do observador (15) consistiu em expressar o termo C^*, que aparece no observador e nas leis de adaptação para seus pesos, como função do erro da saída. Para tanto, determinou-se, com base em C, C^* = , C⁺ = [0 1]^T e, na seqüência, T = [1 1]^T. Portanto, pôde-se concluir que C^* = [1 1]^T.

A seguir, foram determinados os valores de L e P que satisfazem simultaneamente as igualdades (7)-(8), isto é a Hipótese 3, e alocam os autovalores da matriz Q em 6. Via um processo de tentativa e erro, que incluiu o uso da função ARE do MATLAB, determinou-se L = [64 10]^T e P = .

As condições iniciais do observador foram escolhidas como (0) = [-1, -1]^T, para se avaliar o desempenho do observador proposto em condições iniciais desfavoráveis. Os outros parâmetros usados na implementação de (15), (24)-(29) foram

O desempenho na observação de (58) é apresentado nas Figuras 1 e 2. Note que as simulações confirmam os resultados teóricos, isto é, o esquema proposto é estável e o erro de observação estado converge assintoticamente para zero.

7 CONCLUSÕES

Neste artigo foi proposta uma metodologia para observação adaptativa de sistemas não-lineares incertos com parâmetros variantes no tempo e sujeitos a distúrbios. Foi proposto um observador, baseado em uma parametrização neural e um ganho de realimentação dinâmico, com leis de adaptação para os parâmetros e pesos, que asseguraram a estabilidade do esquema e convergência assintótica do erro residual de observação. Um exemplo de simulação foi considerado para ilustrar a aplicação e desempenho do esquema proposto.

AGRADECIMENTOS

Os primeiro autor agradece à FAPESP, processos 02/13829-9 e 03/11199-0, e o segundo autor agradece ao CNPq/Pronex, processo 662015/1998-3, pelo suporte financeiro.

Artigo submetido em 21/09/2005

1a. Revisão em 19/08/2006

2a. Revisão em 24/01/2007

3a. Revisão em 06/11/2007

Aceito sob recomendação do Editor Associado Prof. Ivan Nunes da Silva

Bastin, G. & Gevers, M. R. (1988). Stable adaptive observers for nonlinear time-varying systems, IEEE Trans. Automatic Control, vol. 33, no. 7, pp. 650-658.
Cho, Y. M. & Rajamani, R. (1997). A systematic approach to adaptive observer synthesis for nonlinear systems, IEEE Trans. Automatic Control, vol. 42, no. 4, pp. 534-537.
Choi, J. Y. & Farrel, J. A. (2001). Adaptive observer backstepping control using neural networks, IEEE Trans. Neural Networks, vol. 12, no.5, pp. 1103-1112.
Ge, S. S., Hang, C. C., Lee, T. H. & Zhang, T. (2002) Stable Adaptive Neural Network Control, Kluwer academic publishers, Norwell, Massachusetts, USA.
Ioannou, P.A. & Sun, J. (1996). Robust Adaptive Control, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, USA.
Jagannathan, S. & Lewis, F. L. (1996). Identification on nonlinear dynamical systems using multilayered neural networks, Automatica, vol. 32, no. 12, pp. 1707-1712.
Kim, Y. H., Lewis, F. L. & Abdallah, C. T. (1997). A dynamic recurrent neural-network-based adaptive observer for a class of nonlinear systems, Automatica, vol. 33, no. 8, pp. 1539-1543.
Kosmatopoulos, E. B., Polycarpou, M. M., Christodoulou, M. A. & Ioannou, P. A. (1995). High-order neural network structures for identification of dynamical systems, IEEE Trans. Neural Networks, vol. 6, no. 2, pp. 442-431.
Lewis, F. L., Yesildirek, A. & Liu, K. (1996). Multilayer neural-net robot controller with guaranteed tracking performance, IEEE Trans. Neural Networks, vol. 7, no.2, pp. 388-399.
Luenberger, D.G. (1966). Observers for multivariable systems, IEEE Trans. Automatic Control, vol. 11, no. 2, p. 190-197.
Marino R. & Tomei, P. (1995). Nonlinear Control Design: Geometric, Adaptive and Robust, Prentice Hall International (UK) Limited, Redwood Books, Trowbridge, Wiltshire, Great Britain.
Marino, R., Santosuosso, G. L. & Tomei, P. (2001). Robust adaptive observers for nonlinear systems with bounded disturbances, IEEE Trans. Automatic Control, vol. 46, no. 6, p. 967-972.
Noble, B. & Daniel, J. W. (1977). Applied Linear Algebra, Prentice-Hall, Inc., Englewood Cliffs, New Jersey.
Polycarpou, M. M. & Ioannou, P. A. (1991). Identification and control of nonlinear systems using neural network models: design and stability analysis, Tech. Rep. 91-09-01, Dept. Elect. Eng. Syst., Univ. Southern Calif., Los Angeles.
Polycarpou, M. M. (1996). Stable adaptive neural control scheme for nonlinear systems, IEEE Trans. Automatic Control, vol. 41, no. 3, pp. 447-451.
Rajamani, R. (1995). Adaptive observers for active automotive suspensions: theory and experiment, IEEE Trans. Control System Technology, vol. 3, no. 1, pp. 86-93.
Rajamani, R. (1998). Observers for Lipschitz nonlinear systems, IEEE Trans. Automatic Control, vol. 43, no. 3, pp. 397-401.
Sanner, R. M. & Slotine, J. J. (1992). Stable recursive identification using radial basis function networks, Proceedings of the American Control Conference, Chicago, IL, pp. 1829-1833.
Song, Q. (1998). Robust training algorithms of multilayered neural networks for identification of nonlinear dynamical systems, IEE Proc.- Control Theory Appl., vol. 45, no. 1, pp. 41-46.
Vargas, J. A. R. & Hemerly, E. M. (1999). Robust neural adaptive observer for MIMO nonlinear systems, Proceeding of the 1999 IEEE International Conference on Systems, Man and Cybernetics, pp. 1084-1089.
Vargas, J. A. R. & Hemerly, E. M. (2005). Algoritmo para identificaçăo assintótica via APLS e sem conhecimento prévio de limitantes, Anais do VII Simpósio Brasileiro de Automaçăo Inteligente, Săo Luis, Maranhăo, Brasil, pp.1-6.
Wang, L. X. (1994). Adaptive Fuzzy System and Control: Design and Stability Analysis, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, USA.
Wang, W. & Gao, Z. (2003). A comparison study of advanced state observer design techniques, Proceedings of the American Control Conference, Denver, Colorado, USA, pp. 4754-4759.
Yu, W., Poznyak, A. S., & Li X. (2001). Multilayer dynamical neural networks for non-linear system on-line identification, International Journal of Control, vol. 74, no. 18, pp. 1858-1864.
Zhang, Q. & Benveniste, A. (1992). Wavelet networks, IEEE Trans. Neural Networks, vol. 3, no. 6, pp. 889-898.
Zhang, Q. (2002). Adaptive observer for multiple-input-multiple-output (MIMO) linear time-varying systems, IEEE Trans. Automatic Control, vol. 47, no. 3, pp. 525-529.
Zhu, R., Chai, T. & Shao, C. (1997). Robust nonlinear adaptive observer design using dynamical recurrent neural networks, Proceedings of the 1997 American Control Conference, Albuquerque, New Mexico, pp. 1096-1100.
Zhu, F. & Han, Z. (2002). A note on observers for Lipschitz nonlinear systems, IEEE Trans. Automatic Control, vol. 47, no. 10, pp. 1751-1754.

Datas de Publicação

Publicação nesta coleção
18 Abr 2008
Data do Fascículo
Mar 2008

Histórico

Recebido
21 Set 2005

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

[1] Bastin, G. & Gevers, M. R. (1988). Stable adaptive observers for nonlinear time-varying systems, IEEE Trans. Automatic Control, vol. 33, no. 7, pp. 650-658.

[2] Cho, Y. M. & Rajamani, R. (1997). A systematic approach to adaptive observer synthesis for nonlinear systems, IEEE Trans. Automatic Control, vol. 42, no. 4, pp. 534-537.

[3] Choi, J. Y. & Farrel, J. A. (2001). Adaptive observer backstepping control using neural networks, IEEE Trans. Neural Networks, vol. 12, no.5, pp. 1103-1112.

[4] Ge, S. S., Hang, C. C., Lee, T. H. & Zhang, T. (2002) Stable Adaptive Neural Network Control, Kluwer academic publishers, Norwell, Massachusetts, USA.

[5] Ioannou, P.A. & Sun, J. (1996). Robust Adaptive Control, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, USA.

[6] Jagannathan, S. & Lewis, F. L. (1996). Identification on nonlinear dynamical systems using multilayered neural networks, Automatica, vol. 32, no. 12, pp. 1707-1712.

[7] Kim, Y. H., Lewis, F. L. & Abdallah, C. T. (1997). A dynamic recurrent neural-network-based adaptive observer for a class of nonlinear systems, Automatica, vol. 33, no. 8, pp. 1539-1543.

[8] Kosmatopoulos, E. B., Polycarpou, M. M., Christodoulou, M. A. & Ioannou, P. A. (1995). High-order neural network structures for identification of dynamical systems, IEEE Trans. Neural Networks, vol. 6, no. 2, pp. 442-431.

[9] Lewis, F. L., Yesildirek, A. & Liu, K. (1996). Multilayer neural-net robot controller with guaranteed tracking performance, IEEE Trans. Neural Networks, vol. 7, no.2, pp. 388-399.

[10] Luenberger, D.G. (1966). Observers for multivariable systems, IEEE Trans. Automatic Control, vol. 11, no. 2, p. 190-197.

[11] Marino R. & Tomei, P. (1995). Nonlinear Control Design: Geometric, Adaptive and Robust, Prentice Hall International (UK) Limited, Redwood Books, Trowbridge, Wiltshire, Great Britain.

[12] Marino, R., Santosuosso, G. L. & Tomei, P. (2001). Robust adaptive observers for nonlinear systems with bounded disturbances, IEEE Trans. Automatic Control, vol. 46, no. 6, p. 967-972.

[13] Noble, B. & Daniel, J. W. (1977). Applied Linear Algebra, Prentice-Hall, Inc., Englewood Cliffs, New Jersey.

[14] Polycarpou, M. M. & Ioannou, P. A. (1991). Identification and control of nonlinear systems using neural network models: design and stability analysis, Tech. Rep. 91-09-01, Dept. Elect. Eng. Syst., Univ. Southern Calif., Los Angeles.

[15] Polycarpou, M. M. (1996). Stable adaptive neural control scheme for nonlinear systems, IEEE Trans. Automatic Control, vol. 41, no. 3, pp. 447-451.

[16] Rajamani, R. (1995). Adaptive observers for active automotive suspensions: theory and experiment, IEEE Trans. Control System Technology, vol. 3, no. 1, pp. 86-93.

[17] Rajamani, R. (1998). Observers for Lipschitz nonlinear systems, IEEE Trans. Automatic Control, vol. 43, no. 3, pp. 397-401.

[18] Sanner, R. M. & Slotine, J. J. (1992). Stable recursive identification using radial basis function networks, Proceedings of the American Control Conference, Chicago, IL, pp. 1829-1833.

[19] Song, Q. (1998). Robust training algorithms of multilayered neural networks for identification of nonlinear dynamical systems, IEE Proc.- Control Theory Appl., vol. 45, no. 1, pp. 41-46.

[20] Vargas, J. A. R. & Hemerly, E. M. (1999). Robust neural adaptive observer for MIMO nonlinear systems, Proceeding of the 1999 IEEE International Conference on Systems, Man and Cybernetics, pp. 1084-1089.

[21] Vargas, J. A. R. & Hemerly, E. M. (2005). Algoritmo para identificaçăo assintótica via APLS e sem conhecimento prévio de limitantes, Anais do VII Simpósio Brasileiro de Automaçăo Inteligente, Săo Luis, Maranhăo, Brasil, pp.1-6.

[22] Wang, L. X. (1994). Adaptive Fuzzy System and Control: Design and Stability Analysis, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, USA.

[23] Wang, W. & Gao, Z. (2003). A comparison study of advanced state observer design techniques, Proceedings of the American Control Conference, Denver, Colorado, USA, pp. 4754-4759.

[24] Yu, W., Poznyak, A. S., & Li X. (2001). Multilayer dynamical neural networks for non-linear system on-line identification, International Journal of Control, vol. 74, no. 18, pp. 1858-1864.

[25] Zhang, Q. & Benveniste, A. (1992). Wavelet networks, IEEE Trans. Neural Networks, vol. 3, no. 6, pp. 889-898.

[26] Zhang, Q. (2002). Adaptive observer for multiple-input-multiple-output (MIMO) linear time-varying systems, IEEE Trans. Automatic Control, vol. 47, no. 3, pp. 525-529.

[27] Zhu, R., Chai, T. & Shao, C. (1997). Robust nonlinear adaptive observer design using dynamical recurrent neural networks, Proceedings of the 1997 American Control Conference, Albuquerque, New Mexico, pp. 1096-1100.

[28] Zhu, F. & Han, Z. (2002). A note on observers for Lipschitz nonlinear systems, IEEE Trans. Automatic Control, vol. 47, no. 10, pp. 1751-1754.