Acessibilidade / Reportar erro

Identificação e controle de processos via desenvolvimentos em séries ortonormais. Parte A: identificação

Resumos

O presente artigo apresenta uma visão geral do estado da arte na área de identificação de sistemas utilizando modelos dinâmicos com estrutura desenvolvida através de bases de funções ortonormais, como as funções de Laguerre, Kautz ou funções ortonormais generalizadas. Discute-se as vantagens e possíveis limitações desse tipo de estrutura bem como os fundamentos matemáticos dos modelos correspondentes nos contextos de identificação linear, linear com incertezas paramétricas (identificação robusta) e não linear, incluindo uma revisão bibliográfica abrangente sobre o tema. Diferentes realizações de modelos com funções de base ortonormal, a saber, modelos lineares, de Volterra, fuzzy e neurais, são detalhadas e discutidas comparativamente em termos de capacidade de representação, parcimônia, complexidade de projeto e interpretabilidade. Aspectos práticos da identificação desses modelos são também apresentados e ilustrados através de dois casos de estudo envolvendo um processo simulado de polimerização isotérmica.

Modelagem; Bases de Funções Ortonormais; Laguerre; Kautz; GOBFs; Identificação Linear; Identificação Robusta; Identificação Não Linear; Modelos de Volterra; Modelos Fuzzy; Modelos Neurais


In this paper, an overview about the identification of dynamic systems using orthonormal basis function models, such as those based on Laguerre and Kautz functions, is presented. The mathematical foundations of these models as well as their advantages and limitations are discussed within the contexts of linear, robust, and nonlinear identification. The discussions comprise a broad bibliographical survey on the subject and a comparative analysis involving some specific model realizations, namely, linear, Volterra, fuzzy, and neural models within the orthonormal basis function framework. Theoretical and practical issues regarding the identification of these models are also presented and illustrated by means of two case studies related to a polymerization process.

Modeling; Orthonormal Basis Functions; Laguerre; Kautz; GOBFs; Linear Identification; Robust Identification; Nonlinear Identification; Volterra Models; Fuzzy Models; Neural Networks


IDENTIFICAÇÃO E CONTROLE

Identificação e controle de processos via desenvolvimentos em séries ortonormais. Parte A: identificação

Ricardo J. G. B. CampelloI; Gustavo H. C. OliveiraII; Wagner C. AmaralIII

ISCC/ICMC/USP CP 668 CEP 13560-970 São Carlos - SP, Brasil campello@icmc.usp.br

IIPPGEPS/CCET/PUCPR Rua Imaculada Conceição 1155 CEP 80215-901 Curitiba - PR, Brasil gustavo.oliveira@pucpr.br

IIIDCA/FEEC/UNICAMP CP 6101 CEP 13083-970 Campinas - SP, Brasil wagner@dca.fee.unicamp.br

RESUMO

O presente artigo apresenta uma visão geral do estado da arte na área de identificação de sistemas utilizando modelos dinâmicos com estrutura desenvolvida através de bases de funções ortonormais, como as funções de Laguerre, Kautz ou funções ortonormais generalizadas. Discute-se as vantagens e possíveis limitações desse tipo de estrutura bem como os fundamentos matemáticos dos modelos correspondentes nos contextos de identificação linear, linear com incertezas paramétricas (identificação robusta) e não linear, incluindo uma revisão bibliográfica abrangente sobre o tema. Diferentes realizações de modelos com funções de base ortonormal, a saber, modelos lineares, de Volterra, fuzzy e neurais, são detalhadas e discutidas comparativamente em termos de capacidade de representação, parcimônia, complexidade de projeto e interpretabilidade. Aspectos práticos da identificação desses modelos são também apresentados e ilustrados através de dois casos de estudo envolvendo um processo simulado de polimerização isotérmica.

Palavras-Chave: Modelagem, Bases de Funções Ortonormais, Laguerre, Kautz, GOBFs, Identificação Linear, Identificação Robusta, Identificação Não Linear,Modelos de Volterra, Modelos Fuzzy, Modelos Neurais.

ABSTRACT

In this paper, an overview about the identification of dynamic systems using orthonormal basis function models, such as those based on Laguerre and Kautz functions, is presented. The mathematical foundations of these models as well as their advantages and limitations are discussed within the contexts of linear, robust, and nonlinear identification. The discussions comprise a broad bibliographical survey on the subject and a comparative analysis involving some specific model realizations, namely, linear, Volterra, fuzzy, and neural models within the orthonormal basis function framework. Theoretical and practical issues regarding the identification of these models are also presented and illustrated by means of two case studies related to a polymerization process.

Keywords: Modeling, Orthonormal Basis Functions, Laguerre, Kautz, GOBFs, Linear Identification, Robust Identification, Nonlinear Identification, Volterra Models, Fuzzy Models, Neural Networks.

1 INTRODUÇÃO

A crescente complexidade dos processos de produção e a demanda por alta eficiência em plantas industriais impõem restrições cada vez maiores aos sistemas de controle associados. Com o objetivo de aprimorar o desempenho desses sistemas, várias estratégias de controle avançado têm sido propostas. Dentre as mais bem sucedidas, destacam-se aquelas que utilizam modelos matemáticos dinâmicos dos processos a serem controlados, como as estratégias de controle preditivo (Model Based Predictive Controllers - MBPC ou MPC) (Garcia et al., 1989; Soeterboek, 1992; Clarke, 1994; Camacho and Bordons, 1999; Henson, 1998; Allgower and Zheng, 2000; Oliveira et al., 2007).. Nessas estratégias, o modelo faz um papel crucial ao prever o comportamento dinâmico do processo e assim permitir a tomada de decisão por parte do controlador de forma antecipativa e com base em critérios de otimalidade.

Modelos de sistemas dinâmicos são usualmente construídos segundo a bem conhecida estrutura (N)ARX - (Nonlinear) Auto-Regressive with eXogenous inputs - em que a saída do sistema em um dado instante de tempo discreto é representada utilizando amostras passadas dos seus sinais de entrada e saída (E/S) (Sjöberg et al., 1995; Nelles, 2001; Campello and Oliveira, 2007), como nos modelos polinomiais (Leontaritis and Billings, 1985). Embora essa abordagem possua uma série de propriedades interessantes, tal como permitir representações parcimoniosas mesmo de sistemas instáveis (memória infinita), além de outras vantagens discutidas, por exemplo, em (Aguirre et al., 2002; Corrêa and Aguirre, 2004), um dos seus principais problemas é que a característica auto-regressiva em geral leva a uma elevada sensibilidade à escolha da ordem dos modelos e causa a recursão de erros que podem comprometer a qualidade de previsão dos mesmos, especialmente em horizontes de previsão longos. Essa característica é indesejada em determinadas situações práticas, particularmente em aplicações de controle preditivo. Por esta razão, estruturas alternativas para a modelagem de sistemas dinâmicos têm sido investigadas.

Uma abordagem de particular interesse para contornar o problema mencionado acima é a utilização de modelos sem realimentação de saída (Nelles, 2001). A subcategoria mais conhecida dentro desta classe é constituída pelos modelos com estrutura (N)FIR - (Nonlinear) Finite Impulse Response - em que a saída do sistema em um dado instante de tempo discreto é representada utilizando amostras passadas apenas dos seus sinais de entrada (Sjöberg et al., 1995; Nelles, 2001; Campello and Oliveira, 2007). A ausência de recursão de saída nesses modelos, no entanto, possui um preço. Trata-se da quantidade elevada de termos no vetor de regressão, especialmente na representação de sistemas com dinâmicas (de tempo discreto) lentas. A quantidade de termos de regressão é proporcional à quantidade de parâmetros desconhecidos do modelo, sendo que esta relação é exponencial para a grande maioria dos modelos não lineares de propósito geral, como será visto em seções subseqüentes. Uma estratégia para contornar esse problema é utilizar uma outra subcategoria de modelos sem realimentação de saída, a dizer, aqueles dotados de estrutura (N)OBF - (Nonlinear) Orthonormal Basis Functions (Sjöberg et al., 1995; Nelles, 2001; Campello and Oliveira, 2007).

Modelos (N)OBF possuem estrutura desenvolvida através de bases de funções ortonormais (Ninness and Gustafsson, 1995; Ninness and Gustafsson, 1997), como as funções de Laguerre e Kautz (Broome, 1965;Wahlberg, 1991;Wahlberg, 1994; Wahlberg and Mäkilä, 1996) ou as funções ortonormais generalizadas (Generalized Orthonormal Bases of Functions - GOBFs) [,,]. Essas funções têm sido amplamente utilizadas no contexto de modelagem e controle de sistemas lineares e não lineares (e.g. ver (Heuberger et al., 2005; Oliveira et al., 2007) e referências inclusas), especialmente porque os modelos dinâmicos correspondentes exibem várias características desejáveis, tais como (Dumont and Fu, 1993; Nelles, 2001; Heuberger et al., 2005): i) Ausência de realimentação de saída e, conseqüentemente, de erros de previsão, o que leva a modelos mais precisos, ao desacoplamento natural das múltiplas saídas em modelos multivariáveis e a um conjunto de propriedades estatísticas favoráveis à estimação numérica daqueles modelos lineares nos parâmetros via algoritmo de mínimos quadrados; ii) Não é necessário conhecer os termos passados relevantes dos sinais de E/S do sistema, cujo procedimento de determinação não é trivial, particularmente no caso não linear; iii) É possível aumentar a capacidade de representação dos modelos meramente incrementando o número de funções ortonormais na base; iv) É garantido que a representação de um sistema estável é também estável; v) Robustez a estimativas pouco precisas do atraso de transporte do sistema, tolerância a dinâmicas não modeladas e sensibilidade reduzida aos parâmetros estimados.

O presente trabalho apresenta uma visão geral do estado da arte na área de identificação e controle de sistemas dinâmicos através de modelos do tipo (N)OBF. Por simplicidade e sem perda de generalidade, apenas o caso SISO (Single Input - Single Output) será considerado. O trabalho está separado em duas partes principais: a) identificação; e b) controle. A parte de identificação é descrita no presente artigo, estando organizada conforme será apresentado a seguir. A parte de controle, por sua vez, é abordada como continuação, em um segundo artigo (Oliveira et al., 2007).

A seção 2 deste artigo discute o problema de identificação de sistemas dinâmicos lineares através de modelos com estrutura OBF, incluindo a identificação robusta de modelos com incertezas paramétricas estruturadas. A seção 3 aborda a identificação de sistemas não lineares, apresentando diferentes possíveis realizações de modelos com estrutura NOBF. A seção 4 discute comparativamente as diferentes abordagens reportadas nas seções anteriores, enquanto a seção 5 apresenta uma série de alternativas para o projeto das bases de funções ortonormais que equipam os modelos correspondentes. Na seção 6, descreve-se dois casos de estudo envolvendo um processo de polimerização isotérmica e, finalmente, apresentam-se as conclusões na seção 7.

2 IDENTIFICAÇÃO DE SISTEMAS LINEARES

A idéia por trás dos modelos dinâmicos lineares com estrutura OBF é fundamentada na propriedade de completude das bases ortonormais de Laguerre, Kautz e GOBFs. Essa propriedade garante que qualquer função do espaço l2[0,¥) pode ser aproximada com precisão arbitrária por uma combinação linear de funções de uma dessas bases. Em outras palavras, para qualquer função h(k): ® Â quadraticamente somável em [0,¥), isto é, h(k)2 < ¥, existe um inteiro n > 0 tal que para qualquer > 0 tem-se

onde { f1(k), ...,fn(k) } é o conjunto com as n primeiras funções ortonormais da base e c1,..., cnsão escalares. Portanto, a representação (k) = ci fi(k) converge para h(k), sendo exata para n infinito, ou seja

Para qualquer inteiro j > 0 tem-se de (2) que

e utilizando a propriedade de ortonormalidade das funções, isto é

tem-se de (3) que os coeficientes da série são dados por

A idéia da representação OBF em modelos dinâmicos é desenvolver a resposta ao impulso do sistema através de uma base de funções ortonormais. Esse desenvolvimento é possível para sistemas dinâmicos (BIBO) estáveis, cuja resposta ao impulso é absolutamente (e portanto quadraticamente) somável. É importante lembrar que sistemas com integradores possuem resposta ao impulso com energia infinita, e portanto não se enquadram no requerimento acima. Como em geral a presença de integradores em um sistema real é conhecida, pode-se modelar a variação da saída do sistema ao invés do seu valor absoluto, o que é equivalente a retirar o(s) integrador(es) da malha de identificação.

A equação de convolução que descreve um sistema dinâmico linear, causal, invariante no tempo e considerado em repouso para instantes de tempo negativo, é dada por y(k) = h(m) u(k-m), onde u(k) é a entrada no instante discreto k, y(k) é a saída naquele instante e h(m) é a resposta ao impulso do sistema. O desenvolvimento aproximado da função de resposta ao impulso h em n funções ortonormais é realizado de forma tal que o modelo de convolução é representado como:

onde o termo li(k) é a convolução da entrada u com a i-ésima função ortonormal fi no instante k. Como cada função da base ortonormal pode ser associada, a partir da transformada Z, a uma função de transferência que define um filtro linear, o termo li é simplesmente o resultado de uma filtragem do sinal de entrada u, isto é, li(k) = Fi(q) u(k), onde Fi(q) é a função de transferência discreta da i-ésima função ortonormal representada no operador deslocamento q, sendo q u(k) u(k+q). O conjunto de funções de transferência dos filtros associados à bem conhecida base de Laguerre (Wahlberg, 1991), por exemplo, é dado por:

onde p Î { Â: | p |< 1 } é o pólo estável que parametriza as funções ortonormais. Note que para p = 0 obtém-se a base Fi(z) = z-i ou, equivalentemente, Fi(q) = q-i, o que implica li(k) = q-iu(k) = u(k-i). Logo, para p = 0 o modelo em (6) pode ser rescrito como (k) = ci u(k-i), isto é, o modelo clássico FIR (Ljung, 1999). Tem-se, portanto, que a base ortonormal FIR é um caso particular da base de Laguerre. A base FIR, porém, geralmente requer quantidades elevadas de termos n para proporcionar aproximações precisas, especialmente na representação de sistemas com dinâmicas (de tempo discreto) predominantemente lentas. A inserção de dinâmica nos filtros de Laguerre em (7), através de um pólo p não nulo, ameniza significativamente esse problema ao incorporar na base conhecimento a priori a respeito do comportamento dinâmico do sistema (Ninness and Gustafsson, 1995; Ninness and Gustafsson, 1997). De fato, quanto mais próximo o pólo estiver da dinâmica dominante do sistema, menor será a quantidade de funções na base necessárias para aproximar o sistema com dada precisão.

A base de Kautz (Wahlberg, 1994) é uma generalização da base de Laguerre onde as funções são parametrizadas por um par de pólos complexos conjugados. Por esta razão, a base de Kautz requer um número menor de funções para representar sistemas com dinâmicas dominantes mal amortecidas (oscilatórias). As bases de Laguerre e Kautz são realizações particulares das bases ortonormais generalizadas (Van den Hof et al., 1995; Ninness and Gustafsson, 1997), onde as funções não são necessariamente parametrizadas apenas por um único pólo ou par de pólos. Em função da flexibilidade adicional resultante da incorporação de múltiplos modos, as bases generalizadas podem requerer um número menor de funções para a representação de um dado sistema. Por outro lado, requerem uma maior quantidade de informação a priori sobre as suas dinâmicas dominantes. Por esta razão, as bases de Laguerre e Kautz ainda são mais amplamente difundidas e adotadas na literatura (e.g. ver (da Rosa et al., 2007) e referências inclusas); em especial a primeira, que será considerada nos desenvolvimentos subseqüentes do presente trabalho.

As funções ortonormais são recursivas, isto é, a i-ésima função pode ser escrita em função da (i-1)-ésima. Logo, é possível escrever a dinâmica do conjunto de filtros ortonormais através de uma equação de estados (Oliveira, 1997). Nesse caso, o modelo em (6) pode ser representado em espaço de estados, como:

onde o vetor de estados l(k) = [ l1(k) ... ln(k) ]T é constituído pelas saídas dos filtros ortonormais e é o mapeamento estático (equação de observação) dado pela combinação linear desses estados, isto é

A matriz A e o vetor b na equação (8) dependem apenas da base de funções ortonormais. No caso da base de Laguerre tem-se (Dumont and Fu, 1993; Oliveira, 1997):

onde p é o pólo de Laguerre. O modelo com dinâmica de Laguerre é ilustrado na Figura 1, onde se observa a recursão dos estados através da disposição em cascata dos filtros, representados no plano z. Nota-se que, uma vez escolhido o pólo de Laguerre (ver seção 5), o modelo é completamente determinado pelos coeficientes c(·) da série em (10). Se a resposta ao impulso do sistema estiver disponível, esses coeficientes podem ser calculados analiticamente através da equação (5)1 1 Note que a resposta ao impulso de um sistema BIBO estável necessariamente se anula ou tende assintoticamente a zero com o tempo, o que viabiliza o truncamento da equação (5). . Essa abordagem não paramétrica, no entanto, embora seja simples e matematicamente fundamentada, pode não ser eficaz em problemas práticos. A razão é que a resposta ao impulso do sistema, quando disponível, pode conter ruído e/ou dinâmicas não modeladas. Uma abordagem mais eficiente é considerar os coeficientes c(·) como parâmetros a serem estimados numericamente utilizando dados de E/S do sistema, o que pode ser realizado de forma simples utilizando algoritmos de estimação linear (e.g. mínimos quadrados) (Ljung, 1999; Aguirre, 2004).


Finalmente, é importante salientar que, embora nenhum atraso de transporte esteja explicitamente representado na descrição acima do modelo, as funções ortonormais são capazes de representar dinâmicas com essa característica (Mäkilä, 1990; Fu and Dumont, 1993). Não obstante, pode-se incorporar explicitamente ao modelo qualquer informação aproximada disponível sobre o atraso real do sistema, o que permite uma redução no número de funções e respectivos filtros necessários para modelá-lo com uma dada precisão. Para tanto, basta substituir u(k) por u(k-td) na equação (8), onde td é o atraso estimado.

2.1 Identificação Robusta

Muitas vezes um único modelo linear não é capaz de representar adequadamente um sistema complexo. Uma das possíveis razões é a presença de perturbações externas, que podem inviabilizar a obtenção de um conjunto único de parâmetros que garantam a um determinado modelo uma representação fiel do sistema de interesse. Nestes casos, um procedimento é a incorporação de incertezas associadas aos parâmetros do modelo. Modelos com incertezas paramétricas são a base de diversos algoritmos de controle denominados de Robustos. Em modelos com funções ortonormais, como os representados pelas equações (8) a (10), tem-se:

Definindo ci(ei) como os parâmetros incertos do modelo, chega-se a:

onde eé um vetor cujo i-ésimo elemento é ei, que por sua vez, representa a incerteza relativa ao parâmetro ci.

Na seqüencia, duas abordagens para estimação robusta dos parâmetros do modelo com bases ortonormais e suas incertezas são apresentadas (Oliveira, 1997; Oliveira et al., 1998). A primeira assume a medida de um conjunto de dados de entrada e saída do processo e a utilização de métodos de identificação robusta baseados na abordagem UBBE (Unknown But Bounded Error) (Milanese and Belforte, 1982). Já a segunda assume o conhecimento a priori da incerteza do modelo associada com a resposta ao impulso do processo. Em (Moreira, 2006), um algoritmo baseado nesta segunda abordagem, para cálculo dos limites de incerteza no modelo, é apresentado.

No contexto de controle robusto, usualmente a representação das incertezas no modelo é aproximada por formas geométricas no espaço formado pelos parâmetros, e.g., um politopo, um ortotopo ou um elipsóide (Walter and Piet-Lahanier, 1990; Favier and Arruda, 1996). As abordagens aqui mencionadas representam o espaço de incertezas paramétricas como um ortotopo, isto é, a incerteza relativa ao modelo está associada a um valor mínimo e máximo para cada parâmetro, ou: ci(ei) Î [ci,min,ci,max]. O problema de identificação robusta com modelos de Laguerre usando aproximações elipsoidais é relatado em (Wahlberg and Ljung, 1992).

A formulação do problema de identificação robusta UBBE é mostrada a seguir. Seja o modelo (13) de um dado processo. O erro da saída deste modelo em relação à saída do processo, em dado instante de tempo k e para um dado conjunto de parâmetros ci, é definido por:

onde y(k) é a saída medida do processo e (k) é a saída do modelo para o conjunto de parâmetros ci. Assuma que e(k) satisfaça a:

onde emin(k) e emax(k) são limites (inferior e superior) para o erro do modelo no instante k. Em princípio, esses limites são assumidos conhecidos, ou seja, passíveis de determinação. No entanto, pode-se arbitrá-los, com os seguintes riscos: i) o problema de identificação robusta dos parâmetros não ter solução caso os limites sejam subestimados; ou ii) a solução ser excessivamente conservativa para limites superestimados (conservativos).

Dadas as considerações acima e um conjunto inicial S*, definido de forma a conter todos os possíveis valores para os parâmetros ci, o problema de identificação robusta consiste em encontrar um sub-conjunto de S*, dado por S, contendo valores para ci que sejam consistentes com as equações (13), (15) e (16). O resultado deste problema é a identificação de um conjunto S de valores admissíveis para os parâmetros ci do modelo (13).

Seja N o número de medidas de entrada u(k) e saída y(k) disponíveis do processo. A partir da representação em estados da base ortonormal2 2 Equações (8), (11) e (12) para a base de Laguerre. , pode-se calcular o vetor l(k) para k = 1,...,N. Portanto, utilizando o conjunto de medidas disponíveis e supondo uma representação exata do politopo formado pelo conjunto S, tem-se que:

e c(e) em (14) representa então todos os vetores c tal que c Î S.

Baseado na definição do conjunto S em (17), tem-se que a obtenção dos limites de incerteza dos parâmetros de c(e) pode ser feita utilizando diversos algoritmos de identificação robusta descritos na literatura como, por exemplo, (Milanese and Belforte, 1982; Norton, 1990; da Silva, 1995). Um problema com essa abordagem é que o conjunto S definido em (17) forma um politopo cuja determinação pode se tornar muito complexa à medida que o número de medidas aumenta. Para contornar esse problema, um algoritmo para determinar uma aproximação na forma de um ortotopo O limitante exterior a S, S Ì O, é proposta em (Milanese and Belforte, 1982). Neste algoritmo, assume-se |e(k)| < emax (constante) e tem-se que cada limite ci, min e ci, max do intervalo de incerteza do parâmetro ci(ei) é associado a um problema de programação linear, onde as restrições são o domínio de pertinência de c(e), i.e. S. Assim, o cálculo do ortotopo O exterior a S requer a resolução de 2n problemas de programação linear, cada um com 2N restrições.

A segunda abordagem de identificação robusta considerada neste trabalho é apresentada a seguir (Oliveira, 1997). Seja um conjunto de M realizações da resposta ao impulso que representa a incerteza sobre o processo, isto é, hm(k), m = 1,...,M. Assuma que o espaço formado pelos parâmetros incertos do modelo é um ortotopo; portanto, cada parâmetro é dado por:

com |ei| < 1, ou seja, ci(ei) Î [ci,min, ci,max]. Através da equação (5), tem-se que cada resposta ao impulso está associada a um modelo, isto é:

Portanto, de todos os elementos ci,m, m = 1,...,M, chega-se aos limites [ci,min, ci,max] para cada parâmetro i como:

É importante destacar que as características positivas da identificação de modelos com estrutura OBF citadas anteriormente permanecem válidas no contexto de identificação robusta apresentado nesta seção. Uma delas é a não necessidade da definição a priori da ordem e atraso do processo, o que representa uma vantagem em relação aos modelos com estrutura ARX ou ARMAX. Além disto, em relação aos modelos com estrutura FIR, a diminuição do número de parâmetros a identificar reduz a complexidade do algoritmo de identificação robusta.

3 IDENTIFICAÇÃO DE SISTEMAS NÃO LINEARES

A justificativa do modelo OBF linear apresentado na seção 2, onde o mapeamento estático em (9) é dado por uma combinação linear dos seus argumentos, advém do desenvolvimento da resposta ao impulso do sistema através de uma base ortonormal. Uma questão importante é se é possível simplesmente substituir o mapeamento linear por um mapeamento não linear de forma a obter um modelo capaz de representar também dinâmicas não lineares. Nesse caso o modelo seria descrito por uma dinâmica linear que relaciona a entrada u(k) aos estados ortonormais li(k) seguida de um mapeamento estático entre esses estados e a saída (k), ou seja, um modelo do tipo Wiener (Campello and Oliveira, 2007). Nessa seção são discutidas implementações não lineares para o operador que são de particular interesse no presente contexto porque, entre outras razões, podem ser justificadas (interpretadas) sob o ponto de vista matemático.

A forma do mapeamento estático determina uma realização específica de modelo com estrutura (N)OBF. As realizações não lineares consideradas nesse trabalho podem ser todas descritas utilizando uma formulação unificada onde esse mapeamento é representado de forma linear nos parâmetros, como:

sendo z Î Âm×1 um vetor de parâmetros a serem estimados e l(k) Î Âm×1 um vetor de regressão que depende apenas dos estados ortonormais l(k). O modelo linear discutido na seção anterior, por exemplo, pode ser colocado nessa forma simplesmente fazendo m = n, z = [c1...cn]T e l(k) = l(k). Alternativamente, pode-se inserir um termo aditivo c0 capaz de representar nível constante não nulo na saída do sistema, bastando para isso fazer z = [c0c1 ... cn]T e l(k) = [ 1 l(k)T ]T. Nesse caso o modelo é denominado afim e o número de elementos no vetor de parâmetros a serem estimados é m = n + 1.

3.1 Modelos de Volterra

Modelos de Volterra de tempo discreto assumem que o sistema admite a seguinte descrição polinomial de ordem M (Schetzen, 1980; Rugh, 1981; Doyle III et al., 2002):

onde u, y e hm são a entrada, a saída e um kernel (núcleo) de m-ésimo grau, respectivamente, sendo m a quantidade de elementos a partir da qual o kernel hm é assumido nulo em qualquer dimensão. Essa representação é claramente uma generalização de M-ésima ordem do modelo linear tipo FIR discutido na seção 2, sendo o kernel hm uma generalização de m-ésima dimensão da função de resposta ao impulso daquele modelo. É também uma realização específica de entrada-saída do tipo y(k) = ( {u(t)}= -¥), onde é um operador não linear. Boyd e Chua (Boyd and Chua, 1985) mostraram que o modelo em (22) pode aproximar com precisão arbitrária qualquer sistema que admita descrição de entrada-saída através de um operador contínuo e com fading memory3 3 Sistemas com fading memory são aqueles para os quais a resposta a uma dada excitação de entrada se anula ou decresce de forma rápida o suficiente para que não seja significativa após um dado período finito de tempo, o que basicamente remete a sistemas estáveis com estado estacionário único. , desde que a entrada u seja limitada inferior e superiormente. Esses requerimentos abrangem uma ampla classe de sistemas reais.

O problema de identificação de sistemas não lineares utilizando modelos de Volterra remete imediatamente ao problema de estimação dos kernels do modelo, que tem sido investigado por décadas (Eykhoff, 1974; Billings, 1980; Schetzen, 1980; Rugh, 1981; Doyle III et al., 2002). A principal dificuldade é que os kernels são, em princípio, funções não parametrizadas que só podem ser mensuradas se suas contribuições individuais puderem ser separadas da resposta total do sistema (Schetzen, 1980). Uma abordagem simples e direta pode ser obtida se cada elemento de cada um dos kernels for tratado como um parâmetro independente a ser estimado (Doyle III et al., 2002). Nesse caso, o modelo de Volterra (22) torna-se linear nesses parâmetros e algoritmos de estimação clássicos podem ser aplicados. Essa abordagem, no entanto, usualmente torna o modelo sobre-parametrizado. Logo, é importante reduzir sua complexidade antes do procedimento de estimação de forma a melhorar o seu condicionamento numérico e reduzir a variância do estimador. Uma estratégia de particular interesse para lidar com esse problema, originalmente sugerida por Wiener (Wiener, 1958), é o desenvolvimento dos kernels de Volterra através de funções de base ortonormal, conforme discutido a seguir.

3.1.1 Modelo OBF-Volterra

Por hipótese, os kernels hm em (22) são tais que hm(k1,...,km) = 0 para ki > m ("i Î {1,...,m }). Os kernels são, portanto, absolutamente somáveis em [0,¥), o que significa que o modelo é estável. Logo, esses kernels podem ser desenvolvidos em funções de base ortonormal. A seguir assume-se, por simplicidade e sem perda de generalidade, que todos os kernels são desenvolvidos através de uma mesma base de funções. Nesse caso, o desenvolvimento m-dimensional do kernel de grau m qualquer é dado por (Schetzen, 1980):

onde fi é a i-ésima função ortonormal da base e c(·) são os coeficientes do desenvolvimento, dados por:

Note que para o kernel de 1o grau (m = 1) o desenvolvimento acima é equivalente ao desenvolvimento da resposta ao impulso do modelo linear de convolução visto na seção 2.

Das equações (22) e (23), lembrando que hm(k1,...,km) = 0 para ki > m, pode-se rescrever o modelo de Volterra como:

onde li é a saída do i-ésimo filtro ortonormal (i.e. o i-ésimo estado), dado por li(k) = fi(t)u(k-t). Por razões práticas, os modelos de 2a ordem (M = 2) são aqueles usualmente adotados tanto em problemas de natureza acadêmica como em problemas reais (Billings, 1980; Dumont and Fu, 1993). Ainda por razões práticas, os desenvolvimentos dos kernels de 1o e 2o grau são truncados em quantidades n1 e n2 de funções ortonormais, respectivamente. Nesse caso, o modelo é reescrito como:

onde c0 é um coeficiente de ordem zero adicional inserido apenas para a representação de eventual nível constante não nulo na saída do sistema. Note que, para fins computacionais, os coeficientes c(·) podem ser considerados como parâmetros a serem estimados numericamente. Logo, uma vez que qualquer par de coeficientes ci,je cj,i multiplicam o mesmo fator li(k)lj(k) no termo de 2a ordem, ambos os coeficientes podem ser representados através de um único parâmetro a ser estimado, conforme previsto na equação (26).

Considerando portanto os coeficientes c(·) como parâmetros a serem estimados, o modelo (26) pode ser rescrito na forma em (9) e (21) definindo os vetores l(k) e z em (21) como:

sendo a ordem da dinâmica de estados em (8) dada por n = max{n1,n2}. Nesse caso, o número de parâmetros do modelo é dado por m = ( + n2 + 2n1 + 2)/2.

3.2 Modelos Fuzzy TS

Os modelos fuzzy do tipo Takagi-Sugeno (TS) são constituídos por um conjunto de M regras (implicações) do seguinte formato (Takagi and Sugeno, 1985; Yager and Filev, 1994; Babuška, 1998):

onde Ri denota a i-ésima regra, xj Î XjÌ Â (j = 1,...,n) são as variáveis de entrada (variáveis da premissa), y Î Y Ì Â é a variável de saída, fi(i = 1,..., M) são funções que relacionam as entradas do modelo com sua saída e são conjuntos fuzzy definidos sobre os universos de discurso Xj das respectivas variáveis, ou seja, : Xj® [0,1].

A inferência de um valor de saída a partir de um conjunto específico de valores de entrada é simplesmente calculada como a média ponderada das saídas individuais de cada regra, como segue:

onde wi é o nível de ativação (firing weight) da i-ésima regra, dado por:

Sugeno e seus colaboradores (Takagi and Sugeno, 1985; Sugeno and Kang, 1986; Sugeno and Kang, 1988; Sugeno and Tanaka, 1991) propuseram originalmente a utilização de funções afins nos conseqüentes das regras, ou seja:

Essa escolha permite uma interpretação matemática simples do modelo como uma interpolação de diferentes modelos locais afins e implica que a saída em (30) é linear nos parâmetros (i = 1,...,M). Logo, esses parâmetros podem ser estimados utilizando algoritmos de estimação linear.

Um exemplo de um modelo TS estático com uma única variável de entrada e três regras é ilustrado na Figura 2. As regras do modelo são dadas abaixo:


onde Pequena, Média e Grande são rótulos lingüísticos associados a conjuntos fuzzy definidos sobre o universo de discurso da variável de entrada, conforme ilustrado na Figura 2. Esses conjuntos determinam, através da equação (31), o nível (e conseqüentemente a região) de ativação de cada regra, isto é, o peso de cada modelo local no cálculo ponderado da saída dado pela equação (30).

Modelos TS dinâmicos possuem exatamente a mesma formulação descrita acima, exceto que os modelos locais são dinâmicos ao invés de estáticos. Em princípio, os modelos locais podem possuir qualquer estrutura no que se refere à sua topologia dinâmica. Para modelos locais lineares com estrutura FIR, por exemplo, basta redefinir as variáveis da premissa como x1 = u(k-1), ..., xn = u(k-n), onde u(k) é a entrada do sistema dinâmico no instante k.

3.2.1 Modelos OBF-TS

Um caso particular no contexto de modelos TS dinâmicos é obtido utilizando modelos locais com estrutura OBF (Nelles, 2001; Campello, 2002). Nesse caso, as entradas do modelo TS são dadas pelas saídas do conjunto de filtros ortonormais, isto é, x1 = l1(k), ..., xn = ln(k), o que equivale a implementar o operador em (9) e (21) através de um modelo TS. As regras do modelo assumem portanto a forma4 4 Por simplicidade assume-se em () que os modelos locais são lineares (afins) e que possuem todos a mesma ordem n, mas ambas as hipóteses podem ser relaxadas no caso mais geral. :

e a saída é rescrita a partir de (30) como:

onde wi é rescrito de (31) como

O modelo OBF-TS acima pode ser facilmente rescrito na forma geral dada pelas equações (9) e (21). Para tanto, basta definir os vetores z e l(k) em (21) como:

onde g(k) = 1 / wi é o termo de normalização da equação (35). Nesse caso, assumindo que os conjuntos fuzzy das regras são determinados a priori (e.g. através de técnicas de fuzzy clustering (Babuška, 1998)), o número de parâmetros do modelo é dado por m = M(n+1).

Duas questões fundamentais surgem quando implementamos o mapeamento na Figura 1 de forma alternativa àquelas discutidas em seções anteriores para os casos linear e Volterra: A interpretação matemática do modelo resultante e a sua capacidade de representação. No caso do modelo TS descrito acima, a interpretação matemática é evidente. Trata-se de uma interpolação de M diferentes modelos OBF lineares (afins) que compartilham a mesma dinâmica de estados (e.g. de Laguerre). Em (Campello, 2002; Campello and Amaral, 2002) propôs-se um modelo ainda mais geral, denominado Modelo OBF-TS Generalizado, onde os modelos OBF locais possuem representações de estado independentes, isto é, cada modelo pode possuir um conjunto de filtros ortonormais parametrizado em uma base diferente de funções. Essa arquitetura é mais flexível no sentido de permitir a representação de dinâmicas não lineares complexas através de um conjunto menor de parâmetros, mas está além do escopo do presente trabalho.

No que diz respeito à capacidade de representação dos modelos OBF-TS, também se dispõe de um resultado (Campello, 2002; Campello, Meleiro and Amaral, 2004) que toma como ponto de partida a capacidade de aproximação universal dos sistemas fuzzy (Wang and Mendel, 1992; Zeng and Singh, 1994; Zeng and Singh, 1995;Kosko, 1997) e a capacidade de representação dos modelos de Volterra, formalizada no trabalho de (Boyd and Chua, 1985) (conforme discutido na seção 3.1). Esse resultado mostra que os modelos OBF-TS podem aproximar com precisão arbitrária qualquer sistema dinâmico não linear de tempo discreto que seja causal e admita representação de entrada-saída através de um operador contínuo e com fading memory, desde que a entrada seja limitada em um intervalo fechado. É importante mencionar que a hipótese de entrada limitada é essencial para a utilização de qualquer modelo fuzzy ou neural, independente da sua configuração dinâmica, uma vez que essa hipótese é necessária para garantir domínios de entrada compactos para esses modelos. Essa hipótese também não é restritiva no contexto de engenharia.

3.2.2 Caso Particular: OBF-RBF

Assumindo que o conseqüente de cada regra (modelo local) em (34) é dado apenas pelo termo constante da relação, isto é, y(k) = , pode-se reescrever os vetores em (37) e (38) como:

Assumindo ainda que os conjuntos fuzzy das regras são Gaussianos, recai-se em um caso especial do modelo TS que coincide, exceto pelo fator de normalização g(k) (que não altera a análise porque pode ser incorporado ao vetor de parâmetros), com a formulação de um tipo particular de rede neural, a rede neural Radial Basis Function - RBF (Broomhead and Lowe, 1988; Haykin, 1999). Essa mesma equivalência é verificada também para modelos fuzzy com estrutura relacional simplificada (Campello and Amaral, 1999; Campello, 2002). Maiores detalhes sobre a equivalência entre diferentes classes de modelos fuzzy e redes neurais podem ser encontrados em (Hunt et al., 1996; Cho and Wang, 1996).

Modelos dinâmicos NOBF com mapeamento estático (Figura 1) do tipo RBF foram introduzidos em (Oliveira et al., 1999; Campello et al., 1999). Dado que as redes RBF também são aproximadores universais (Haykin, 1999; Braga et al., 2000), a capacidade de aproximação dos modelos OBF-RBF é a mesma dos modelos OBF-TS, embora esses últimos usualmente requeiram uma quantidade de parâmetros inferior para proporcionar uma mesma precisão. Os modelos OBF-RBF também apresentam alguma interpretação matemática como um caso particular dos modelos OBF-TS. Por outro lado, modelos OBF-Neurais propostos em outros trabalhos (Back and Tsoi, 1996; Sentoni et al., 1996; Sentoni et al., 1998; Balestrino et al., 1999;Alataris et al., 2000; Vázquez and Agamennoni, 2001; Arto et al., 2001; Campello, Von Zuben, Amaral, Meleiro and Maciel Filho, 2003), baseados na utilização de outras arquiteturas de redes (e.g. MLP), não apresentam qualquer interpretação além da implementação arbitrária do mapeamento estático através de uma rede neural ou neuro-fuzzy.

4 COMPARAÇÕES DAS ABORDAGENS (N)OBF

Em resumo, até o presente ponto foram mencionadas quatro alternativas para a implementação do mapeamento estático que precede a dinâmica de estados constituída pelo conjunto de filtros ortonormais nos modelos (N)OBF: (a) Combinação linear (ou afim); (b) Polinômio multidimensional (Volterra); (c) Modelo fuzzy TS; (d) Rede neural. A primeira abordagem em princípio se restringe à representação de sistemas dinâmicos lineares, sem ou com incertezas paramétricas, sendo que nesse último caso algoritmos de identificação robusta (seção 2.1) são requeridos.

No tocante às abordagens não lineares, é importante destacar algumas diferenças estruturais significativas que existem entre elas. No caso de Volterra, por exemplo, a não linearidade do mapeamento estático é polinomial, de forma que a única alternativa para melhorar a capacidade de representação do modelo é aumentar a ordem do polinômio. A complexidade dos modelos de Volterra, no entanto, depende exponencialmente da ordem polinomial, o que usualmente restringe a aplicação dos mesmos à representação de 2a ordem de sistemas com não linearidades suaves (Billings, 1980; Dumont and Fu, 1993). Esse problema não ocorre com as realizações através de aproximadores universais, como os modelos fuzzy e as redes neurais, cujos mapeamentos podem assumir teoricamente formas contínuas arbitrárias sobre um domínio compacto. Nesses casos, embora a quantidade de regras fuzzy ou neurônios necessários a uma dada capacidade de representação tipicamente cresça de forma exponencial com a dimensão do domínio (maldição da dimensionalidade (Kosko, 1992)), é possível aumentar a precisão do modelo também através do ajuste paramétrico dos seus conjuntos fuzzy ou funções de ativação neurais. Essa flexibilidade, por outro lado, demanda a utilização de procedimentos de estimação mais sofisticados. Embora ambas as abordagens fuzzy e neural apresentem a mesma capacidade de representação e flexibilidade, os modelos OBF-TS apresentam a vantagem da interpretabilidade matemática que, de forma geral, os modelos OBF-Neurais não possuem.

5 PROJETO DA BASE DE FUNÇÕES ORTONORMAIS

Conforme discutido na seção 2, as bases de funções ortonormais são completas no espaço l2[0,¥), o que leva a duas implicações fundamentais. A primeira é que o número de funções em uma base truncada, n, representa apenas um compromisso entre a capacidade de aproximação e a quantidade de parâmetros do modelo, grandezas monotonicamente crescentes em n. Deve-se enfatizar, porém, que o número de funções necessárias para proporcionar uma dada precisão depende da complexidade do problema. Sistemas dinâmicos com múltiplos modos dominantes, por exemplo, requerem uma quantidade maior de funções. Nesse sentido, conforme já foi discutido, a demanda de funções também depende da base utilizada (e.g. Laguerre, Kautz ou GOBFs).

A segunda implicação da completude das bases ortonormais é que a parametrização do conjunto de funções não é crítica. Para a base de Laguerre, por exemplo, essa condição significa que para qualquer pólo de Laguerre p estável existe uma quantidade correspondente n de funções que proporciona uma determinada capacidade de aproximação. Dada uma quantidade fixa de funções, o problema que se coloca é como selecionar o pólo de Laguerre para maximizar a precisão do modelo. A solução para esse problema está bem estabelecida na literatura no contexto de modelos lineares. Em (Masnadi-Shirazi and Ahmed, 1991), por exemplo, obtém-se o pólo que minimiza o erro de aproximação do desenvolvimento da resposta ao impulso de uma classe de sistemas lineares em uma quantidade fixa de funções ortonormais. Em (Oliveira e Silva, 1994; Oliveira e Silva, 1995a) obtém-se um conjunto de condições de otimalidade para o pólo de Laguerre envolvendo o erro de aproximação de sistemas lineares em um contexto mais amplo. Em (Fu and Dumont, 1993) uma solução para o cálculo do pólo é obtida analiticamente maximizando a taxa de convergência do desenvolvimento ortonormal da resposta ao impulso do sistema, o que minimiza um limitante superior da norma quadrática do erro de aproximação associado a um truncamento desse desenvolvimento em um número finito de funções. Resultado análogo foi apresentado em (Tanguy et al., 1995; Tanguy et al., 2000) e posteriormente estendido para o caso de modelos de Volterra de segunda ordem em (Campello et al., 2001; Campello et al., 2002) e modelos de Volterra de qualquer ordem em (Campello, Favier and Amaral, 2003; Campello, Favier and Amaral, 2004; Kibangou et al., 2005b; Campello et al., 2006). Soluções para problemas similares envolvendo outras bases de funções ortonormais têm sido também investigadas (Oliveira e Silva, 1995b; Tanguy et al., 2002; Favier et al., 2003; Kibangou et al., 2003; Kibangou et al., 2005a; Kibangou et al., 2005c; da Rosa, 2005; da Rosa et al., 2006; da Rosa et al., 2007).

No caso da base de Laguerre em particular, cujas funções são parametrizadas em um único pólo real, a determinação do pólo pode ser vista simplesmente como um problema de otimização escalar. Logo, apesar dos resultados teóricos mencionados anteriormente, tem-se que o procedimento de otimização pode ser executado utilizando busca exaustiva, via discretização do intervalo de factibilidade (-1,1) (Oliveira and Amaral, 2000). O principal inconveniente desse tipo de abordagem é que para cada avaliação do valor do critério, associado a um determinado valor atribuído ao pólo, deve-se estimar todos os demais parâmetros do modelo, i.e., o mapeamento estático em (9), o que pode representar um custo computacional elevado dependendo do problema e do tipo de modelo (N)OBF adotado.

Independente do tipo de modelo em questão, isto é, da forma do mapeamento em (9), uma heurística simples porém eficaz para selecionar a parametrização das funções ortonormais é utilizando conhecimento a priori a respeito das dinâmicas dominantes do sistema (Ninness and Gustafsson, 1995; Ninness and Gustafsson, 1997), o que usualmente pode ser obtido através da observação da sua resposta no tempo ou em freqüência (Zervos and Dumont, 1988; Wahlberg and Ljung, 1992). Para a base de Laguerre, por exemplo, isso equivale essencialmente a selecionar o pólo real estável que melhor represente a constante de tempo dominante do sistema (Sentoni et al., 1996; Sentoni et al., 1998).

6 EXEMPLOS

Nesta seção, a identificação de sistemas utilizando as técnicas descritas na seção 2.1 e na seção 3 é ilustrada através de dois casos de estudo envolvendo a simulação de um mesmo processo dinâmico. Trata-se de um reator do tipo CSTR (Continuous Stirred Tank Reactor), particularmente, um processo de polimerização isotérmica que utiliza tolueno como solvente (Doyle III et al., 1995). O peso molecular médio (Number Average Molecular Weight - NAMW) do polímero resultante da reação, y(t) [kg/kmol], é controlado através da manipulação da taxa de fluxo da substância iniciadora, u(t) [m3/h ]. Um modelo físico de estados desse processo é dado por:

onde t é a variável de tempo contínuo. As condições nominais de operação são x1(0) = 5,506774, x2(0) = 0,132906, x3(0) = 0,0019752, x4(0) = 49,3818, u(0) = 0,016783 e y(0) = 25000,5 (Doyle III et al., 1995; Maner et al., 1996). Os sinais utilizados para fins de identificação são amostrados com período T = 0,03h e normalizados para evitar a ocorrência de problemas numéricos durante a fase de estimação dos parâmetros dos modelos, de forma que un(k) = (u(kT)-u(0))/u(0) e yn(k) = (y(kT)-y(0))/y(0).

De uma forma geral, a estimação de modelos requer a obtenção de um conjunto de dados de E/S representativo das dinâmicas do processo. Para tanto, simula-se o conjunto de equações diferenciais (41) a partir de condições iniciais dadas pelas condições nominais de operação. A simulação é executada de t = 0 até t = 32h, com a entrada dada por uma seqüência de degraus de mesma duração e amplitude aleatória no intervalo operacional normalizado [-0,6 , 0,8]. O conjunto de dados de E/S resultante é dividido em duas partes. A primeira metade (primeiras 16 horas) é destinada à estimação de modelos (N)OBF do processo e a outra metade é destinada à validação desses modelos. A primeira 1/2 hora de cada conjunto é reservada apenas para a convergência dos estados de Laguerre cujos valores iniciais são considerados desconhecidos (e configurados nulos) no início das simulações porque, na prática, o histórico do sinal de entrada anterior aos dados disponíveis para identificação é usualmente desconhecido. Esse procedimento também faz com que o transitório associado às condições iniciais do processo não exerça influência sobre a estimação dos parâmetros do modelo.

6.1 Exemplo 1: Caso Linear - Robusto

A seguir, ilustra-se o problema de identificação do processo de polimerização CSTR utilizando um modelo linear com estrutura OBF e incertezas paramétricas, conforme seção 2.1. Adota-se, neste exemplo, as duas metodologias lá então apresentadas. É importante destacar que, embora a abordagem de obtenção de um conjunto de modelos lineares via identificação robusta seja direcionada primordialmente à representação de sistemas lineares com incertezas, no presente contexto de modelagem de um processo não linear essa abordagem pode ser também vista como a obtenção de um conjunto de candidatos a aproximações lineares do processo em diferentes regiões de operação.

No caso da segunda metodologia de identificação robusta apresentada na seção 2.1, viu-se que é necessário um conjunto de respostas ao impulso do sistema. Para o processo de polimerização CSTR (41), este conjunto de respostas ao impulso pode ser obtido aplicando impulsos de diferentes amplitudes e dividindo os respectivos sinais de saída pela amplitude do impulso correspondente. O objetivo é capturar a resposta dinâmica do sistema a sinais com energia diferente sem que, para tanto, a amplitude da entrada tenha influência no resultado. Com essa metodologia, se o processo além de determinístico fosse também linear, o conjunto de respostas ao impulso seria perfeitamente idêntico. No entanto, devido à não linearidade do sistema, isso não ocorre, conforme pode ser observado na Figura 3. Essa figura apresenta o conjunto de respostas do processo CSTR para impulsos de amplitudes no intervalo operacional normalizado [-0,6 , 0,8] - discretização de 0,1.


Conforme mencionado na seção 5, o método apresentado em (Fu and Dumont, 1993) para sistemas lineares permite calcular um valor ótimo para o pólo das funções de Laguerre a partir da resposta ao impulso do sistema. O processo (41) é não linear e a aplicação deste método, assumindo por exemplo 6 funções de Laguerre, gera um conjunto de pólos ótimos (um para cada resposta ao impulso) cujo valor médio é 0,56. Assumindo, portanto, 6 funções de Laguerre parametrizadas com pólo p = 0,56, a utilização das equações (19) e (20) leva a um modelo linear com parâmetros incertos ci(ei) que pertencem ao intervalo [ci,min, ci,max] dado por:

e

Um exemplo de aplicação da primeira metodologia de identificação robusta apresentada na seção 2.1 (UBBE) é apresentado a seguir. Neste caso, é utilizado um conjunto de dados de E/S (aqueles destinados para estimação) e assumido um erro máximo de previsão emax = 0,15. Para efeito de comparação, o pólo p = 0,56 e a quantidade n = 6 de funções de Laguerre adotados na abordagem anterior são a seguir mantidos.

Com todas as informações apresentadas, a representação em estados da base de funções em (8), (11) e (12), além das hipóteses (16) e (17), tem-se que a utilização do método de estimação robusta apresentado em (Milanese and Belforte, 1982) leva a um modelo linear com parâmetros incertos ci(ei) que pertencem ao intervalo [ci,min, ci,max] dado por:

e

A partir dos resultados acima, nota-se que as duas estratégias de identificação robusta aqui apresentadas são capazes de gerar limites de incerteza para os parâmetros do modelo ortonormal. No entanto, comparando os dois resultados apresentados, nota-se que o método baseado em UBBE tende a gerar um ortotopo maior (incertezas mais conservativas que o método baseado na resposta ao impulso). A aplicação deste resultado em um algoritmo de controle robusto, e.g. (Oliveira et al., 2000), irá gerar uma lei de controle também mais conservativa. Outra questão relacionada com este método é a seleção do erro máximo de previsão, de cálculo ou seleção muitas vezes difícil. Porém, uma vantagem consiste no fato que o tipo de informação requerida pelo método, isto é, um par de sinais de entrada / saída, é semelhante à utilizada em algoritmos de estimação para sistemas lineares baseados em mínimos quadrados. Neste aspecto, é importante lembrar que sistemas dinâmicos reais nem sempre reagem adequadamente ou mesmo admitem operacionalmente a realização de ensaios envolvendo a aplicação de impulsos, dificultando a obtenção das informações que alimentam os cálculos do método baseado nesse tipo de excitação do sistema.

6.2 Exemplo 2: Caso Não Linear

Nesta seção, aborda-se o problema de identificação do processo de polimerização CSTR utilizando as diferentes realizações de modelos com estrutura NOBF apresentadas na seção 3. Os modelos obtidos são comparados entre si em termos de precisão e complexidade paramétrica. Esses modelos são também comparados com modelos OBF lineares, sem incertezas paramétricas, com o objetivo de se enfatizar a diferença de desempenho quando da utilização de modelos não lineares na identificação de processos com essa mesma característica. Não são realizadas comparações com os modelos OBF com incertezas paramétricas obtidos na seção 6.1, dado que os algoritmos de identificação robusta produzem um conjunto infinito de modelos, ao invés de um único modelo cujo desempenho possa ser avaliado e comparado de forma direta. Não obstante, diferenças entre as abordagens linear robusta e não linear podem ser avaliadas indiretamente no contexto de controle (Oliveira et al., 2007).

O pólo p de Laguerre foi selecionado experimentalmente com base em ensaios preliminares utilizando um modelo OBF-Volterra com n1 = n2 = 3 funções ortonormais nos termos de 1a e 2a ordem. Adotou-se por simplicidade o procedimento de busca exaustiva descrito em (Oliveira and Amaral, 2000), onde o intervalo de factibilidade (-1,1) é discretizado (aqui com uma quantização de 0,05) e um modelo diferente é estimado para cada valor do conjunto resultante. O pólo p = 0,75 foi escolhido como aquele que resulta no modelo com o menor erro de previsão para os dados de validação. Uma vez selecionado o pólo, diferentes modelos OBF lineares e OBF-Volterra contendo diferentes quantidades de funções de Laguerre são estimados via mínimos quadrados e validados utilizando os dados de E/S disponíveis (cuja geração foi discutida no início da seção 6). Os resultados em termos do Erro Quadrático Médio (EQM) entre a saída medida do sistema e a saída prevista de cada modelo são apresentados nas tabelas 1 e 2.

Observa-se na tabela 1 que o desempenho do modelo linear não melhora a partir de duas funções ortonormais, o que ocorre parcialmente como conseqüência da seleção rigorosa do pólo de Laguerre, mas principalmente devido à incapacidade do modelo representar as dinâmicas não lineares do processo. Essa hipótese é verificada graficamente através da Figura 4, que apresenta a saída medida do sistema para os dados de validação e a saída prevista do melhor modelo obtido (n = 2). Observa-se na figura que o modelo não representa fielmente os ganhos do processo.


Comparando as tabelas 1 e 2 fica claro que a inclusão do termo não linear de 2a ordem melhora significativamente o desempenho do modelo. De fato, comparando modelos com quantidades similares de parâmetros, particularmente o modelo linear com n = 2 ou 3 e o modelo de Volterra com n1 = 2 e n2 = 1, nota-se que o primeiro apresenta erro superior a 3 vezes o segundo. Mais além, nota-se que para uma mesma quantidade de filtros de Laguerre, especificamente 2 ou 3, o erro associado ao modelo de Volterra é aproximadamente 10 vezes inferior. A superioridade do modelo não linear pode ser também observada graficamente comparando as Figuras 4 e 5. Essa última apresenta a saída medida do sistema para os dados de validação e a saída prevista do melhor modelo de Volterra obtido (n1 = n2 = 3).


No caso dos modelos OBF-TS e OBF-RBF os parâmetros de projeto (além do pólo p = 0,75 já selecionado) são: o número de funções/filtros de Laguerre n, o número de regras fuzzy M, os conjuntos fuzzy das variáveis da premissa e o vetor de parâmetros contendo os coeficientes dos modelos locais (afins ou constantes). Por simplicidade, adota-se aqui uma base de regras fuzzy completa associada a uma partição em grade (grid) do domínio de entrada (Passino and Yurkovich, 1997). Nessa abordagem, um dado número de conjuntos fuzzy referenciais é associado a cada variável da premissa (estado de Laguerre). A base de regras correspondente é intitulada completa porque consiste de todas as possíveis regras no que se refere a combinações desses conjuntos referenciais. Nesse caso, sendo a o número de conjuntos fuzzy referenciais atribuídos a cada variável da premissa, tem-se que o número de regras do modelo é M = an. Adota-se, também por simplicidade, uma distribuição homogênea de conjuntos fuzzy Gaussianos sobre o universo de discurso da variável correspondente, ou seja, centros eqüidistantes e aberturas iguais à distância entre dois centros consecutivos. Por fim, seleciona-se a = 2 para evitar quantidades elevadas de parâmetros - m = an (n+1) em (37) e m = an em (39) - a serem estimados via mínimos quadrados. Esse valor é suficiente para proporcionar resultados satisfatórios na presente aplicação, conforme será visto na seqüência. Antes, é importante mencionar que o número de conjuntos fuzzy por variável da premissa, a forma desses conjuntos e ainda o número de regras fuzzy em uma base de regras possivelmente incompleta, poderiam todos ser otimizados a partir de diferentes estratégias, levando a modelos mais parcimoniosos e ao mesmo tempo mais precisos (Babuška, 1998; Espinosa et al., 2004). Nesse caso, porém, o esforço adicional empreendido nesta etapa precisaria ser considerado nas análises comparativas com os demais modelos, o que está além do escopo do presente trabalho.

A partir da parametrização descrita acima, basta definir a quantidade n de funções de Laguerre e estimar via mínimos quadrados os coeficientes dos modelos locais (afins para o modelo TS e constantes para o modelo RBF). Modelos com diferentes quantidades de funções de Laguerre são estimados e validados utilizando os dados de E/S disponíveis. Os resultados em termos do EQM entre a saída medida do sistema e a saída prevista de cada modelo são apresentados nas tabelas 3 e 4.

Comparando a tabela 3 com a tabela 2 pode-se observar que o modelo RBF apresenta desempenho comparável àquele do modelo Volterra, embora quantitativamente inferior (o que até certo ponto é justificado pela ausência de ajuste dos conjuntos fuzzy pré-fixados). O modelo TS, por sua vez, possui modelos locais mais flexíveis, o que permite alcançar precisão significativamente maior, conforme mostra a tabela 4. A superioridade do modelo TS pode ser também observada graficamente comparando as Figuras 6 e 7, que apresentam a saída medida do sistema para os dados de validação e as saídas previstas dos modelos RBF (n = 3) e TS (n = 2), respectivamente. O modelo TS com n = 2 foi selecionado pois representa um melhor compromisso entre parcimônia e precisão com relação àquele com n = 3.



Embora seja evidente o crescimento exponencial da quantidade de parâmetros em função da quantidade de funções de Laguerre em ambos os modelos RBF e TS, fica explícito nas tabelas 3 e 4 que esse problema é mais acentuado para os últimos. Uma abordagem para minimizar esse problema, alternativa àquelas já mencionadas anteriormente e que não requer abrir mão da simplicidade da arquitetura de base de regras completa adotada, é utilizar apenas um subconjunto das variáveis presentes nos modelos locais como variáveis na premissa. No caso específico dos modelos OBF-TS, cujas regras são dadas em (34), isso significa tomar os n estados de Laguerre presentes nos conseqüentes das regras e utilizar apenas o subconjunto dos r < n primeiros estados nos antecedentes (premissa). Em outras palavras, significa utilizar apenas um subconjunto dos estados de Laguerre como variáveis de decisão sobre a região operacional do sistema, o que pode implicar em pouca ou mesmo nenhuma perda de desempenho dependendo da complexidade das dinâmicas envolvidas. Para r = 1, por exemplo, tem-se que as regras assumem a seguinte forma:

Para fins de comparação, a tabela 5 apresenta os resultados de simulação para o modelo TS com regras na forma simplificada em (46). Pode-se observar, por exemplo, que embora tenha havido significativa perda de precisão nesse caso em particular, o modelo com n = 2 ainda apresenta um compromisso entre parcimônia e precisão muito similar àquele apresentado pelo modelo de Volterra. Estratégias para a determinação automática da quantidade ótima de estados na premissa das regras de modelos OBF-TS têm sido investigadas em (Medeiros, 2006;Medeiros et al., 2006b;Medeiros et al., 2006a), onde também se discute a utilização de modelos locais não lineares nos conseqüentes das regras e a estimação eficiente dos parâmetros desses modelos através de mínimos quadrados locais.

7 CONCLUSÕES

O presente artigo apresentou uma visão geral do estado da arte na área de identificação de sistemas dinâmicos utilizando modelos com estrutura desenvolvida através de bases de funções ortonormais, com ênfase dada à base de funções de Laguerre. Essa estrutura, denominada (N)OBF, apresenta diversas vantagens sobre aquelas estruturas dinâmicas de regressores tradicionais, como ausência de realimentação de saída, ortogonalidade dos elementos candidatos ao vetor de regressores, robustez a estimativas pouco precisas do atraso de transporte do sistema, tolerância a dinâmicas não modeladas, sensibilidade reduzida aos parâmetros estimados, entre outras. Aspectos de controle de processos usando a estrutura (N)OBF serão tratados na continuação deste trabalho (Oliveira et al., 2007).

Os fundamentos matemáticos dos modelos (N)OBF foram discutidos no contexto da identificação de sistemas lineares, lineares com incertezas estruturadas (identificação robusta), e não lineares. No caso não linear, diferentes realizações foram consideradas, a dizer, modelos de Volterra, fuzzy e neurais. Essas realizações foram discutidas comparativamente em termos de capacidade de representação, parcimônia, complexidade de projeto e interpretabilidade. Em resumo, tem-se que todas apresentam fundamentalmente a mesma capacidade de representação de uma ampla classe de sistemas dinâmicos não lineares, mas, em contrapartida, a complexidade paramétrica e/ou de projeto desses modelos é significativamente maior quando comparada aos modelos OBF lineares. No caso de Volterra, por exemplo, a não linearidade é do tipo polinomial, sendo a única alternativa para incremento da capacidade de representação aumentar a ordem do polinômio, o que implica um aumento exponencial na quantidade de parâmetros a serem estimados. As realizações fuzzy e neurais, por sua vez, apresentam maior flexibilidade, uma vez que permitem o controle de precisão não apenas pelo aumento da quantidade de conjuntos fuzzy ou neurônios, mas também pelo ajuste paramétrico desses elementos. Essa flexibilidade, por outro lado, demanda a utilização de procedimentos de estimação mais complexos. É importante destacar que as realizações neurais de uma maneira geral, diferentemente das demais (linear, Volterra e fuzzy), não apresentam uma interpretação matemática clara.

O artigo apresentou uma revisão bibliográfica abrangente sobre a identificação de modelos (N)OBF, com trabalhos compreendendo todas as realizações mencionadas acima. Aspectos práticos da modelagem foram também discutidos e ilustrados através de dois casos de estudo envolvendo um reator de polimerização isotérmica do tipo CSTR.

AGRADECIMENTOS

O primeiro e terceiro autores agradecem ao Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq (processos 307554/2003-1 e 301345184, respectivamente).

Artigo submetido em 14/08/2006

1a. Revisão em 19/03/2007

Aceito sob recomendação do Editor Associado

Prof. Liu Hsu

  • Aguirre, L. A. (2004). Introdução à Identificação de Sistemas: Técnicas Lineares e Não Lineares Aplicadas a Sistemas Reais, 2 edn, Editora UFMG.
  • Aguirre, L. A., Correa, M. V. and Cassini, C. (2002). Nonlinearities in NARX polynomial models: Representation and estimation, IEE Proc. Control Theory and Applications 149: 343348.
  • Alataris, K., Berger, T. W. and Marmarelis, V. Z. (2000). A novel network for nonlinear modeling of neural systems with arbitrary point-process inputs, Neural Networks 13: 255266.
  • Allgower, F. and Zheng, A. (eds) (2000). Nonlinear Model Predictive Control, Birkhauser Verlag.
  • Arto, V., Hannu, P. and Halme, A. (2001). Modeling of chromatographic separation process with Wiener-MLP representation, Journal of Process Control 11: 443458.
  • Babuka, R. (1998). Fuzzy Modeling for Control, Kluwer Academic Publishers.
  • Back, A. D. and Tsoi, A. C. (1996). Nonlinear system identification using discrete Laguerre functions, Journal of Systems Engineering 6: 194207.
  • Balestrino, A., Caiti, A. and Zanobini, G. (1999). Identification of Wiener-type nonlinear systems by Laguerre filters and neural networks, Proc. 14th International Federation of Automatic Control (IFAC) World Congress, Beijing/China, pp. 433438.
  • Billings, S. A. (1980). Identification of nonlinear systems -a survey, IEE Proc. Pt D 127(6): 272285.
  • Boyd, S. and Chua, L. O. (1985). Fading memory and the problem of approximating nonlinear operators with Volterra series, IEEE Trans. on Circuits and Systems 32(11): 11501161.
  • Braga, A. P., Carvalho, A. C. P. L. F. and Ludemir, T. B. (2000). Redes Neurais Artificiais: Teoria e Aplicações, LTC.
  • Broome, P. W. (1965). Discrete orthonormal sequences, Journal of the Association for Computing Machinery 12(2): 151168.
  • Broomhead, D. S. and Lowe, D. (1988). Multivariate functional interpolation and adaptive networks, Complex Systems 2: 321355.
  • Camacho, E. F. and Bordons, C. (1999). Model Predictive Control, Springer-Verlag.
  • Campello, R. J. G. B. (2002). Arquiteturas e Metodologias para Modelagem e Controle de Sistemas Complexos utilizando Ferramentas Clássicas e Modernas, PhD thesis, DCA/FEEC/UNICAMP, Campinas/SP, Brasil.
  • Campello, R. J. G. B. and Amaral, W. C. (1999). Equivalência entre modelos nebulosos e redes neurais, Anais IV Simpósio Brasileiro de Automação Inteligente, São Paulo/Brasil, pp. 208212.
  • Campello, R. J. G. B. and Amaral, W. C. (2002). Takagi-Sugeno fuzzy models within orthonormal basis function framework and their application to process control, Proc. 11th IEEE Internat. Conference on Fuzzy Systems, Honolulu/USA, pp. 13991404.
  • Campello, R. J. G. B., Amaral, W. C. and Favier, G. (2001). Optimal Laguerre series expansion of discrete Volterra models, Proc. European Control Conference, Porto/Portugal, pp. 372377.
  • Campello, R. J. G. B., Amaral, W. C. and Favier, G. (2002). Desenvolvimento ótimo de modelos de Volterra em funções ortonormais de Laguerre, Anais XIV Congresso Brasileiro de Automática, Natal/Brasil, pp. 128133.
  • Campello, R. J. G. B., Amaral, W. C. and Favier, G. (2006). A note on the optimal expansion of Volterra models using Laguerre functions, Automatica 42: 689693.
  • Campello, R. J. G. B., Favier, G. and Amaral, W. C. (2003). Optimal expansions of discrete-time Volterra models using Laguerre functions, Proc. of the 13th IFAC Symposium on System Identification, Rotterdam/The Netherlands, pp. 18441849.
  • Campello, R. J. G. B., Favier, G. and Amaral, W. C. (2004). Optimal expansions of discrete-time Volterra models using Laguerre functions, Automatica 40: 815822.
  • Campello, R. J. G. B., Meleiro, L. A. C. and Amaral, W. C. (2004). Control of a bioprocess using orthonormal basis function fuzzy models, Proc. 13th IEEE Internat. Conference on Fuzzy Systems, Budapest/Hungary, pp. 801 806.
  • Campello, R. J. G. B. and Oliveira, G. H. C. (2007). Modelos não lineares, in L. A. Aguirre, A. P. Alves da Silva, M. F. M. Campos and W. C. Amaral (eds), Enciclopédia de Automática, Vol. 3 (Cap. 4), Edgard Blücher.
  • Campello, R. J. G. B., Oliveira, G. H. C., Von Zuben, F. J. and Amaral, W. C. (1999). Redes neurais com base de funções ortonormais, Anais IV Simpósio Brasileiro de Automação Inteligente, São Paulo/Brasil, pp. 213218.
  • Campello, R. J. G. B., Von Zuben, F. J., Amaral, W. C., Meleiro, L. A. C. and Maciel Filho, R. (2003). Hierarchical fuzzy models within the framework of orthonormal basis functions and their application to bioprocess control, Chemical Engineering Science 58: 42594270.
  • Cho, K. B. and Wang, B. H. (1996). Radial basis function based adaptive fuzzy systems and their applications to system identification and prediction, Fuzzy Sets and Systems 83: 325339.
  • Clarke, D. W. (ed.) (1994). Advances in Model Based Predictive Control, Oxford University Press.
  • Corrêa, M. V. and Aguirre, L. A. (2004). Identificação nãolinear caixa-cinza Uma revisão e novos resultados, Controle & Automação 15: 109126.
  • da Rosa, A. (2005). Desenvolvimento de modelos discretos de Volterra usando funções de Kautz, Masters thesis, DCA/FEEC/UNICAMP, Campinas/SP, Brasil.
  • da Rosa, A., Amaral, W. C. and Campello, R. J. G. B. (2006). Desenvolvimento de modelos de Volterra usando funções de Kautz e sua aplicação à modelagem de um sis-tema de levitação magnética, Anais do Congresso Brasileiro de Automática, Salvador/Brasil, pp. 274279.
  • da Rosa, A., Campello, R. J. G. B. and Amaral, W. C. (2007). Choice of free parameters in expansions of discrete-time Volterra models using Kautz functions, Automatica 43(6).
  • da Silva, I. N. (1995). Estimação paramétrica robusta através de redes neurais artificiais, Masters thesis, DCA/FEEC/UNICAMP -Brasil.
  • Doyle III, F. J., Ogunnaike, B. A. and Pearson, R. K. (1995). Nonlinear model-based control using second-order Volterra models, Automatica 31: 697714.
  • Doyle III, F. J., Pearson, R. K. and Ogunnaike, B. A. (2002). Identification and Control using Volterra Models, Springer-Verlag.
  • Dumont, G. A. and Fu, Y. (1993). Non-linear adaptive control via Laguerre expansion of Volterra kernels, Int. J. Adaptive Control and Signal Processing 7: 367382.
  • Espinosa, J., Vandewalle, J. and Wertz, V. (2004). Fuzzy Logic, Identification and Predictive Control, Springer-Verlag.
  • Eykhoff, P. (1974). System Identification: Parameter and State Estimation, John Wiley & Sons.
  • Favier, G. and Arruda, L. V. R. (1996). Review and comparison of ellipsoidal bounding algorithms, in M. Milanese (ed.), Bounding Approaches to System Identification, Plenum Press, New York, pp. 4368.
  • Favier, G., Kibangou, A. Y. and Campello, R. J. G. B. (2003). Nonlinear system modelling by means of orthonormal basis functions, Proc. 2nd IEEE Int. Conference on Signal, Systems, Decision and Information Technology, Sousse/Tunisia.
  • Fu, Y. and Dumont, G. A. (1993). An optimum time scale for discrete Laguerre network, IEEE Trans. on Automatic Control 38(6): 934938.
  • Garcia, C. E., Prett, D. M. and Morari, M. (1989). Model predictive control: Theory and practice -a survey, Automatica 25(3): 335348.
  • Haykin, S. (1999). Neural Networks: A Comprehensive Foundation, 2nd edn, Prentice Hall.
  • Henson, M. A. (1998). Nonlinear model predictive control: Current status and future directions, Computers and Chemical Engineering 23: 187202.
  • Heuberger, P. S. C., Van den Hof, P. M. J. and Bosgra, O. H. (1995). A generalized orthonormal basis for linear dynamical systems, IEEE Trans. on Automatic Control 40: 451465.
  • Heuberger, P. S. C., Van den Hof, P. M. J. and Wahlberg, B. (2005). Modelling and Identification with Rational Orthogonal Basis Functions, Springer.
  • Hunt, K. J., Haas, R. and Murray-Smith, R. (1996). Extending the functional equivalence of radial basis function networks and fuzzy inference systems, IEEE Trans. Neural Networks 7: 776781.
  • Kibangou, A., Favier, G. and Hassani, M. (2003). Generalized orthonormal basis selection for expanding quadratic Volterra filters, Proc. IFAC Symposium on System Identification, Rotterdam/The Netherlands, pp. 1119 1124.
  • Kibangou, A. Y., Favier, G. and Hassani, M. M. (2005a). Iterative optimization method of GOB-Volterra filters, Proc. 16th International Federation of Automatic Control (IFAC) World Congress, Prague/Czech Republic.
  • Kibangou, A. Y., Favier, G. and Hassani, M. M. (2005b). Laguerre-Volterra filters optimization based on La-guerre spectra, EURASIP Journal on Applied Signal Processing 17: 28742887.
  • Kibangou, A. Y., Favier, G. and Hassani, M. M. (2005c). Selection of generalized orthonormal bases for second-order Volterra filters, Signal Processing 85: 23712385.
  • Kosko, B. (1992). Neural Networks and Fuzzy Systems: A Dynamical Systems Approach to Machine Intelligence, Prentice Hall.
  • Kosko, B. (1997). Fuzzy Engineering, Prentice Hall.
  • Leontaritis, I. and Billings, S. A. (1985). Input-output parametric models for nonlinear systems Parts I and II, Int. Journal of Control 41(6): 303344.
  • Ljung, L. (1999). System Identification: Theory for the user, 2nd edn, Prentice Hall.
  • Mäkilä, P. M. (1990). Approximation of stable systems by Laguerre filters, Automatica 26(2): 333345.
  • Maner, B. R., Doyle III, F. J., Ogunnaike, B. A. and Pearson, R. K. (1996). Nonlinear model predictive control of a simulated multivariable polymerization reactor using second-order Volterra models, Automatica 32(9): 12851301.
  • Masnadi-Shirazi, M. A. and Ahmed, N. (1991). Optimum Laguerre networks for a class of discrete-time systems, IEEE Transactions on Signal Processing 39(9): 2104 2108.
  • Medeiros, A. V. (2006). Modelagem de sistemas dinâmicos não lineares utilizando sistemas fuzzy, algoritmos genéticos e funções de base ortonormal, Masters thesis, DCA/FEEC/UNICAMP, Campinas/SP, Brasil.
  • Medeiros, A. V., Amaral, W. C. and Campello, R. J. G. B. (2006a). GA optimization of generalized OBF TS fuzzy models with global and local estimation approaches, Proc. 15th IEEE Internat. Conference on Fuzzy Systems, Vancouver/Canada, pp. 84948501.
  • Medeiros, A. V., Amaral, W. C. and Campello, R. J. G. B. (2006b). GA optimization of OBF TS fuzzy models with linear and non linear local models, Anais Simpósio Brasileiro de Redes Neurais (SBRN), Ribeirão Preto/Brasil.
  • Milanese, M. and Belforte, G. (1982). Estimation theory and uncertainty intervals evaluation in presence of unknown but bounded errors : Linear families of models and estimators, IEEE Trans. on Automatic Control 27(2): 408 414.
  • Moreira, V. D. (2006). Controle Preditivo Robusto de Sistemas Hibridos Incertos Integrando Restrições, Lógica e Dinâmica Baseada em Séries de Funções Ortonormais, PhD thesis, DCA/FEEC/UNICAMP.
  • Nelles, O. (2001). Nonlinear System Identification, Springer-Verlag.
  • Ninness, B. and Gustafsson, F. (1995). Orthonormal bases for system identification, Proc. 3rd European Control Conference, Vol. 1, Rome/Italy, pp. 1318.
  • Ninness, B. and Gustafsson, F. (1997). A unifying construction of orthonormal bases for system identification, IEEE Trans. on Automatic Control 42: 515521.
  • Norton, J. P. (1990). Fast and robust algorithm to compute exact polytope parameter bounds, Mathematics and Computers in Simulation 32: 481493.
  • Oliveira e Silva, T. A. M. (1994). Optimality conditions for truncated Laguerre networks, IEEE Trans. Signal Processing 42: 25282530.
  • Oliveira e Silva, T. A. M. (1995a). On the determination of the optimal pole position of Laguerre filters, IEEE Trans. Signal Processing 43: 20792087.
  • Oliveira e Silva, T. A. M. (1995b). Optimality conditions for truncated Kautz networks with two periodically repeating complex conjugate poles, IEEE Trans. Automatic Control 40: 342346.
  • Oliveira, G. H. C. (1997). Controle Preditivo para Processos com Incertezas Estruturadas baseado em Séries de Funções Ortonormais, PhD thesis, DCA/FEEC/UNICAMP -Campinas/SP/Brasil.
  • Oliveira, G. H. C. and Amaral, W. C. (2000). Identificação e controle preditivo de processos não lineares utilizando séries de Volterra e bases de funções ortonormais, Anais XIII Congresso Brasileiro de Automática, Florianópo-lis/Brasil, pp. 21742179.
  • Oliveira, G. H. C., Amaral, W. C., Favier, G. and Dumont, G. (2000). Constrained robust predictive controller for uncertain processes modeled by orthonormal series functions, Automatica 36(4): 563572.
  • Oliveira, G. H. C., Campello, R. J. G. B. and Amaral, W. C. (1999). Fuzzy models within orthonormal basis function framework, Proc. 8th IEEE Internat. Conference on Fuzzy Systems, Seoul/Korea, pp. 957962.
  • Oliveira, G. H. C., Campello, R. J. G. B. and Amaral, W. C. (2007). Identificação e controle de processos via desenvolvimentos em séries ortonormais. Parte B: Controle preditivo, Controle & Automação 18(3): 322336.
  • Oliveira, G. H. C., Favier, G., Dumont, G. and Amaral, W. C. (1998). Uncertainties identification using la-guerre models with application to paper machine head-box, Proc. of IEEE/IMACS Multiconference on Computational Engineering in Systems Applications -CESA, Symposium on Control Optimization and Supervision, Vol. 1, Tunisia, pp. 329334.
  • Passino, K. M. and Yurkovich, S. (1997). Fuzzy Control, Addison Wesley.
  • Rugh, W. J. (1981). Nonlinear System Theory: The Volterra / Wiener Approach, The Johns Hopkins University Press.
  • Schetzen, M. (1980). The Volterra and Wiener Theories of Nonlinear Systems, John Wiley & Sons.
  • Sentoni, G., Agamennoni, O., Desages, A. and Romagnoli, J. (1996). Approximate models for nonlinear process control, AIChE Journal 42: 22402250.
  • Sentoni, G. B., Biegler, L. T., Guiver, J. B. and Zhao, H. (1998). State-Space nonlinear process modeling: Identification and universality, AIChE Journal 44: 2229 2239.
  • Sjöberg, J., Zhang, Q., Ljung, L., Benveniste, A., Delyon, B., Glorennec, P.-Y., Hjalmarsson, H. and Juditsky, A. (1995). Nonlinear black-box modeling in system identification: A unified overview, Automatica 31: 1691 1724.
  • Soeterboek, R. (1992). Predictive Control: A Unified Approach, Prentice Hall.
  • Sugeno, M. and Kang, G. T. (1986). Fuzzy modelling and control of multilayer incinerator, Fuzzy Sets and Systems 18: 329346.
  • Sugeno, M. and Kang, G. T. (1988). Structure identification of fuzzy model, Fuzzy Sets and Systems 28: 1533.
  • Sugeno, M. and Tanaka, K. (1991). Successive identification of a fuzzy model and its applications to prediction of a complex system, Fuzzy Sets and Systems 42: 315334.
  • Takagi, T. and Sugeno, M. (1985). Fuzzy identification of systems and its applications to modeling and control, IEEE Trans. Systems, Man and Cybernetics SMC 15: 116132.
  • Tanguy, N., Morvan, R., Vilbé, P. and Calvez, L. C. (2000). Online optimization of the time scale in adaptive Laguerre-based filters, IEEE Trans. on Signal Processing 48: 11841187.
  • Tanguy, N., Morvan, R., Vilbé, P. and Calvez, L. C. (2002). Pertinent choice of parameters for discrete Kautz approximation, IEEE Trans. on Automatic Control 47: 783787.
  • Tanguy, N., Vilbé, P. and Calvez, L. C. (1995). Optimum choice of free parameter in orthonormal approximations, IEEE Trans. on Automatic Control 40: 18111813.
  • Van den Hof, P. M. J., Heuberger, P. S. C. and Bokor, J. (1995). System identification with generalized orthonormal basis functions, Automatica 31(12): 1821 1834.
  • Vázquez, M. Á. A. and Agamennoni, O. E. (2001). Approximate models for nonlinear dynamical systems and their generalization properties, Mathematical and Computer Modelling 33: 965986.
  • Wahlberg, B. (1991). System identification using Laguerre models, IEEE Trans. on Automatic Control 36(5): 551 562.
  • Wahlberg, B. (1994). System identification using Kautz models, IEEE Trans. on Automatic Control 39(6): 1276 1282.
  • Wahlberg, B. and Ljung, L. (1992). Hard frequency-domain model error bounds from least-squares like identification techniques, IEEE Trans. on Automatic Control 37(7): 900912.
  • Wahlberg, B. and Mäkilä, P. M. (1996). Approximation of stable linear dynamical systems using Laguerre and Kautz functions, Automatica 32(5): 693708.
  • Walter, E. and Piet-Lahanier (1990). Estimation of parameter bounds from bounded-error data: A survey, Mathematics and Computers in simulation 32: 449468.
  • Wang, L.-X. and Mendel, J. M. (1992). Fuzzy basis functions, universal approximation and orthogonal least squares learning, IEEE Trans. Neural Networks 3: 807 814.
  • Wiener, N. (1958). Nonlinear Problems in Random Theory, Wiley.
  • Yager, R. R. and Filev, D. P. (1994). Essentials of Fuzzy Modeling and Control, John Wiley & Sons.
  • Zeng, X.-J. and Singh, M. G. (1994). Approximation theory of fuzzy systems -SISO case, IEEE Trans. Fuzzy Systems 2: 162176.
  • Zeng, X.-J. and Singh, M. G. (1995). Approximation theory of fuzzy systems -MIMO case, IEEE Trans. Fuzzy Systems 3: 219235.
  • Zervos, C. C. and Dumont, G. A. (1988). Deterministic adaptive control based on Laguerre series representation, Int. J. Control 48(6): 23332359.
  • 1
    Note que a resposta ao impulso de um sistema BIBO estável necessariamente se anula ou tende assintoticamente a zero com o tempo, o que viabiliza o truncamento da equação (5).
  • 2
    Equações (8), (11) e (12) para a base de Laguerre.
  • 3
    Sistemas com
    fading memory são aqueles para os quais a resposta a uma dada excitação de entrada se anula ou decresce de forma rápida o suficiente para que não seja significativa após um dado período finito de tempo, o que basicamente remete a sistemas estáveis com estado estacionário único.
  • 4
    Por simplicidade assume-se em () que os modelos locais são lineares (afins) e que possuem todos a mesma ordem n, mas ambas as hipóteses podem ser relaxadas no caso mais geral.
  • Datas de Publicação

    • Publicação nesta coleção
      29 Jan 2008
    • Data do Fascículo
      Set 2007

    Histórico

    • Revisado
      19 Mar 2007
    • Recebido
      14 Ago 2006
    Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
    E-mail: revista_sba@fee.unicamp.br