Acessibilidade / Reportar erro

Approach for non-linear predictive control based on the local model ideas

Controle de plantas não lineares utilizando control preditivo linear baseado em modelos locais

Abstracts

This paper presents a new approach for non-linear predictive control based on the local model ideas. The algorithm uses a non-linear (NL) model of the plant for internal simulation. When a change in the operating point is required this NL model is used to identify a linear ARX model of the process. The optimization procedure is then executed using this linear model and a control weighting factor adapted to the nonlinear model static gain obtained from the inverse static characteristic. The proposed controller is applied to some simulated NL process and the obtained results compared to some MPC algorithms recently presented in literature to show the main advantages of this new approach: simplicity, low processing time and uniform dynamic behaviour in the operating range.

Predictive Control non-linear; local models; identification; penalization control


Este artigo apresenta uma nova abordagem para o controle preditivo não linear no contexto dos modelos locais. O algoritmo de controle proposto usa um modelo não linear (MNL) da planta para simular internamente o comportamento do processo. Quando se aplica uma mudança de set-point no processo, o algoritmo usa o MNL para identificar um modelo ARX linear. O procedimento de otimização é então executado usando este modelo linear e uma penalização variável do controle, determinada em função do ganho não linear do modelo identificado. O controle proposto é aplicado em al-guns processos simulados e também se apresentam comparações com outras técnicas de controle preditivo aplicadas a plantas não lineares disponíveis na literatura para ilustrar as principais vantagens da metodologia proposta: simplicidade, baixo tempo de processamento computacional e comportamento dinâmico uniforme em todo o intervalo de operação da planta.

Controle preditivo não linear; modelos locais; identificação; penalização do controle


CONTROLE DE PROCESSOS

Controle de plantas não lineares utilizando control preditivo linear baseado em modelos locais

Approach for non-linear predictive control based on the local model ideas

Claudio O. Ayala BravoI; Julio E. Normey-RicoII

IDepartamento de Ingeniería Eléctrica, Universidad de Antofagasta Avenida Angamos 601, Antofagasta, Chile. cayala107a@hotmail.com

IIDepartamento de Automação e Sistemas, Universidade Federal de Santa Catarina Cx. P. 476, CEP 88040-900, Florianópolis-SC, Brasil. julio@das.ufsc.br

RESUMO

Este artigo apresenta uma nova abordagem para o controle preditivo não linear no contexto dos modelos locais. O algoritmo de controle proposto usa um modelo não linear (MNL) da planta para simular internamente o comportamento do processo. Quando se aplica uma mudança de set-point no processo, o algoritmo usa o MNL para identificar um modelo ARX linear. O procedimento de otimização é então executado usando este modelo linear e uma penalização variável do controle, determinada em função do ganho não linear do modelo identificado. O controle proposto é aplicado em al-guns processos simulados e também se apresentam comparações com outras técnicas de controle preditivo aplicadas a plantas não lineares disponíveis na literatura para ilustrar as principais vantagens da metodologia proposta: simplicidade, baixo tempo de processamento computacional e comportamento dinâmico uniforme em todo o intervalo de operação da planta.

Palavras-chave: Controle preditivo não linear, modelos locais, identificação, penalização do controle.

ABSTRACT

This paper presents a new approach for non-linear predictive control based on the local model ideas. The algorithm uses a non-linear (NL) model of the plant for internal simulation. When a change in the operating point is required this NL model is used to identify a linear ARX model of the process. The optimization procedure is then executed using this linear model and a control weighting factor adapted to the nonlinear model static gain obtained from the inverse static characteristic. The proposed controller is applied to some simulated NL process and the obtained results compared to some MPC algorithms recently presented in literature to show the main advantages of this new approach: simplicity, low processing time and uniform dynamic behaviour in the operating range.

Keywords: Predictive Control non-linear, local models, identification, penalization control.

1 INTRODUÇÃO

O controle preditivo baseado em modelo (MPC) é uma técnica de controle poderosa desenvolvida e consolidada nas duas últimas décadas. É uma das poucas técnicas de controle avançado que têm tido um significativo impacto na indústria de controle de processos. Talvez a principal razão para este êxito seja que esta técnica pode lidar com diversas situações: pode ser aplicada a sistemas SISO (Single Input Single Output) e MIMO (Multiple Input Multiple Output), permite inclusão de ações de realimentação e pré-alimentação, podem ser incluídas restrições de entrada e saída na formulação da lei de controle e pode também compensar intrinsecamente os tempos mortos do processo (Normey-Rico & Camacho, 2007).

O MPC não é uma estratégia de controle específica, mas é o nome dado a um conjunto de métodos de controle que foram desenvolvidos considerando o conceito de predição e a obtenção do sinal de controle, através da minimização de uma determinada função objetivo. Esta função considera o erro futuro e as restrições nas variáveis de processo e/ou de controle (Camacho & Bordons, 2004).

O MPC é uma técnica consolidada na indústria para sistemas multivariáveis, com restrições, que podem ser representados por modelos lineares (Henson, 1998). Apesar de a maioria dos sistemas reais apresentarem características não lineares, quando o processo opera numa pequena faixa então seu comportamento pode ser aproximado satisfatoriamente através de modelos lineares. Isto tem motivado o uso de modelos line-ares em muitas técnicas de MPC. Exemplos destes controladores são: o DMC (Controle por Matriz Dinâmica) (Cutler & Ramaker, 1980); o MAC (Controle Algorítmico Baseado em Modelo) (Richalet et al., 1978); o GPC (Controle Preditivo Generalizado) (Clarke et al., 1987) e o EPSAC (Controle Preditivo Adaptativo Estendido) (De Keyser & Van Cuawenberghe, 1985). São muitas as aplicações de controle baseadas em programas comerciais que utilizam MPC linear na indústria, principalmente nas petroquímicas e refinarias de petróleo no Brasil e no mundo (Camacho & Bordons, 2004).

A principal vantagem do MPC linear se comparado ao não linear é que o problema de otimização associado é mais simples de resolver. Porém, quando os processos têm um grau mediano ou severo de não linearidade ou quando a faixa de operação é variável ou quando os processos experimentam transições contínuas em sua operação, necessariamente deverá ser tomado em conta o modelo não linear no projeto do controle, de forma que permita manter a estabilidade e desempenho desejado para o sistema em malha fechada (Ca-macho & Bordons, 2004).

Do ponto de vista conceitual o MPC não linear (NMPC) não apresenta dificuldades, já que é possível considerar a mesma função objetivo que no caso linear e um modelo não linear para o cálculo das predições. O objetivo consiste novamente em encontrar o controle que minimize a função objetivo sujeito a um conjunto de restrições. Já do ponto de vista prático, são várias as dificuldades encontradas neste problema (se comparado ao caso linear): (a) a obtenção do sinal de controle requer, em geral, a solução de um problema de otimização não convexo e (b) a análise de estabilidade e robustez da solução. Por estes motivos o NMPC é atualmente um campo aberto para pesquisas (Camacho & Bordons, 2004).

Várias formulações alternativas ao NPMC direto têm sido propostas na literatura para evitar todos ou alguns dos inconvenientes citados. A maioria das formulações trata de evitar, de distintas maneiras, o problema associado à otimização não convexa. Algumas destas formulações são: o MPC linear estendido (Hernandez & Arkun, 1991), o NMPC subótimo (Scokaert et al.,1999) o MPC baseado em Horizontes Curtos (Zheng & Zhang, 2001), o MPC com Decomposição da Sequência de Controle (De Keyser & Lazar, 2003), o MPC com Linearização por Realimentação (Nevistic & Morari, 1995), o MPC baseado em Modelos de Volterra (Doyle et al., 2001), o MPC baseado em Redes Neurais (Arahal et al., 1998) e o MPC baseado em Modelos Locais.

Destas formulações alternativas, aquelas que se baseiam em modelos locais permitem a aplicação de controladores preditivos lineares aproveitando as vantagens que estes apresentam. A forma mais simples desta técnica é o uso do ponto de operação (PO) atual para linearizar o modelo antes da execução do controlador preditivo (Bequette, 1991). Isto permite resolver on-line o MPC linear, a cada tempo de amostragem, mediante programação quadrática (QP).

Para melhorar a exatidão do modelo linear podem-se realizar sucessivas linearizações dentro do período de amostragem (Brengel & Seider, 1989). As linearizações locais são realizadas em tempos igualmente espaçados dentro do período de amostragem como uma forma artificial de reduzir este período.

Uma extensão desta idéia (Kouvaritakis et al., 1999) denominada Local Linearization Trajectory (LLT) procura utilizar múltiplos modelos para a minimização de forma que esta ocorra utilizando modelos lineares referentes aos pontos transientes pelos quais o sistema vai passar, durante uma mudança de referência no caso que for utilizada a sequência de controle previamente determinada pela otimização. O efeito dos erros da linearização pode ser reduzido pelo uso apropriado da interpolação linear, compensando desta forma a perda de otimização.

Estas técnicas de linearizações sucessivas apresentam o problema de o custo computacional se incrementar linearmente com o número de linearizações. Além do mais, não capturam fielmente a dinâmica do modelo não linear que representa o comportamento da planta.

O conceito de linearizações locais é semelhante ao uso de uma rede de modelos locais. Esta rede de modelos locais é usada para capturar a dinâmica do processo em diferentes pontos de operação (Camacho & Bordons, 2004). Duas formulações são propostas na exploração desta idéia, ambas usando GPC (Kouvaritakis & Cannon, 2001). A primeira trata de uma rede de GPC's (LC-GPC: Controle Preditivo Generalizado com Controladores Locais), cada uma projetada ao redor dos modelos locais. A ação de controle é formada pela combinação de saídas dos controladores lineares.

O segundo método utiliza um único GPC (LM-GPC: Controle Preditivo Generalizado com Modelos Locais), com um modelo local obtido como uma combinação dos modelos lineares locais. Uma função de interpolação gera ponderações de ativação para cada modelo. Ponderações altas são dadas aos modelos que dão uma boa aproximação em regime onde

o modelo está operando, enquanto que pesos próximos de zero são dados aos outros. No primeiro tratamento (LCMPC) o ajuste dos controladores pode não ser fácil devido ao número e o efeito das funções base normalizadas da LMN (Shorten & Murray-Smith, 1997). A estratégia LM-GPC requer só um conjunto de parâmetros de ajuste. O modelo interno de um único controlador GPC é atualizado a cada instante de amostragem. Este controle gera resultados conservadores, pois a ação de controle deve ser limitada para um funcionamento correto no pior caso; isto significa um fator limitante quando a saída do processo é mudada a um ponto de operação de baixo ganho, onde, talvez, o melhor controle pode não ser atingido (Kouvaritakis & Cannon, 2001). Em todos os casos anteriores, onde são usadas aproximações, trata-se de compensar as perdas no desempenho com a maior velocidade de processamento e simplicidade dos algoritmos. Assim, pode-se considerar como o melhor aquele algoritmo que consiga o melhor compromisso entre desempenho, simplicidade e velocidade (Plucenio et al., 2007).

Este artigo propõe um controlador preditivo não linear, base-ado no GPC linear, que funciona satisfatoriamente em todo o intervalo de operação do sistema não linear e que incorpora tratamento de restrições de entrada e saída, compensação de tempos mortos do processo e ações de pré-alimentação. O algoritmo tenta utilizar uma característica da indústria de processos onde o MPC está altamente difundido. Modelos completos e complexos das unidades são utilizados para simulação e treinamento de operários, porém não aproveitados para o sistema de controle. Aqui, o algoritmo utiliza a informação disponível apenas para simular o comportamento do processo e obter um modelo simples para controle.

O algoritmo, que melhora algumas características de propostas anteriores, é desenvolvido mediante um procedimento composto por uma sequência de passos realizados off-line que determinam características estáticas do processo em diferentes pontos de operação e a obtenção on-line de um modelo linear a partir de um modelo não linear.

Neste trabalho o algoritmo proposto é usado para o controle de uma planta de neutralização de pH, que é altamente não linear, e um sistema que apresenta dinâmicas diferentes no seu intervalo de operação.

Este artigo é estruturado como se segue: na seção 2 se re-visa o controlador preditivo generalizado, que é a base para o controle proposto, com seus parâmetros e aspectos mais relevantes. Na seção 3 se apresenta a metodologia proposta e uma descrição do algoritmo desenvolvido. Logo, na seção 4, apresentam-se as aplicações, comparando seu desempenho com técnicas de controladores preditivos que utilizam redes de modelos locais. Finalmente se apresentam as conclusões.

2 CONTROLE PREDITIVO BASEADO NO MODELO

A metodologia de todos os controladores pertencentes à família do MPC é caracterizada pela estrutura mostrada na figura 1 e a estratégia representada na figura 2.



Em cada instante t e fazendo uso do modelo do processo se predizem as futuras saídas para um determinado horizonte N, chamado horizonte de predição. Estas saídas preditas, y(t + k | t) (a notação indica o valor predito da variável no instante t+k calculado no instante t), para k={1. . . N}, dependem dos valores conhecidos até o instante t (entradas e saídas passadas) e dos sinais de controle em t+k calculadas em t, (u(t + k | t)) para k= {0. . . N-1}, que se pretende enviar ao sistema e que são as que se desejam calcular.

O critério normalmente considera uma função quadrática dos erros entre a saída predita e a trajetória de referência, incluindo em muitos casos o esforço de controle. Se o critério for quadrático e o modelo linear e não existirem restrições pode-se obter uma solução explícita; em outro caso, deve-se usar um método iterativo de otimização. Adicionalmente, se faz alguma hipótese sobre a estrutura da lei de controle futura, como, por exemplo, que vai ser constante a partir de certo instante.

O sinal de controle u(t | t) é enviado ao processo enquanto que os seguintes sinais de controle calculados são desprezados, posto que no seguinte instante de amostragem já se conhece y(t + 1) e se repete o passo anterior com este novo valor e todas as sequências atualizadas. Calcula-se, portanto u(t + 1 | t + 1) (que em princípio será diferente a u(t + 1 | t) fazendo uso do conceito de horizonte deslizante.

2.1 Controle Preditivo Generalizado (GPC)

A técnica GPC se apoia no uso de modelos derivados de funções de transferência (matrizes de transferência no caso multivariável). O algoritmo GPC calcula as predições da saída da planta usando um preditor ótimo que permite encontrar o valor esperado da saída, como função dos controles futuros a partir de um modelo CARIMA (Controlled Auto-Regressive Integrated Moving-Average), tal como mostra a eq. (1).

onde u(t) e y(t) são a entrada e a saída respectivamente, v(t) é uma perturbação medida, d o atraso em períodos de amostragem, e(t) é um ruído branco de media nula e Δ =(1-z-1). A, B, C e D são polinômios com operador de deslocamento para trás z-1:

Como função objetivo o GPC utiliza a seguinte expressão:

onde w(t+j) é a referência, N1eN2 definem a janela de predição, Nu é o horizonte de controle eλ é a ponderação do controle. Os parâmetros de ajuste do controlador são N1,N2, Nu e λ . Normalmente N1,N2 e Nu se escolhem de acordo com as características do modelo dinâmico da planta e λ é usado para obter um controle mais ou menos suave.

Aplicando um preditor ótimo no modelo (1) se obtém:

onde

é um vetor que contém as saídas futuras do sistema:

e u é um vetor que contém os incrementos de controle futuros, tal que

f é a resposta livre obtida fazendo zero o controle futuro, G é a matriz que se pode calcular como a resposta da planta, quando se aplica um degrau unitário na variável manipulada, H é uma matriz definida como:

onde hi são os coeficientes da resposta do sistema a um degrau na perturbação (Camacho & Bordons, 2004).

Considerando λ(j) = λ constante, a expressão da função objetivo pode ser escrita como:

E em forma quadrática:

onde:

O mínimo de J pode ser calculado, quando não há restrições, igualando o gradiente de J a zero, obtendo-se:

Como o algoritmo é de horizonte deslizante, unicamente o primeiro sinal será aplicado. A lei de controle fica então:

Sendo K a primeira linha da matriz (GT G +λ I)-1GT .

As restrições impostas pelo processo podem ser resultado de limites na amplitude dos sinais de controle (Umin,Umax), limites nos incrementos dos sinais de controle do atuador (umin,umax) e limites nos sinais de saída (ymin,ymax) e podem matematicamente ser descritas, respectivamente, pelas seguintes expressões:

Onde I é uma matriz (N × m) × n formada por N matrizes identidade m × m, T é uma matriz bloco triangular inferior cujos blocos não nulos são matrizes identidade m × m. Essas restrições podem ser expressas de uma forma condensada como:

onde R e c estão definidas pelas seguintes relações:

O problema de otimização do MPC passa a ser definido como:

Se tem então o problema da otimização de uma função quadrática com restrições lineares que se conhece comumentemente como um problema de programação quadrática (Quadratic Programming, QP) e que deve ser resolvido através de métodos numéricos (Camacho & Bordons, 2004).

Uma das características principais dos processos não lineares é que apresentam diferentes ganhos estáticos equivalentes em diferentes faixas de operação. Desta forma, a ponderação do esforço de controle deve ser calculada de forma diferente para cada faixa.

Se dois processos têm diferentes ganhos estáticos e se deseja ponderar o esforço de controle da mesma forma nos dois casos, deve-se usar uma relação quadrática entre as ponderações.

Para mostrar esta relação, considere-se dois sistemas, o Sistema 1 (S1) com ganho estático ke1e o Sistema 2 (S2) com ganho estático ke2 com a mesma dinâmica. As respectivas matrizes de resposta ao degrau G1e G2 podem ser colocadas como:

onde G é a matriz de resposta ao degrau de um sistema com ganho estático unitário e a mesma dinâmica de S1 e S2. Como no cálculo de J a matriz G aparece de forma quadrática (ver eq. (9)), o efeito do ganho kei também é quadrático. Assim, para manter a relação entre e a ponderação do erro de forma uniforme nos dois sistemas, deve-se utilizar a relação dada por:

Esta idéia permite trabalhar com uma poderação do esforço de controle normalizada que altera o comportamento em malha fechada do sistema de forma uniforme.

Mesmo que este ajuste de lambda, a partir do ganho estático da planta, não garante que as respostas transitórias de malha fechada terão sempre as mesmas características, ele permite uniformizar as respostas, se comparado com o controle que não usa esta proposta. Como se verá nos exemplos apresentados nas próximas seções, os resultados são satisfatórios em todos os casos estudados.

3 ALGORITMO PROPOSTO E METODOLOGIA

A proposta de controle é baseada no uso de um único controlador GPC linear com as predições determinadas através de um modelo local linear atualizado de acordo com as condições de operação da planta. A penalização de controle é calculada e atualizada de acordo com o ganho do modelo local obtido usando a eq. (19). Para o desenvolvimento do algoritmo se propõe a seguinte metodologia.

Metodologia proposta para processos estáveis.

1. Supõe-se conhecido e validado um modelo não linear da planta a controlar.

2. Define-se o intervalo de operação da planta e as restrições do controle e da saída, caso existam.

3. A partir do processo, ou de seu modelo, determina-se sua característica estática.

4. Distribuem-se pontos de operação (PO) dentro do intervalo de operação da planta onde a curva estática apresenta mudanças apreciáveis de inclinação.

5. Para cada PO, realizam-se provas dinâmicas determinando constantes de tempo, tempos mortos e ganhos.

6. Determina-se a menor constante de tempo do sistema e se calcula o tempo de amostragem.

7. Determina-se um modelo tipo ARX (Auto-Regressive with exogenous inputs) em cada ponto de operação.

8. Ajusta-se o controlador preditivo para cada um dos pontos, considerando-se as restrições da saída e do controle, registrando-se os parâmetros de sintonia N, Nu e ponderações, mantendo um critério de comportamento uniforme.

9. Ajusta-se uma relação quadrática (do tipo apresentada na eq. (19)), entre os ganhos dos modelos obtidos no ponto 7 e as penalizações de controle obtidas em 8, referentes a cada ponto de operação.

10. Determina-se um modelo inverso estático da planta a controlar, a partir da característica estática obtida em 3. Este modelo pode ser obtido analiticamente em alguns casos ou por aproximações polinomiais dos dados obtidos experimentalmente ou por simulação do modelo não linear da planta.

O procedimento anterior é realizado off-line e providencia os dados para o desenvolvimento e aplicação do algoritmo de controle, cuja filosofia se apresenta a seguir.

Dois são os aspectos principais em que se baseia esta proposta de controle para plantas não lineares. O primeiro está relacionado com a identificação da dinâmica da planta a partir do PO presente, utilizando para isso o modelo não linear do processo. O segundo aspecto se refere a utilizar o ganho do modelo linear identificado para determinar a penalização do controle, no cálculo do preditor.

Em relação à identificação do modelo, considera-se uma técnica que pode ser definida como identificação direcionada, em direção ao movimento do controle. Contemplam-se a determinação de um modelo local no caso de mudanças de referências e outro para o caso de rejeição das perturbações. No primeiro caso, a idéia da identificação direcionada da dinâmica da planta, a partir do modelo não linear, é determinar, em um tempo de amostragem e em cada mudança de referência, um modelo que represente a dinâmica da planta desde o PO atual até o novo PO. Ressalta-se o fato de que a identificação é sobre o modelo não linear (MNL) da planta e se realiza em malha aberta. A figura 3 ilustra o processo de identificação. O controle requerido (UEE ) para levar a planta ao novo PO é determinado utilizando o modelo estático inverso da planta (MEI). O modelo é obtido utilizando como sinal de excitação um degrau de amplitude u=UEE ueq), necessário para estabelecer finalmente a saída na nova referência. No mesmo tempo de amostragem, e utilizando o modelo não linear da planta, se determina a evolução da saída da planta (ye) para o controle calculado previamente (UEE ). Considera-se t=0 no instante da mudança de referência e o número de dados registrados para a identificação é igual ao horizonte de predição N2-N1, que deve cobrir o tempo de acomodação mais alto do sistema. Observa-se que, para a identificação do modelo ARX, utilizam-se os valores incrementais de controle e saída, δue δy respectivamente (com δy=ye-yeq). O resultado desta identificação são os coeficientes dos polinômios Ak+1 eBk+1 do modelo ARX a ser usado no preditor do GPC. No caso o processo tenha tempo morto, esse se determina mediante um procedimento exposto mais adiante de tal maneira que este parâmetro fica fora do processo de identificação anterior.


A identificação realizada desta forma permite obter um modelo linear paramétrico que captura a dinâmica da planta entre o PO atual e o novo PO solicitado.

Para entender melhor o processo de identificação utiliza-se a figura 4 que representa um diagrama de fluxo do processo de identificação realizado on-line pelo algoritmo proposto. Uma vez produzida uma mudança na referência, calcula-se o sinal absoluto do controle necessário (UEE ), mediante MEI, para estabelecer a planta no novo PO. Logo, utilizando este sinal de controle, se determina por simulação a trajetória da saída ye da planta, mediante o bloco MNL, e se registra o conjunto de N pontos. A seguir, se determina o delta de controle, δu, necessário para levar a planta desde o PO atual (ueq,yeq ) ao novo PO. Finalmente, se determina e registra a variação da saída δy (N amostras) desde o PO atual até o novo PO. Com os dados de δ y registrados e considerando a entrada como um sinal degrau determina-se o modelo ARX local para as predições.


Simulações com modelos não lineares, de distintas características, foram realizadas para comprovar que utilizando um modelo ARX de baixa ordem é possível capturar a dinâmica não linear da planta desde o PO atual até o novo PO.

Para ilustrar as propriedades desta modelagem apresentamse a seguir dois exemplos. A figura 5 registra as respostas, para uma entrada degrau do ponto de operação PO1 até PO2, de três modelos, um modelo não linear de um CSTR (Continuous Stirred Tank Reactor) (Gao et al., 2002), e de dois modelos lineares obtidos a partir deste modelo. O modelo 1 é obtido com a metodologia aqui proposta e o modelo 2 é obtido mediante linearização Jacobiana no PO1, que é o método utilizado normalmente na técnica de modelos locais e que utiliza uma aproximação da série de Taylor de primeira ordem. É preciso adicionar que, ainda com uma aproximação da série de Taylor de ordem maior, o modelo assim obtido representa só a dinâmica da planta ao redor do PO atual e não a dinâmica até o novo PO. A figura 6 mostra uma experiência similar à anterior utilizando um modelo não linear discreto com dinâmica complexa (Lazar, M., 2001), este modelo é usado no exemplo 1 da seção 4. Novamente, para um degrau de PO1 até PO2, um modelo linear é obtido com a metodologia proposta e outro modelo linear é obtido aplicando a técnica da curva de reação no PO1. Em ambos os casos as saídas do modelo não linear e do modelo linear proposto praticamente se superpõem. No entanto, se observa que os modelos locais linearizados não são capazes de seguir a dinâmica da planta desde o PO1 até PO2. Em relação à estrutura do modelo ARX, e após realizar dezenas de identificações, determinou-se que a estrutura que produz resultados adequados para todos os casos, quando não se considera o tempo morto, é na=4, nb=4. Em Wojsznis et al. (2003) se registra que a ordem quatro para modelos ARX satisfaz a maioria das aplicações práticas. A filosofia da proposta é procurar simplificar os procedimentos em benefício da praticidade de sua aplicação.



No caso de o sistema não linear apresentar tempo morto é possivel estimar seu valor, antes do processo de identificação, mediante uma simples prova de curva de reação, determinando-se, desta forma, o valor de dk na estrutura do modelo ARX. Como o modelo não linear é simulado sem ruído, muitos dos problemas apresentados pelos algoritmos de identificação de sistemas com atraso não afetam o cálculo neste caso. Portanto, no caso de tempos mortos modelados é simples determinar este parâmetro em cada PO da planta.

Técnicas de modelos locais mais elaboradas como LMN (Linear Model Network) poderiam ser usadas para capturar a dinâmica dos sistemas não lineares com melhor fidelidade que os métodos de linearizações locais, mas, como se demonstra na seção 4, a proposta mostra um melhor desempenho que esta técnica e com um custo computacional menor.

O modelo assim obtido só é válido para a transição entre esses dois PO. Portanto, estabelecida a planta na nova referência, se determina um novo modelo para a rejeição das perturbações.

Para obter este modelo se utiliza a técnica da curva de reação aplicando um degrau do controle acima do PO e outro em direção oposta no MNL da planta. Com os dados assim obtidos se identifica um modelo aproximado, ao redor do PO atual.

Na maioria dos controladores preditivos, incluindo os não lineares, os parâmetros de sintonia N, Nu e λ são ajustados com valores constantes para satisfazer um comportamento adequado em todo o intervalo de operação da planta. Esta forma de sintonizar o controlador pode limitar a performance do controle em certas regiões de operação da planta, principalmente no que se refere a tempos de acomodação.

Neste algoritmo, a penalização do controle fica dependente do ganho do modelo da planta no ponto de operação atual. Este procedimento fornece uma resposta mais uniforme do sinal controlado, em toda a faixa de operação, possibilitando desta forma alcançar tempos de acomodação uniformes e mais ajustados. Uma aplicação que avalia este procedimento pode ser encontrada em (Altinten, 2007), onde a penalização do controle foi variada para alcançar ótimo desempenho do GPC no controle de pH.

Para incorporar ações de pré-alimentação nos controladores preditivos é necessario ter um modelo da perturbação e esta deve ser medível (Camacho & Bordons, 2004). No caso não linear é possivel obter um modelo linear do efeito das perturbações no PO da planta. Este modelo linear é obtido mediante a técnica da curva de reação aplicada no MNL da planta no PO. A proposta permite realizar esta ação de pré-alimentação através da incorporação deste modelo na predição.

4 APLICAÇÕES

Nesta seção a técnica proposta é aplicada a dois sistemas não lineares. No primeiro exemplo se estuda um sistema bastante tratado na literatura de controle não linear. Na segunda aplicação se decreve passo a passo o procedimento proposto para o projeto do controlador para um processo de pH e os resultados são comparados com outros algoritmos propostos na literatura e que fazem uso de modelos locais para o cálculo

Para as simulações apresentadas aqui, foi utilizado o Matlab 7.0 e um computador Toshiba, modelo Satellite 2410, Processador x86, GenuineIntel, 2 GHz, RAM 256 MB, Cache 256 KB. Já para o algoritmo de controle preditivo, foi usada a função quadprog do Matlab optimization Toolbox.

4.1 Exemplo ilustrativo

Para apresentar a abordagem proposta, escolhe-se, em primeiro lugar, um sistema que exibe dinâmicas diferentes no seu intervalo de operação (Lazar, 2001). O modelo não linear, do tipo SISO, mostra-se na eq. (20).

A figura 7 registra a característica estática do sistema a controlar. Observa-se nesta figura que o sistema apresenta uma Amostras não linearidade mais acentuada para valores do controle menores que 0.5.


A característica estática inversa do sistema determina-se, neste caso, diretamente da eq. (20). Fazendo y(k)=y(k1)=y(k-2)=yeq e u(k)=ueq , se obtem a seguinte equação:

Esta relação permite calcular o controle necessário para atingir a saída desejada.

A figura 8 mostra a saída do sistema em malha aberta para diferentes valores do controle. Observa-se a dinâmica particular que apresenta este sistema, com tempos de acomodação diferentes e respostas sub-amortecidas e sobre-amortecidas.


A figura 9 mostra o resultado obtido com a aplicação do controle proposto para uma seqüência de mudanças de referência. A aplicação do algoritmo de controle consegue um bom seguimento das referências. Observa-se também que o esforço do controle é bastante aceitável, sem picos e uniforme.


Neste exemplo o tempo de CPU consumido é menor que 0.05 segundos e é devido, principalmente, ao processo de identificação. O horizonte de predição e controle foram 15 e 5, respectivamente. Assim como foi exposto na seção 3, o horizonte de predição deve cobrir o tempo de acomodação maior do sistema. Também, como foi registrado na seção 3, a ordem da identificação do modelo ARX foi na=4, nb=4, utilizando-se para ele a rotina de estimação de mínimos quadrados do Matlab disponível para este tipo de modelo.

As figuras 10 e 11 mostram, respectivamente, a dinâmica do sistema e do modelo identificado para o caso da primeira e terceira mudança de referência (SP), apresentadas na figura 8. O baixo índice SQE (soma do quadrado dos erros) registrado avalia a fidelidade do modelo.



Para testar o controle na rejeição de perturbações se realizaram duas provas. Aplicou-se um degrau de 10%, do valor máximo do intervalo de controle, à entrada do sistema, na amostra 65, e uma perturbação na saída, também de 10% da saída máxima, na amostra 80. A figura 12 registra a resposta e o controle para ambas as situações.


Observa-se que, ainda mantendo a perturbação na entrada do sistema, o controlador consegue um bom desempenho diante da perturbação da saída aplicada na amostra 80 e diante uma nova mudança na referência feita na amostra 93.

A figura 13 ilustra a saída e controle para a mesma sequência de mudanças na referência mostrada na figura 9. A diferença com o teste anterior é que se considera uma penalização constante no cálculo de J. A penalização foi ajustada para obter um comportamento similar ao caso anterior no centro da faixa de operação. Observa-se uma oscilação no controle e saída na primeira mudança de referência.


Neste caso particular as diferenças não são muito significativas, uma vez que a característica estática do sistema tem um baixo grau de não linearidade, principalmente a partir do ponto de equilíbrio (0.8, 2.0).

Na próxima seção, o algoritmo aplica-se numa planta de pH com característica estática altamente não linear.

4.2 Controle de PH

Um diagrama esquemático simplificado de uma planta de neutralização de pH mostra-se na figura 14. O processo consiste de uma vazão de ácido (q1), vazão de tampão (q2) e vazão de base (q3) que são misturados no tanque. Para esta aplicação a vazão de ácido e de base são reguladas com válvulas de controle de vazão e a vazão do tampão é regulada manualmente com o auxilio de um rotâmetro. A vazão de saída é dependente da altura do fluído dentro do tanque e da posição da válvula de saída que é posicionada manualmente. O objetivo do controle neste caso é o controle de pH da vazão de saída q4 variando a vazão de entrada de base q3.


As variáveis medidas são o nível do tanque e o pH.

Os parâmetros nominais para o sistema são resumidos na tabela 1. Uma descrição mais detalhada do processo encontrase em Nahas et al. (1992) e Henson & Seborg (1994).

Os modelos desenvolvidos para o projeto do controlador preditivo e para a simulação da planta consideram, inicialmente, dinâmicas desprezíveis e sem atraso dos transmissores de nível, pH e válvula de controle.

Com estas simplificações se obtém um modelo não linear no espaço de estados do processo.

O equilíbrio químico para o processo é obtido pela definição de duas reações invariantes para cada fluxo de entrada e saída (i ε[1,4]):

Onde:

Wai:Concentração da especie invariante referida à carga (M)

Wbi: Concentração do íon carbonato (M)

Definem-se variáveis de estado, perturbações e saída como segue.

O modelo do processo é dado por:

onde:

e

onde:

pK1 e pK2 são a primeira e segunda constantes de disossiação do ácido fraco, H2CO3.

Derivando c(x,y), se obtém:

Onde cy (x,y) e cx(y) são:

e correspondem respectivamente a:

Para esta planta o ganho estático entre a vazão de base e o pH varia conforme se observa na figura 15. Esta curva representa a característica estática do processo de pH.


4.2.1 Configuração e ajuste do controle

Seguindo o procedimento proposto na seção 3, define-se a faixa de operação da planta para pH entre 3 e 11. Dentro desta faixa e de acordo com a característica estática da planta, definem-se 5 pontos de operação estáveis, cada um no centro das zonas de inclinação constante da característica estática. Nas provas dinâmicas, feitas em cada ponto de operação, determinam-se a constante de tempo, o ganho e o tempo morto de um modelo de primeira ordem com atraso (ver Tabela 2).

A partir da constante de tempo mínima (0.62 min) se determina o tempo de amostragem (12 seg) e escolhe-se para o horizonte de predição N=40 para cobrir o maior tempo de acomodação obtido nos testes dinâmicos. O horizonte de controle Nu foi calculado como 1/3 do horizonte de predição.

Para cada PO identifica-se um modelo tipo ARX e ajusta-se um controlador, com um mesmo critério de comportamento. O ajuste para cada ponto de operação foi realizado considerando para a saída o menor tempo de acomodação, sem ultrapassagem. A Tabela 3 registra os valores dos parâmetros de ajuste do controlador preditivo para cada PO definido na característica estática.

Com os dados de ajuste deλ e os ganhos dos modelos ARX obtidos, ajusta-se a seguinte relação quadrática, eq. (34), onde An representa o parâmetro a determinar:

Esta última equação representa, como já foi comentado anteriormente, uma penalização ponderada do controle. Para os valores da tabela 3, obte-se λn =300. Este valor pode ser reajustado a valores menores para obter tempos de acomodação mais baixos, mas com certo nível de ultrapassagem na saída da planta, ou maiores para obter respostas mais lentas com a vantagem de que um único parâmetro de ajuste per-mite alterar de forma uniforme as respostas em toda a faixa de operação.

A relação dada na eq. (34) é utilizada no cálculo da penalização do controle em cada tempo de amostragem. Para o cálculo, determina-se o ganho Ke do modelo obtido na identificação em tempo real.

Finalmente determina-se um modelo inverso estático da planta a controlar. Para obter este modelo se utiliza a ca-Tempo (min) racterística estática inversa mostrada na figura 16.


A eq. (35) representa o modelo matemático ajustado à característica estática inversa da planta, onde x é a vazão base e y é o pH.

A figura 17 representa os resultados obtidos com o controle proposto para diferentes mudanças na referência e um valor de An = 300.


Como se observa na figura, a aplicação do controle gera uma resposta uniforme em todo o intervalo de operação da planta.

4.2.2 Estudo Comparativo

Nesta seção comparam-se os resultados do controle proposto com os obtidos em Kouvaritakis & Cannon (2001), onde se utilizaram redes locais e as estratégias LM-GPC e LC-GPC. Utilizam-se a mesma planta e as mesmas condições de teste da quele trabalho que não considera restrições.

Para efeitos de comparação, se consideram dois casos de ajuste: lambda normalizado e lambda fixo. Para o caso de ponderação normalizada um novo valor de An=160 é usado, com a finalidade de ajustar as respostas da planta às respostas registradas em Kouvaritakis & Cannon (2001) que apresentam certo nível de ultrapassagem. Deve ser lembrado que inicialmente o ajuste para cada ponto de operação foi realizado considerando para a saída o menor tempo de acomodação, sem ultrapassagem.

Como se observa da figura 18, a aplicação do controle gera novamente uma resposta uniforme em todo o intervalo de operação da planta mas com tempos de acomodação menores e uma pequena ultrapassagem para o pH de 8. Além disso o sinal de controle tem um comportamento quase sem picos com suaves mudanças de inclinação.


Para o caso onde se mantém lambda num valor fixo de 35, a solução obtida, como se observa na figura 19, tem um comportamento que varia de acordo com o ponto de operação solicitado.


Na Tabela 4 são mostrados os resultados do estudo comparativo. Observam-se as vantagens do método em relação à uniformidade dos tempos de acomodação principalmente nas mudanças de referência de pH=7 a pH=8 e de pH=9 a pH=10. Observe-se também que no caso de controlador proposto, 9.1 com lambda fixo, os tempos de acomodação e ultrapassagem máxima ainda são melhores que os resultados obtidos 9 em Kouvaritakis & Cannon (2001). 8.95

A figura 20 registra o comportamento do controle e da saída da planta frente a perturbações na vazão da base ao mudar esta de 0.55 ml/s a 0.15 ml/s e operando no pH de 7.0.


figura 21 mostra o mesmo experimento de rejeição de perturbações para um ponto de operação de pH=9.0.


Comparando com os resultados obtidos em Kouvaritakis & Cannon (2001), sob as mesmas condições, se observam na Tabela 5 vantagens tanto na amplitude como nos tempos de acomodação da saída. Como exemplo, para a referência de pH= 7.0 e aplicando a nova proposta, o pH varia entre 6.9 a 7.12 com um tempo de acomodação de aproximadamente 6 minutos.

Entretanto, em Kouvaritakis & Cannon (2001), considerando seu melhor caso, o pH varia entre 6.65 a 7.12 com um tempo de acomodação de aproximadamente 10 minutos.

4.2.3 Análise do caso com restrições

Para ilustrar o manejo das restrições do controlador proposto se define na saída da planta uma restrição no pH de 6.7, como limite a não ser ultrapassado. Operando a planta no PO de pH=6.5 se aplica uma perturbção na vazão da base mudando esta de 0.55 ml/s a 0.95 ml/s. As figuras 22 e 23 mostram o caso sem e com restrições, respectivamente.



Como pode ser observado, o controlador com restrições respeita os limites impostos mantendo a caraterística suave do sinal de controle. Esta é uma importante vantagem do controle preditivo.

4.2.4 Análise do caso com tempo morto

Na seguinte simulação se supõe que o processo apresenta um tempo morto de 1.5 minutos. O tempo morto considerado é constante em toda a faixa de operação da planta e pode ser o resultado, por exemplo, do atraso na medição do pH causado pelo transporte do fluído até o medidor e pelo tempo de processamento do sensor. Neste caso o parametro dk, do modelo linear, se mantém constante e igual a 8.

Ressalta-se que, para alguns dos PO, registrados na tabela 2, o atraso é maior que a constante de tempo respectiva. A figura 24(a) registra a saída da planta para distintas mudanças na referência. Observa-se que se mantêm as mesmas características de comportamento da saída do sistema sem tempo morto, registradas na figura 17. A figura 24(b) mostra, em detalhe, a saída da planta quando a referência vai de pH=5 a pH=6 . Pode-se observar, nesta última figura, que o tempo morto é de 1.5 minuto e que a saída da planta tem uma boa resposta de acordo com o critério de comportamento estipulado no projeto. Esta é uma importante vantagem do controle preditivo.



4.2.5 Caso de mudanças maiores na referência

Finalmente se aplicam duas mudanças de referências de maior amplitude para testar o algoritmo em outras situações onde o efeito das não linearidades é mais importante. Na figura 25 se mostram os resultados obtidos. Observa-se a uniformidade das respostas em tempos de acomodação, ultrapassagem e também no esforço de controle.


5 CONCLUSÕES E PERSPECTIVAS

Apresentou-se neste trabalho um controlador MPC não linear utilizando uma nova técnica no contexto de modelos locais. O método utiliza, da mesma forma que outros da mesma família, um modelo não linear para obter a informação necessária para o cálculo do controle. Porém, não usa métodos iterativos para o cálculo do controle nem ponderação entre vários modelos e sim um único modelo linear que se adapta ao ponto de operação do processo. Esta característica torna

o método proposto uma ferramenta de simples aplicação e entendimento.

O algortimo é testado em dois casos de estudo e os resultados obtidos são sempre superiores aos conseguidos por outros métodos.

O uso de uma penalização do esforço do controle em função do ganho do processo permite um bom comportamento e uniformidade na saída e controle, em todo o intervalo de operação da planta.

O algoritmo proposto mostrou ser bastante simples e eficiente para estabelecer a variável controlada em seu novo ponto de operação e também de rejeitar satisfatoriamente as perturbações. O tempo de computação é reduzido a um simples processo de identificação e de otimização quadrática.

Artigo submetido em 18/09/2008 (Id.: 00896)

Revisado em 06/12/2008, 24/04/2009, 27/05/2009

Aceito sob recomendação do Editor Associado Prof. Takashi Yoneyama

  • Altinten, A. (2007). Generalized predictive control applied to a pH neutralization process, Computers and Chemical Engineering, Vol.31, No.10, pp. 1199-1204.
  • Arahal, M. R., Berenguel, M. & Camacho, E. F. (1998). Neural Identification Applied to Predictive Control of a Solar Plant, Control Engineering Practice, Vol. 6, No.3, pp. 333-344.
  • Bequette, B. W. (1991). Non-linear control of chemical processes: a review, Ind. Engng. Chem. Res, Vol.30, pp. 1391-1413.
  • Brengel, D. M. & Seider, W. D. (1989). Multistep non-linear predictive controller. Ind. Engng. Chem. Res.,Vol. 28, pp.1812-1822.
  • Camacho, E. F. & Bordons, C. (2004). Model Predictive Control, Springer-Verlag, London, United Kingdom.
  • Clarke, D. W., Mohtadi, C. & Tuffs, P. S. (1987). Generalized predictive control: Part I: The basic algorithm and Part II: Extensions and interpretations, Automatica, Vol.23, No.2, pp. 137-160.
  • Cutler, C. R., & Ramaker, B. C. (1980). Dynamic matrix control: A computer control algorithm, Proceedings of American Control Conference, Paper WP5-B.
  • De Keyser, R. M. C. & Van Cuawenberghe, A. R. (1985). Extended prediction self-adaptive control, Proceedings of IFAC Symposium on Identification and System Parameter Estimation, York, pp. 1317-1322.
  • De Keyser, R. & Lazar, M. (2003). A 'Gent'-le Approach to Nonlinear Predictive Control, the NEPSAC Strategy, Plenary Paper in the ACA-Congress of the Automatic Control Association, Medellin, Colombia.
  • Doyle, F. J., Pearson, R. K. & Ogunnaike, B. A. (2001). Identification and Control Using Volterra Models, Springer, London, United Kingdom.
  • Gao, R., O'Dwyer, A. & Coyle, E. (2002). Model Predictive Control of CSTR Based on Local Model Networks, Proceedings of the Irish Signals and systems Conference, University College, pp. 397-402.
  • Hernandez, E. & Arkun, Y. (1991). A Non-linear DMC Controller: Some Modeling and Robustness Considerations, Proceedings of the American Control Conference, Boston, MA.
  • Henson, M.A. & Seborg, D. E. (1994). Adaptive non-linear Control of a pH Neutralization process, IEEE Transactions on Control Systems Technology, Vol.2, No.3, pp. 169-182.
  • Henson, M. A. (1998). Non-linear model predictive control: Currente status and future directions, Computers and Chemical Engineering, Vol.23, pp. 187-202.
  • Kouvaritakis, B., Cannon, M. & Rossiter, J. A. (1999). Non-linear model based predictive control, International Journal of Control, Vol. 72, No.10, pp. 919-928.
  • Kouvaritakis, B. & Cannon, M. (2001). Non-linear predictive control, chapter: Non-linear Model Based Predictive Control Using Multiple Local Models, The Institute of Electrical Engineers: London, United Kingdom.
  • Lazar, M. (2001). Non-linear Controler Based on the EPSAC Approach, Master's thesis, University of Ghent, Department of Control, Engineering and Automation. Flanders, Belgium.
  • Nahas, E.P., Henson, M.A. & Seborg, D.E. (1992). Non-linear internal model control strategy for neural network models, Computers Chem. Eng, Vol.16, No.12, pp. 1039-1057.
  • Nevistic, V. & Morari, M. (1995). Constrained control of feedback-linearizable systems, Proceedings of. European Control Conference., Rome, Italy, pp. 1726-1731.
  • Normey-Rico, J. E. & Camacho, E. F. (2007). Control of Dead-time Processes, Springer-Verlag, London Limited, United Kingdom.
  • Plucenio, A., Normey, J., Pagano, D. & Bruciapaglia, A. (2007). Controle preditivo não linear na indústria do petróleo e gás, 4˚ PDPETRO, Campinas, SP, 21-24 Outubro.
  • Richalet, J., Rault, A., Testud, J. L. & Papon, J. (1978). Model Predictive Heuristic Control: Applications to Industrial Process, Automatica, Vol.14, No.2, pp. 413-428.
  • Scokaert, P. O. M., Mayne, D. Q. & Rawlings, J. B. (1999). Suboptimal model predictive control (feasibility implies stability), IEEE Transactions on Automatic Control, Vol.44, No.3, pp. 648-654.
  • Shorten, R. & Murray-Smith, R. (1997). Side-effects of normalising basis functions, in Multiple model approaches to modelling and control, (Taylor and Francis), pp. 221- 28.
  • Wojsznis, W., Gudaz, J., Blevins, T. & Mehta, A. (2003). Practical approach to tuning MPC. ISA Transactions, Vol. 42, pp. 149162.
  • Zheng, A., & Zhang, W. (2001). Non-linear Predictive Control, chapter: Computationally Efficient Non-linear Model Predictive Control Algorithm for Control of Constrained Non-linear Systems, IEE Control Engineering series

Publication Dates

  • Publication in this collection
    29 Jan 2010
  • Date of issue
    Dec 2009

History

  • Accepted
    27 May 2009
  • Reviewed
    27 May 2009
  • Received
    18 Sept 2008
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br