Acessibilidade / Reportar erro

O controle em cascata de sistemas pneumáticos de posicionamento

Resumos

Este trabalho trata do controle dos sistemas pneumáticos de posicionamento e propõe uma estratégia em cascata que possibilita superação de diversos obstáculos inerentes ao seguimento preciso de trajetórias com estes sistemas. A convergência exponencial dos erros de seguimento em malha fechada no caso ideal é demonstrada utilizando o método de Lyapunov. Apresentam-se também as propriedades de robustez da malha fechada. Uma implementação experimental atesta a eficácia da estratégia.

Atuadores pneumáticos; controle em cascata; robótica; linearização por realimentação


This work deals with the control of pneumatic positioning systems and propose a cascade strategy that alow us to overcome several obstacles to the trajectory tracking in pneumatic systems. The exponential convergence of the closed loop trajectory tracking errors in the ideal case is demonstrated using Lyapunov's method. The robustness properties of the closed loop system are also presented. An experimental implementation attests the effectiveness of this strategy.

Pneumatic drives; cascade control; robotics; feedback linearizations


ROBÓTICA

O controle em cascata de sistemas pneumáticos de posicionamento

Raul GuentherI; Eduardo André PerondiII

ILaboratório de Robótica - CTC - UFSC - Caixa Postal 476,CEP 88040-900 - Florianópolis SC

IIDepartamento de Engenharia Mecânica - Escola de Engenharia - UFRGS, CEP 90050 - 000 - Porto Alegre RS

ABSTRACT

This work deals with the control of pneumatic positioning systems and propose a cascade strategy that alow us to overcome several obstacles to the trajectory tracking in pneumatic systems. The exponential convergence of the closed loop trajectory tracking errors in the ideal case is demonstrated using Lyapunov's method. The robustness properties of the closed loop system are also presented. An experimental implementation attests the effectiveness of this strategy.

Keywords: Pneumatic drives, cascade control, robotics, feedback linearizations.

RESUMO

Este trabalho trata do controle dos sistemas pneumáticos de posicionamento e propõe uma estratégia em cascata que possibilita superação de diversos obstáculos inerentes ao seguimento preciso de trajetórias com estes sistemas. A convergência exponencial dos erros de seguimento em malha fechada no caso ideal é demonstrada utilizando o método de Lyapunov. Apresentam-se também as propriedades de robustez da malha fechada. Uma implementação experimental atesta a eficácia da estratégia.

Palavras-chave: Atuadores pneumáticos, controle em cascata, robótica, linearização por realimentação.

1 INTRODUÇÃO

Os sistemas que possibilitam posicionar uma carga mecânica localizada através de uma coordenada "y" são chamados de sistemas de posicionamento. Esta localização pode ser fixa ou variável no tempo, ou seja, y(t), e nestes casos os sistemas de posicionamento são, algumas vezes, chamados de seguidores.

Os sistemas de posicionamento são utilizados em diversas aplicações dentre as quais pode-se citar laminadores, turbinas hidráulicas, máquinas agrícolas, lemes de aeronaves, antenas, telescópios, direcionadores de foguetes, máquinas de precisão e robôs manipuladores.

Um componente importante do sistema é o elemento que aplica a força sobre a carga mecânica para levá-la até a posição desejada. Este elemento é chamado de motor ou acionamento e pode ser elétrico, hidráulico ou pneumático. Uma discussão sobre as características e aplicações de cada um desses motores pode ser encontrada em Bollmann e Guenther (1997). Aqui, discutem-se as características dos sistemas com acionamento pneumático, doravante denominados sistemas pneumáticos de posicionamento, compostos basicamente por uma servoválvula que controla a vazão de ar na direção de um cilindro, a cujo êmbolo está ligada a massa a ser posicionada.

Os sistemas pneumáticos de posicionamento são relativamente baratos, leves e de fácil instalação, apresentando também uma boa relação entre a força aplicada e o seu peso. Isso os torna bastante atraentes para diversas aplicações.

A estrutura dinâmica do sistema com parcelas oscilatórias introduzidas pela compressibilidade do ar, as não linearidades associadas ao escoamento do ar na servoválvula e ao atrito entre o êmbolo e a camisa do cilindro em conjunção com os atrasos devidos à baixa velocidade de propagação das ondas de pressão no ar, tornam os sistemas pneumáticos de posicionamento difíceis de serem controlados de forma a obter-se o desempenho necessário para diversas tarefas de posicionamento.

O objetivo de desenvolver sistemas pneumáticos de posicionamento rápidos e precisos tem motivado diversos trabalhos em controle (veja seção 4). Busca-se superar os problemas inerentes aos sistemas pneumáticos empregando técnicas de controle adequadas.

Este trabalho é desenvolvido dentro desta linha. Propõe-se aqui uma estratégia de controle em cascata que permite (i) superar as não linearidades associadas ao escoamento do ar na servoválvula, (ii) mantém limitadas as oscilações devido à compressibilidade do ar e, (iii) cria um caminho para enfrentar as dificuldades introduzidas pelo atrito entre o êmbolo e a camisa do cilindro.

A estratégia consiste em interpretar o sistema de posicionamento como dois subsistemas interconectados: um subsistema mecânico comandado por uma lei de controle capaz de garantir sua estabilidade na presença de perturbações, e um subsistema pneumático onde, após uma linearização por realimentação, é empregada uma lei de controle proporcional.

Após a descrição do sistema na seção 2, apresenta-se, na seção 3, sua modelagem dinâmica, utilizada no projeto de controlador e na discussão das características de controle dos sistemas de posicionamento pneumáticos apresentada na seção 4. Nas seções 5, 6 e 7 descreve-se o controlador em cascata e apresentam-se suas propriedades de estabilidade e de robustez. Os resultados experimentais são apresentados e comentados na seção 8. Na seção 9 delineiam-se algumas conclusões.

2 O SISTEMA DE POSICIONAMENTO

Os elementos básicos do sistema em estudo estão esquematizados na Fig. 1. O sistema consiste de uma servoválvula direcional e de um cilindro de dupla ação com transmissão de movimento por fita, cujo êmbolo é conectado a uma carga inercial (M).


A carga inercial é deslocada utilizando a energia pneumática armazenada em um vaso de pressão, onde o ar é mantido a uma pressão de suprimento ps. O fluxo de ar sob pressão é direcionado através da servoválvula. Deslocando o carretel da servoválvula de xv para a esquerda, por exemplo, a câmara 1 é conectada com o reservatório e a câmara 2 é conectada com a atmosfera. Como a pressão no reservatório (ps) é maior do que a pressão na câmara 1 (p1), surge uma vazão mássica de ar do reservatório para a câmara 1 (qm1). Simultaneamente, como a pressão na câmara 2 (p2) é maior do que a pressão atmosférica (patm), surge uma vazão mássica de ar da câmara 2 para a atmosfera (qm2). Com isso a pressão na câmara 1 aumenta e a pressão na câmara 2 diminui. A diferença de pressões (pD = p1 - p2 ) gera a força que provoca o deslocamento da carga.

Muitas vezes o deslocamento do carretel da válvula (xv) é provocado por uma tensão (u) aplicada em um solenóide. Desta forma, a dinâmica deste sistema tem como entrada a tensão u e como saída o deslocamento y do êmbolo do cilindro (ou da massa Macoplada). Essa dinâmica compreende a relação entre a tensão aplicada u (entrada) e o deslocamento xv do carretel (dinâmica da válvula), as relações entre as aberturas na válvula (ocasionadas pelo deslocamento do carretel) e as vazões mássicas de ar através da válvula, as relações entre as vazões mássicas nas câmaras do cilindro e as pressões que elas provocam, e a relação entre a diferença de pressões e o deslocamento do êmbolo y (saída).

3 O MODELO DINÂMICO

De acordo com o funcionamento do sistema pneumático descrito na seção anterior, o modelo dinâmico estabelece a relação entre a tensão no solenóide u e o deslocamento do êmbolo do cilindroy.

Neste trabalho a dinâmica da válvula (relação entre a tensão aplicada u e o deslocamento do carretel) é considerada suficientemente rápida para poder ser desprezada.

O modelo para o sistema é obtido a partir da descrição das relações entre as vazões mássicas nas câmaras do cilindro e as pressões ocasionadas, e da relação entre a diferença de pressões e o deslocamento do êmbolo y. A descrição das vazões mássicas de ar no cilindro é feita usando a conservação da energia. A relação entre a diferença de pressões e o deslocamento do êmbolo é obtida usando a 2a lei de Newton.

Considerando o volume de controle indicado na Fig. 2, a conservação da energia é empregada para realizar o balanço entre a energia interna da massa que entra no volume de controle, a potência do movimento do pistão e a variação da energia interna no volume de controle. A pressão a montante (upstream) do orifício é denominada pu e a pressão a jusante (downstream) pd .


Para o volume de controle correspondente à câmara 1, a energia interna da massa que entra é Cpqm1T, onde Cp é o calor específico do ar a pressão constante, T é a temperatura do ar de suprimento, qm1 = (dm1/dt) é a vazão mássica na câmara 1. A potência do movimento do pistão é p1

1, onde p1 é a pressão na câmara 1 e 1 = (dV1/dt) é a vazão volumétrica. A variação na energia interna do volume de controle é d(CVr1V1T)/dt, onde CV é o calor específico do ar a volume constante e r1 é a massa específica do ar. Como em Virvalo (1995), Bobrow e McDonell (1998), Göttert e Neumann (1999) e Brun et al. (2000) a temperatura do ar nas câmaras é assumida como constante e igual à temperatura do ar de suprimento. Definindo a relação de calores específicos r = CP/CV e lembrando que para um gás ideal a equação da massa específica é r1 = p (RT), sendo R a constante do gás, pode-se realizar o balanço energético, do qual resulta

onde a potência calorífica dissipada através das paredes do cilindro é desprezada. O volume total na câmara 1 é dado por V1 = Ay + V10 , onde A é a área do embolo, y é o deslocamento do embolo e V10 é o volume morto na câmara 1 incluindo as tubulações. A taxa de variação deste volume é 1 = A, onde = dy/dté a velocidade do êmbolo. Com isso, resolvendo a Eq.(3) para 1, após efetuar a derivada do termo da direita, chega-se a

onde foi utilizada a relação Cp = (rR)/(r – 1)(veja por exemplo Streeter, 1981). De forma semelhante, sendo L o comprimento útil do cilindro, para a câmara 2 obtém-se:

Assumindo que as vazões mássicas são funções das pressões no cilindro e da tensão aplicada à servoválvula u, ou seja, qm1 = qm1 (p1, u) e qm2 = qm2 (p2, u), as expressões (3) e (3) resultam:

O equilíbrio de forças no êmbolo é obtido pela aplicação da 2a lei de Newton, e resulta:

onde M é a massa deslocada, Fa é a força de atrito, Fe é a força externa e ApD é a força resultante da diferença de pressão entre as câmaras (ver Fig. 3).


As equações (4), (5) e (6) constituem um modelo dinâmico de quarta ordem do sistema pneumático de posicionamento, cujas variáveis de estado podem ser x = [ y p1p2 ]T. Sua não linearidade é caracterizada pelo produto e quociente de variáveis de estado presentes nas relações (4) e (5), pela não linearidade das funções que descrevem as vazões mássicas qm1 = qm1 (p1, u) e qm2 = qm2 (p2, u), e pela parcela de atrito estático presente em Fa .

Observação 1 (modelo linear): Expandindo as funções que descrevem as vazões mássicas em série de Taylor em torno de um ponto de funcionamento chega-se a um modelo linear de quarta ordem com um zero (Perondi e Guenther, 1999). Se o ponto de funcionamento é o ponto central do cilindro o zero cancela um pólo e a função de transferência do sistema de terceira ordem resultante é:

Observação 2: Utilizando as expressões (4) e (5) pode-se escrever a derivada da diferença de pressão em relação ao tempo como

onde os termos que dependem da tensão na servoválvula u estão agrupados em uma função = (p1, p2, y, u), e os termos que independem da tensão estão agrupados em uma função = (p1, p2, y, ), ou seja:

As expressões (6) e (8) são uma outra forma de descrever o sistema não linear de quarta ordem e são utilizadas na seção 5.

4 O CONTROLE DO SISTEMA

O objetivo de controle é obter um sistema em malha fechada com uma larga banda de passagem e pequenos erros de seguimento e posicionamento.

As não linearidades introduzidas pelo escoamento do ar e pela força de atrito são dificuldades básicas para atingir este objetivo de controle. Outras podem ser visualizadas a partir do modelo linear apresentado na seção anterior.

O modelo linear tem dois pólos que, com uma realimentação proporcional, são oscilatórios com um amortecimento que diminui na medida em que o ganho proporcional aumenta, e que se dirigem para o semiplano complexo direito a medida que o ganho de realimentação cresce.

Além disso, os parâmetros do modelo linear de terceira ordem (b0, a1 e a2 ) dependem de características físicas do sistema sujeitas a incertezas. Um exemplo é a massa específica do ar que depende da temperatura ambiente e da pressão de suprimento. Outro é a força de atrito, função das condições de lubrificação. Isto provoca incertezas nos parâmetros do modelo e, consequentemente, incertezas na localização dos pólos. Os parâmetros do modelo linear de quarta ordem dependem também da posição em torno da qual a linearização está sendo realizada. Com o cilindro na posição central (usada para obter o modelo de terceira ordem) o sistema tem a menor freqüência natural, que aumenta a medida que o cilindro é deslocado para as extremidades (Virvalo, 1995).

Visto a partir do modelo linear trata-se, portanto, de um sistema com pólos que se deslocam para a instabilidade com uma realimentação proporcional, cujos parâmetros variam com a posição do êmbolo, e que contém incertezas.

4.1 Os controladores lineares

As oscilações pouco amortecidas e o risco de instabilidade detectadas no modelo linear limitam o ganho de um controlador proporcional (P) a pequenos valores. Por isso, realimentado proporcionalmente, o sistema resulta lento em malha fechada. Os pequenos ganhos proporcionais também resultam em grandes erros provocados pelo atrito estático entre o êmbolo e o cilindro (Virvalo, 1995).

Utilizando a técnica do lugar das raízes verifica-se que a introdução de uma parcela derivativa na realimentação (controlador PD) não altera significativamente as dificuldades estruturais discutidas acima (Liu and Bobrow, 1988).

Uma parcela integral pode auxiliar na redução dos erros de seguimento e posicionamento provocados pelo atrito, mas também não altera a posição dos pólos em malha fechada de forma a reduzir as oscilações pouco amortecidas e os riscos de instabilidade. Além disso, o ajuste dos ganhos dos controladores PID (Proporcional-Integral-Derivativo) depende da trajetória desejada, ou seja, da tarefa (Su and Kuo, 2000). Os controladores PID são insuficientes quando as exigências da tarefa são severas em termos de precisão e velocidade.

Como o modelo linear de terceira ordem (expressão (3)) é controlável, as dificuldades estruturais decorrentes do posicionamento dos pólos em malha aberta podem ser superadas utilizando uma realimentação de estados. Teoricamente, os pólos do sistema em malha fechada podem ser alocados em qualquer posição do plano complexo, o que possibilita obter a resposta especificada através de algum critério de projeto. Na prática o desempenho é limitado pela saturação da vazão na servoválvula (Liu e Bobrow, 1988). Mesmo assim, o controlador com realimentação de estados possibilita a obtenção de velocidades de posicionamento mais elevadas que os controladores PID (Perondi e Guenther, 1999).

Cabe destacar que os controladores de estado são projetados com base no modelo linear. Por isso, os seus ganhos dependem do ponto de funcionamento. Utilizando os mesmos ganhos o desempenho é diferente em cada ponto, podendo, inclusive, ocorrer instabilidades. Essa é outra forte limitação da aplicação dos controladores de estado nos posicionadores pneumáticos.

Nos útimos anos diversos trabalhos tem buscado a superação das limitações dos controladores lineares através da utilização de técnicas de controle não linear.

4.2 Os controladores não lineares

O controle a estrutura variável, a linearização por realimentação (veja Slotine and Li, 1991), e o projeto de controladores à partir da interpretação do sistema de posicionamento pneumático como dois subsistemas interconectados, são as técnicas básicas empregadas na última década.

O controle a estrutura variável é uma técnica utilizada para conferir robustez a sistemas com incertezas paramétricas. Sua aplicação em sistemas pneumáticos de posicionamento vem sendo estudada por diversos autores. Thomasset et al. (1993), Surgenor e Vaughan (1995), Perondi e Guenther (2000) utilizaram o modelo linear de terceira ordem (Eq. (7)), considerando as incertezas nos seus parâmetros, para projetar controladores a estrutura variável, concluindo pela sua superioridade em relação ao controlador de estados no que diz respeito à robustez. A dificuldade de obter, em implementações experimentais, um bom desempenho no seguimento da trajetória sem a ocorrência de oscilações de alta freqüência no sinal de controle, que pode comprometer a vida útil da servoválvula é um desafio a ser superado.

A técnica em que através de uma realimentação de estados adequada busca-se linearizar um sistema é conhecida como linearização por realimentação. A técnica é baseada no modelo do sistema, a partir do qual é feita a linearização. Sua aplicação em sistemas pneumáticos envolve a escolha de um modelo para o comportamento das vazões mássicas em função das pressões e do sinal de controle (veja expressões (4) e (5)). Em Göttert e Neumann (1999) assume-se um modelo em que as vazões mássicas são lineares em relação ao sinal de controle. Mesmo com essa simplificação o seguimento de trajetória resulta melhor do que o obtido com um controlador de estados. Brun et al. (2000) adotam uma representação polinomial para a descrição das vazões mássicas, com resultados qualitativamente semelhantes aos de Göttert e Neumann. Os trabalhos não discutem a robustez em relação à incertezas paramétricas, inerentes aos sistemas pneumáticos, e sabidamente uma deficiência da linearização por realimentação.

A interpretação do sistema pneumático descrito pelas equações (4), (5) e (6) como dois subsistemas interconectados criou outra forma de projetar os controladores. Neste caso considera-se que um subsistema mecânico (6) é acionado por uma força gerada em um subsistema pneumático (4), (5), como na Fig. 4. Projeta-se então a força ApD para que o subsistema mecânico siga a trajetória desejada e, em seguida, a tensão na servoválvula para que o subsistema pneumático forneça as pressões que resultam na força ApD.


Essa metodologia de projeto foi empregada por Kawamura et al. (1989) que, utilizando um controlador PI (Proporcional-Integral) no subsistema mecânico e um controlador proporcional acrescido de uma parcela para garantir a estabilidade assintótica no subsistema pneumático, mostraram experimentalmente sua eficácia sem, no entanto, apresentar uma comparação de resultados com outros controladores.

A interconecção também foi utilizada por Bobrow e McDonell (1998). Os autores utilizam um controlador semelhante ao proposto em Kawamura et al. (1989), empregando, adicionalmente as inversas das vazões mássicas na servoválvula precisamente levantadas. Apresentam resultados experimentais que mostram um bom desempenho no seguimento de trajetórias e demonstram a estabilidade assintótica da malha fechada, sem discutir o efeito das incertezas no levantamento das inversas das vazões mássicas.

O controlador em cascata proposto na próxima seção utiliza a interpretação descrita na Fig. 4, e possibilita a obtenção de uma malha fechada exponencialmente estável (veja seção 6), em que os efeitos das incertezas dependem dos ganhos (seção7).

5 O CONTROLE EM CASCATA

A estratégia em cascata foi desenvolvida a partir de uma metodologia de redução de ordem e foi utilizada com sucesso no controle de acionamentos hidráulicos (Guenther e De Pieri, 1997).

O sistema pneumático é visto como na Fig. 4 e essa interpretação é aplicada ao sistema não linear (6), (8), reescrevendo-o de forma conveniente.

Para tanto define-se o erro no seguimento da diferença de pressão como:

onde pDd é a diferença de pressão desejada, a ser definida com base na força gd = ApDd que deve ser aplicada à massa para obter um desempenho desejado no posicionamento.

Utilizando a definição (11) as expressões (6) e (8) podem ser reescritas como:

Este sistema está na forma em cascata. A expressão (5) pode ser interpretada como um subsistema mecânico de segunda ordem acionado por uma força desejada gd = ApDd sujeito a uma perturbação na entrada d = A

D – Fa – Fe. A expressão (13) descreve o comportamento do subsistema pneumático de segunda ordem.

A estratégia em cascata consiste em:

(i) Projetar uma lei de controle (força desejada gd (t) = ApDd (t)) para o subsistema mecânico (12) de modo que a saída y(t) siga uma trajetória desejada yd(t) na presença da perturbação d = A

D – Fa – Fe ; e então

(ii) Projetar uma lei de controle u(t) para que o subsistema (13) gere uma força pneumática g(t) = ApD(t) que siga a força desejada gd(t) = ApDd(t).

Neste trabalho a lei de controle para o subsistema mecânico gd(t) é baseada no controlador proposto em Slotine e Li (1988) e a lei de controle u(t) é sintetizada de forma a obter um bom desempenho no seguimento da força no subsistema pneumático.

5.1 Seguimento no subsistema mecânico

De acordo com Slotine e Li (1988) a lei de controle para obter o seguimento de trajetória no subsistema mecânico é dada por

onde KD é uma constante positiva, r é uma velocidade de referência e "s" é uma medida do erro de seguimento da velocidade. De fato, r pode ser calculada modificando a velocidade desejada d de acordo com o que segue

onde é uma constante positiva.

Substituindo (14) em (12), a dinâmica do erro no subsistema mecânico resulta

Considere a função não negativa:

onde P é uma constante positiva definida convenientemente na análise de estabilidade. Utilizando (16), a derivada de (17) em relação ao tempo ao longo das trajetórias do subsistema mecânico resulta:

A expressão (18) é usada na análise de estabilidade.

5.2 Seguimento no subsistema pneumático

Para alcançar o seguimento da força no subsistema pneumático propõe-se a lei de controle:

onde ua é um sinal de controle auxiliar, KP é uma constante positiva, A é a área do pistão e s é o erro definido em (16).

Substituindo (19) em (13) obtém-se a dinâmica do subsistema pneumático em malha fechada:

O projeto do sinal ua e da constante KP é baseado na função escalar não negativa V2:

A derivada de (21) em relação ao tempo é

2 = D (D – Dd), onde a derivada da diferença de pressão desejada (Dd) é obtida derivando (15). Disso decorre que para calcular [p\dot]Dd necessita-se conhecer a aceleração (veja (5.1)). No caso ideal (parâmetros conhecidos, sem atrito e sem força externa), a aceleração pode ser calculada através da expressão (6) medindo a diferença de pressões pD .

Utilizando (20) obtém-se a derivada de (21) ao longo das trajetórias em malha fechada do subsistema pneumático:

Definindo o sinal de controle auxiliar no caso ideal como

resulta

onde Dua = ua – é o erro na estimativa do sinal auxiliar. No caso ideal, ua = , Dua = 0, e a expressão (24) resulta

A expressão (25) é utilizada na análise de estabilidade.

5.3 Controle do sistema

O controlador em cascata do sistema de posicionamento é obtido pela combinação da lei (14) para o seguimento no subsistema mecânico com a lei (19) para o subsistema pneumático.

Utilizando (12), (15) e (16) calcula-se a diferença de pressão desejada para obter o seguimento da trajetória no subsistema mecânico, pDd = gd/A. Desta forma este subsistema é controlado na linha das forças externas e de atrito, sendo possível estimar e compensar a força de atrito, como é feito em Canudas et al. (1995) para os acionamentos elétricos.

Empregando (19) e (23), no caso em que ua = , calcula-se . Para tanto necessita-se obter a derivada da diferença de pressão, calculada anteriormente, e a função = (p1, p2, y, ) calculada através de (10).

Calculado o valor de , a tensão de controle u é obtida pela inversão da função definida em (9), ou seja, u = u(p1, p2, y, ).

Essa inversão é realizada a partir das funções que descrevem as vazões mássicas qm1 = qm1 (p1, u) e qm2 = qm2(p2, u). As vazões resultam do produto de uma função que depende da tensão na servoválvula fu(u) por uma função das pressões a montante (pu) e a jusante (pd) da servoválvula fp(pu, pd), levantadas experimentalmente de acordo com o procedimento descrito em Perondi e Guenther (2002). Neste trabalho as funções de pressão e de tensão são ajustadas a polinômios de terceira ordem. A inversa u = u(p1, p2, y, ) é obtida calculando as raízes de um polinômio de terceira ordem.

A utilização da função = (p1, p2, y, ) e da inversa u = u(p1, p2, y, )na lei de controle, pode ser interpretada como uma linearização por realimentação (veja seção 4).

6 ANÁLISE DE ESTABILIDADE

Considere o modelo não linear de quarta ordem e o controlador em cascata. Neste caso o sistema em malha fechada é dado por W = {(6),(8),(14),(19)}. Seja r = [

D]T o vetor erro de seguimento na malha fechada W.

Para o caso ideal, em que os parâmetros do posicionador pneumático são conhecidos e não há força externa Fe nem força de atrito Fa, a convergência exponencial do vetor erro de seguimento r é demonstrada no teorema abaixo, utilizando o lema de convergência apresentado a seguir.

Lema 1 Se a função real V(t) satisfaz a desigualdade (t) + aV(t) < 0, onde a é um número real, então V(t) < V(0)e–at (veja Slotine e Li, 1991, pp.91).

Teorema 2Quando os parâmetros do posicionador pneumático são conhecidos e não há força externa Fe nem força de atrito Fa:

(i) O sistema em malha fechada W é globalmente estável;

(ii) A norma do vetor de erros do sistema W (|| r(t)||) converge exponencialmente para zero.

Prova: A estabilidade global pode ser demonstrada considerando a função não negativa

onde as funções V1 e V2 foram definidas em (17) e (21), respectivamente. A matriz N1 > 0 é dada por

Neste caso (parâmetros conhecidos, sem atrito e sem força externa), Dua = 0 e, de acordo com as expressões (18) e (25) a derivada em relação ao tempo de (26) é

Definindo a constante P = 2KDe utilizando (15) em (28), resulta = –rTN2r onde N2 = diag[2 KDKD Kp ]. A matriz N2 é definida positiva e, neste caso,

De (28) e (29) conclui-se que ||r(t)|| ® 0 para t ® ¥, ou seja, que y(t) ® yd(t), (t) ® d(t) e pD(t) ® pDd(t) para t ® ¥. Portanto, y(t) e (t) são limitados. Com isso, de (14) conclui-se que pDd(t) é limitada. Assim, pD(t) = p1(t) – p2(t) é limitada. Como as pressões pi(t), i = 1, 2, são limitadas pela pressão de exaustão e pela pressão de suprimento, conclui-se que a norma do estado do sistema é limitada e, portanto, que o sistema em malha fechada W é globalmente estável.

Para mostrar a convergência exponencial do erro, seja

max(N1) o maior autovalor da matriz N1, e min(N2) o menor autovalor da matriz N2, e seja g = min (N2)/max(N1). Como N1 e N2 são matrizes definidas positivas, estes escalares são todos positivos. Da teoria de matrizes, N1< max (N1)I e min(N2)I < N2, onde I é a matriz identidade. Portanto,

A expressão (30) combinada com (29) permite escrever (t) < –gV(t). De acordo com o lema de convergência apresentado acima, este resultado tem como conseqüência:

De (31) e usando a relação rTN1r > min (N1) ||r(t)||2 pode-se verificar que a norma do vetor erro de seguimento r(t) converge exponencialmente para zero com uma velocidade maior que g/2.

Observação: Para o caso ideal (parâmetros conhecidos, sem força externa nem atrito) o controlador em cascata (14), (19) necessita apenas do estado do sistema x = [ y

p1 p2]Tpara ser implementado.

7 PROPRIEDADES DE ROBUSTEZ

A robustez do sistema em malha fechada W é estabelecida através das propriedades apresentadas abaixo.

Propriedade 1 - Quando os parâmetros são conhecidos e, adicionalmente ao estado, a aceleração é usada na implementação (para calcular Dd - veja Eq. (5.2) e comentário que segue), na presença de uma força externa Fe e da força de atrito Fa , a norma do vetor de erros ||r(t)|| converge globalmente para um conjunto residual que depende dos ganhos do controlador.

Isto pode ser verificado lembrando que, neste caso, a derivada em relação ao tempo de (26), de acordo com as expressões (18) e (25) é

Definindo o vetor força F = [ – (Fa + Fe)– (Fa + Fe) 0 ]T e utilizando (14) a expressão (32) pode ser reescrita como:

De (32) observa-se que, mesmo com N2 > 0, a derivada (t) não é definida negativa para todo r ¹ 0.

Utilizando o teorema de Rayleight-Ritz, a partir de (33) pode-se escrever

e, considerando que existe um limite superior

> ||F|| para a norma do vetor F, ou seja, que a força externa Fe e a força de atrito Fa são limitadas,

De (35) verifica-se que uma condição suficiente para que (t) seja negativa é

Se a condição (36) é satisfeita, (t) é negativa e V(t) decresce. Se a V(t) decresce, então, pela definição (26), a norma do vetor de erros ||r(t)|| também decresce. No entanto, se a norma de r decresce tal que

então (t) pode tornar-se positiva, o que significa que V(t) e conseqüentemente ||r(t)|| podem crescer até que a condição (36) seja satisfeita, tornando (t) negativa e fazendo ||r(t)|| decrescer.

Isso mostra que ||r(t)|| tende para um conjunto residual definido por (37) que depende de e do menor autovalor da matriz N2 , definido pelos ganhos do controlador (, KD, KP – veja expressão (29)).

Propriedade 2 - Quando existe incerteza nos parâmetros, mesmo sem atrito e força externa, o vetor de erros r(t) converge localmente para um conjunto residual que depende dos ganhos do controlador.

Esta propriedade pode ser demonstrada considerando que quando os parâmetros têm incertezas o sinal de controle auxiliar é calculado a partir de valores estimados e, ao invés de (23), tem-se

Neste caso Dua = ua – ¹ 0 e se a aceleração utilizada para calcularDd for obtida a partir de (6) com os parâmetros aproximados, o erro na estimativa do sinal auxiliar Dua é uma função do estado do sistema, ou seja, Dua = Dua (y, , p1, p2). Disso resulta que a derivada da função não negativa V2 (21) ao longo das trajetórias é

e, definindo E(r) = [ 0 0 Dua]T, onde a dependência de r decorre do fato do erro Dua ser uma função do estado, a derivada da função V (26) ao longo das trajetórias pode ser escrita como

Da mesma forma que na discussão da Propriedade 1 acima, de (40) verifica-se que, mesmo comN2 > 0, a derivada (t) não é definida negativa para todo r ¹ 0. Novamente utilizando o teorema de Rayleight-Ritz , a partir de (40) pode-se escrever

A partir de uma condição inicial pode-se estabelecer um limite superior para ||E(r)|| < . Assim, < –min(N2 )||r||2 + ||r||.

Pelos mesmos motivos discutidos na propriedade 1, a norma do vetor de erros ||r(t)|| tende para um conjunto residual que depende de e do menor autovalor da matriz N2, definido pelos ganhos do controlador (, KD, KP), definido por

Neste caso, o limite superior é determinado para uma dada condição inicial, o que torna o resultado local.

Propriedade 3 - Quando existe incerteza nos parâmetros na presença de uma força externa Fe e da força de atrito Fa, a norma do vetor de erros ||r(t)|| converge localmente para um conjunto residual que depende dos ganhos do controlador.

Este resultado decorre das propriedades 1 e 2.

8 RESULTADOS EXPERIMENTAIS

As propriedades de estabilidade e de robustez apresentadas acima foram comprovadas experimentalmente e os resultados estão apresentados nesta seção.

A bancada experimental ilustrada na Fig. 5 é composta de uma válvula proporcional 5/3 (MPYE-5-1/8 FESTO) que opera um cilindro de dupla ação com transmissão de movimento por fita e diâmetro interno de 0,025 me curso 1 m (DGPL-1000 FESTO).


O êmbolo móvel do cilindro é conectado a um sensor linear (Festo POT-1000-TFL) de curso igual ao do cilindro atuador (1,0 m). Três sensores eletroresistivos de pressão medem a pressão absoluta em cada câmara do cilindro e a pressão manométrica de suprimento.

O aparato de controle e aquisição de dados consiste em uma placa de aquisição de dados rápida (dSPACE GmbH - DS1102) acoplada a um microcomputador IBMPC Pentium100MHz com tempo de amostragem de 1 ms. Nas conversões AD e DA, a placa utilizada apresenta programas auxiliares para gerenciamento da aquisição de dados e módulos de acoplamento para o MatLab/Simulink. Assim, os algoritmos em tempo real de medições e controle estão programados via módulo dSPACE para o MatLab/Simulink.

Os parâmetros medidos na bancada são: A = 4,19.10–4 m2, r = 1,4, R = 286,9 J Kg/K, T = 293.15 K, L = 1 m, V10 = 1,96.10–6 m3, V20 = 4,91.10–6 m3 e M = 2.9 Kg ).

As funções qmi(pi, u), i =1,2, em (4) e (5), foram medidas de acordo com o procedimento apresentado em Perondi e Guenther (2001).

Durante a realização dos ensaios não foi aplicada força externa. Portanto, Fe = 0.

Os experimentos foram realizados para uma trajetória desejada senoidal e para uma trajetória desejada polinomial

A trajetória senoidal é yd(t) = ymx sen(wt), ymx = 0,45m e w = 2rad/s (veja Fig. 8).




A trajetória desejada polinomial começa com o êmbolo a 0,05 m da extremidade (yd(0) = 0,05m). A seguir, durante 2 segundos, ocorre um deslocamento de acordo com uma polinomial de sétima ordem até a posição yd(2) = 0,95m. Esta posição é mantida durante 2 segundos quando é iniciado um movimento segundo a mesma polinomial no sentido contrário, até a posição inicial, onde permanece por 2 segundos (veja Fig. 6). Essa trajetória pode ser descrita por (43) e (44):

A freqüência da trajetória senoidal (w = 2 rad/s) e os coeficientes do polinômio de 7a ordem foram escolhidos de forma a fornecerem a velocidade máxima recomendada pelo fabricante do cilindro.

Além do controlador em cascata foram utilizados os controladores proporcional (P), proporcional-integral-derivativo (PID), e de estados (PVA - posição-velocidade-aceleração). Para o controlador P o sinal de controle é u = Kp1 (y – yd).

Para o PID u = Kp2 (y – yd) + KI2ò (y – yd)dt + Kv2 ( – d) .

Para o controlador de estados a lei de controle é u = Kp3 (y – yd) + Kv3 ( – d) + Ka3 ( – d).

A lei de controle em cascata é dada por (14), (19).

Os ganhos de cada controlador foram sintonizados preliminarmente através de simulações nas quais considerou-se que, além da posição e das pressões, a velocidade e a aceleração eram medidas sem ruídos, buscando-se obter o limite para o qual o sinal de controle e a resposta ainda são suaves em todas as trajetórias desejadas (detalhes podem ser encontrados em Perondi, 2002). Em seguida o mesmo procedimento foi realizado na bancada experimental.

Os limites para os ganhos obtidos na bancada experimental foram: controlador P Kp1 = 1,3; PID Kp2 = 1,1, KI2 = 5,56, Kv2 = 0,03; PVA Kp3 = 1,3, Kv3 = 0,03, Ka3 = 0,002, controlador em cascata Kp = 40, KD = 40 e = 40.

Estes limites são bastante inferiores aos obtidos em simulações, porque na implementação experimental: (i) a velocidade é obtidas por derivação numérica e, (ii) existe a necessidade de utilizar filtros para reduzir o efeito dos ruídos introduzidos pelos sensores. Os filtros digitais Butterworth passa-baixa utilizados tem as seguintes características:

Na Fig. 6 está mostrada a trajetória polinomial desejada e o erro de seguimento obtido com o controlador em cascata. Pode-se observar que o erro converge para um conjunto residual, de acordo com as propriedades de robustez descritas na seção 7. Neste caso o erro residual depende não só da força de atrito, mas também das incertezas nos parâmetros inerentes aos dados da bancada. O sinal de controle está mostrado na Fig. 7.

A assimetria no erro de seguimento e no sinal de controle é ocasionada pela assimetria no atrito verificada na identificação da bancada experimental apresentada em Perondi e Guenther (2002). As oscilações de alta frequência no sinal de controle (Fig. 7) são provocadas pelos atrasos introduzidos pelos filtros. Essa afirmação é suportada em simulações realizadas com e sem o uso dos filtros (Perondi, 2002). As oscilações de baixa frequência no sinal de controle durante os períodos de repouso do pistão ocorrem devido ao atrito.

A trajetória senoidal e o respectivo erro de seguimento são mostrados na Fig. 8. O sinal de controle para a trajetória senoidal é apresentado na Fig. 9 podendo-se observar oscilações de alta frequência provocadas pelo emprego dos filtros e oscilações de maior amplitude nos instantes em que o movimento muda de direção, provocadas pelo atrito. As oscilações no sinal de controle estão dentro do limite aceitável para o funcionamento e durabilidade da servoválvula, para as duas trajetórias. Essas oscilações definiram, para ambos os casos, o limite dos ganhos dos controladores e, portanto, do desempenho da malha fechada.


As Figuras 8 e 9 mostram mais uma vez a assimetria no erro e no sinal de controle ocasionadas pela assimetria no atrito. Este conjunto de resultados (Figuras 6 a 9) comprova as propriedades do controlador em cascata apresentadas nas seções 6 e 7. Além disso aponta as limitações de desempenhointroduzidas pelo emprego de filtros e pela ação do atrito.

Nas Figuras 10 e 11 são mostrados os erros de seguimento para as trajetórias polinomial e senoidal, respectivamente, obtidos utilizando os controladores PID, PVA e em cascata. Estes resultados destacam o desempenho dinâmico alcançado com o controlador em cascata.



9 CONCLUSÕES

Neste trabalho é proposto um novo controlador em cascata para sistemas pneumáticos de posicionamento. Demonstra-se a convergência exponencial dos erros de seguimento da malha fechada para o caso em que todos os parâmetros são conhecidos e não existe força externa, nem força de atrito. São estabelecidas as propriedades de robustez da malha fechada.

As propriedades da malha fechada são comprovadas experimentalmente.

As limitações de desempenho introduzidas pela necessidade do uso de filtros são verificadas experimentalmente.

O desempenho da malha fechada obtido experimentalmente é analisado e comparado ao alcançado utilizando controladores clássicos, comprovando a eficiência do controlador proposto.

A experimentação mostra a importância da compensação do atrito, destacando assim a relevância do caminho que a metodologia de controle em cascata abre neste sentido.

Perondi, E.A., e Guenther, R., (2002). Modelagem de um Servoposicionador Pneumático com Atrito. Revista Ciência & Engenharia (Science and Engineering Journal). UFBA, Uberlândia, MG, Brasil (a ser publicado).

Artigo submetido em 10/06/02

1a. Revisão em 06/12/02; 2a. Revisão em 22/04/03

Aceito sob recomendação do Ed. Assoc. Prof. Paulo Eigi Miyagi

  • Bobrow, J.E., McDonell,W., (1998). Modeling, Identification, and Control of a Pneumatically Actuated, Force Controllable Robot, IEEE Transactions on Robotics and Automation, vol.15, no 5, pp. 732-742.
  • Bollmann, A., Guenther, R., (1997), Posicionadores Hidráulicos e Pneumáticos: Características e Técnicas de Controle. Anais do 5ş Seminário Nacional de Hidr. e Pneum., SENAI/CTAI. Florianópolis. SC, pp 57-78.
  • Brun,X., Thomasset, D., Bideaux, E., Scavarda, S., (2000), An Accurate Tracking Control of an Electro pneumatic Actuator. 1st FPNI - PhD Symposium, Fluid Power Net International, Hamburgo, pp 215-226.
  • Canudas de Wit, C., Olsson, H., Astrom, K.J. e Lischinsky, P., (1995), A New Model for Control Systems with Friction. IEEE Transactions on Automatic Control, vol. 40, no 3, pp.419-425.
  • Göttert, M., Neumann, R., (1999) Nichlineare Regelungskonzepte für Servopneumatische Roboter. 3thGerman-Polish seminar in Innovation and Progress in Fluid Engineering, Zakopane, Po.
  • Guenther, R., De Pieri, E. R., (1997), Cascade Control of the Hydraulic Actuators. Revista Brasileira de Cięncias Mecânicas, vol. 19, no 2, Junho, pp. 108-120.
  • Kawamura, S., Miyata, K., Hanafusa, H., Isida, K., (1989), PI type hierarchical feedback control scheme for pneumatic robots. Proceedings of the 1989 IEEE International Conference on Robotics and Automation Vol.3, 14-19, Pp. 1853-1858.
  • Liu, S., Bobrow, J., (1988), An Analysis of a Pneumatic Servo System and its Application to a Computer-controlled Robot. ASME Journal of Dynamic Systems, Measurement and Control, Vol. 110, pp 427-433.
  • Perondi, E.A., Guenther, R., (1999), Controle em Malha Fechada de um Servoposicionador Pneumático. Anais do XV Congr. Bras. de Eng. Mec. Águas de Lindóia, SP.
  • Perondi, E.A. e Guenther, R., (2000), Controle de um Servoposicionador Pneumático por Modos Deslizantes, Congresso Nacional de Eng. Mecânica - Natal, RN.
  • Perondi, E.A. (2002), Controle em Cascata de um Servoposicionador Pneumático com Compensaçăo do Atrito. Florianópolis. Tese de doutorado em Engenharia Mecânica Centro Tecnológico. UFSC - Flplis. SC.
  • Slotine e Li (1988), Adaptive Manipulator Control: A Case Study. IEEE Transaction on Automatic Control, Vol. 33, No. 11, pp. 995-1003.
  • Slotine, J.J.E., Li, W., (1991), Applied Nonlinear Control, Prentice-Hall Inc.
  • Su, W.-C., Kuo, C.-Y., (2000), Variable structure control of a rodless pneumatic servoactuator with discontinuous sliding surfaces. Proc. ACC, Vol.3, Pp.1617 -1621.
  • Surgenor, B. W., Vaughan, N. D. and Uebling, M., (1995) Continuous Sliding Mode Control of a Pneumatic Positioning System. Proc. of Eighth Bath International Fluid Power Workshop, pp 270-283.
  • Thomasset, D., Richard, E., Scavarda, S., Lin, X.F., Sesmat, S., Bouhal, A., (1993), Control of an electro-pneumatic servodrive: a state-affine or a sliding approach. IFAC World Congress, Sydney, pp 501-504.
  • Virvalo, T., (1995), Modeling and Design of a Pneumatic Position Servo System Realized with Commercial Components. PhD Thesis, Tampere, Finland.

Datas de Publicação

  • Publicação nesta coleção
    13 Ago 2004
  • Data do Fascículo
    Jun 2004

Histórico

  • Aceito
    22 Abr 2003
  • Revisado
    06 Dez 2002
  • Recebido
    10 Jun 2002
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br