Resumos
Um controlador por modos deslizantes baseado em realimentação de saída utilizando funções de monitoração foi recentemente introduzido para sistemas monovariáveis lineares incertos com direção de controle desconhecida. Aqui, uma generalização é desenvolvida para sistemas multivariáveis fortemente não-lineares. O esquema de monitoração é estendido para lidar com a incerteza da matriz de ganho de alta frequência da planta. Nossa estratégia garante propriedades globais de estabilidade e rastreamento exato de saída. Resultados experimentais com um sistema de servovisão robótica, utilizando uma câmera fixa mas não-calibrada, ilustram a robustez e a viabilidade prática do esquema proposto.
sistemas multivariáveis não-lineares; direção de controle desconhecida; realimentação de saída; controle por modos deslizantes; servovisão robótica; câmera não-calibrada
An output-feedback sliding mode controller using monitoring functions was recently introduced for linear uncertain single-input-single-output (SISO) systems with unknown control direction. Here, a generalization is developed for multivariable systems with strong nonlinearities. The monitoring scheme is extended to handle the uncertainty of the plant high frequency gain matrix. Our strategy provides global stability properties and exact output tracking. Experimental results with a robotics visual servoing system, using a fixed but uncalibrated camera, illustrate the robustness and practical viability of the proposed scheme.
multivariable nonlinear systems; unknown control direction; output-feedback; sliding mode control; robotics visual servoing; uncalibrated camera
TEORIA DE CONTROLE
Tiago Roux OliveiraI; Alessandro Jacoud PeixotoII; Liu HsuIII
IDepartamento de Engenharia Eletrônica e de Telecomunicações, Universidade do Estado do Rio de Janeiro - UERJ, Rio de Janeiro, RJ, Brasil, tiagoroux@uerj.br
IIDepartamento de Engenharia Eletrônica e de Computação, Universidade Federal do Rio de Janeiro - UFRJ, Rio de Janeiro, RJ, Brasil, jacoud@poli.ufrj.br
IIIPrograma de Engenharia Elétrica/COPPE, Universidade Federal do Rio de Janeiro - UFRJ, Rio de Janeiro, RJ, Brasil, liu@coep.ufrj.br
RESUMO
Um controlador por modos deslizantes baseado em realimentação de saída utilizando funções de monitoração foi recentemente introduzido para sistemas monovariáveis lineares incertos com direção de controle desconhecida. Aqui, uma generalização é desenvolvida para sistemas multivariáveis fortemente não-lineares. O esquema de monitoração é estendido para lidar com a incerteza da matriz de ganho de alta frequência da planta. Nossa estratégia garante propriedades globais de estabilidade e rastreamento exato de saída. Resultados experimentais com um sistema de servovisão robótica, utilizando uma câmera fixa mas não-calibrada, ilustram a robustez e a viabilidade prática do esquema proposto.
Palavras-chave: sistemas multivariáveis não-lineares, direção de controle desconhecida, realimentação de saída, controle por modos deslizantes, servovisão robótica, câmera não-calibrada.
ABSTRACT
An output-feedback sliding mode controller using monitoring functions was recently introduced for linear uncertain single-input-single-output (SISO) systems with unknown control direction. Here, a generalization is developed for multivariable systems with strong nonlinearities. The monitoring scheme is extended to handle the uncertainty of the plant high frequency gain matrix. Our strategy provides global stability properties and exact output tracking. Experimental results with a robotics visual servoing system, using a fixed but uncalibrated camera, illustrate the robustness and practical viability of the proposed scheme.
Keywords: multivariable nonlinear systems, unknown control direction, output-feedback, sliding mode control, robotics visual servoing, uncalibrated camera.
1 INTRODUÇÃO
O projeto de controladores por realimentação de saída de sistemas SISO incertos sem a hipótese do conhecimento da direção de controle (sinal do ganho de alta frequência) tem sido um problema instigante desde o começo dos anos 80 (Mudgett & Morse, 1985). Na literatura de controle adaptativo, o então denominado ganho de Nussbaum (Nussbaum, 1983) vem sendo utilizado na tentativa de relaxar essa hipótese, incluindo o caso de sistemas multivariáveis (Wu & Zhou, 2004; Zhang
& Ge, 2007). Contudo, essa abordagem é discutível do ponto de vista prático devido a grandes transitórios, excessivo esforço de controle e falta de robustez (Mudgett
& Morse, 1985; Fu & Barmish, 1986) .
Mais recentemente, controladores baseados em realimentação de saída e modos deslizantes para o rastreamento de trajetórias em sistemas SISO incertos lineares e não-lineares com direção de controle desconhecida e grau relativo arbitrário foram introduzidos em (Yan et al., 2008) e (Oliveira et al., 2007), respectivamente. Em lugar do ganho de Nussbaum, a direção de controle foi ajustada a partir de funções de monitoração.
Outras soluções elaboradas são encontradas na literatura de controle por modos deslizantes, entretanto elas estão restritas ao caso SISO de primeira ordem ou com grau relativo dois (Bartolini et al., 2003), (Bartoliniet al., 2009), ou ainda, são baseadas em realimentação de estados (Drakunov, 1993).
Neste artigo, estende-se a aplicabilidade da função de monitoração para plantas não-lineares multivariáveis (multi-input-multi-output MIMO) com grau relativo unitário utilizando-se a abordagem do controle por vetor unitário e modos deslizantes. O novo desafio é que o ganho de alta frequência é uma matriz, não simplesmente um escalar. Além disso, diferentemente de trabalhos anteriores (Hsu et al., 2003; Cunha, 2004) e graças a uma formulação utilizando observadores da norma do estado, aqui os termos não-lineares são permitidos serem dependentes do estado, incluindo não-linearidades fortes (por exemplo, polinomiais) (Oliveira et al., 2010) e descasadas com respeito a entrada de controle. A motivação principal de usarmos o vetor unitário (Baida, 1993; Hsuet al., 2002) em vez da função de chaveamento é que um menor conhecimento da matriz de ganho de alta frequência (high frequency gain HFG) é requerido, quando comparado com as restrições impostas em (Edwards & Spurgeon, 1998) ou a propriedade de ser positiva definida em outras abordagens (Tao & Ioannou, 1989; Chien et al., 1996). De fato, se o controle vetorial unitário é utilizado, a única exigência sobre a matriz de HFG é que - seja Hurwitz e essa condição é necessária e suficiente para a atratividade da superfície de deslizamento como provado em (Baida, 1993; Hsu et al., 2002)1.
Neste artigo, é desconhecida e incerta. Inspirados pelos recentes esquemas de controle com comutação (Hespanha et al., 2003; Freidovich & Khalil, 2007; Deaecto & Geromel, 2009) e nos spectrum-unmixing sets referidos em (Martensson, 1991; Ryan, 1993), propõe-se um mecanismo de chaveamento que escolha uma matriz pré-compensadora apropriada em um conjunto indexado finito de matrizes através de uma função de monitoração adequada, de tal forma que a lei de controle vetorial unitária pré-multiplicada por possa garantir que seja Hurwitz para algum A estabilidade assintótica global com respeito a um conjunto compacto e o rastreamento exato são demonstrados.
Uma aplicação no problema de controle por servovisão com incerteza nos parâmetros de calibração da câmera será usada para ilustrar a eficácia do controlador multivariável proposto em situações práticas. Particularmente, a restrição usual no ângulo de orientação da câmera , presente em (Papanikolopoulos & Khosla, 1994; Kelly et al., 1999; Zergeroglu et al., 1999; Leite et al., 2004; Zachi, Lizarralde, Hsu & Leite, 2006), pode ser removida.
2 NOTAÇÃO E TERMINOLOGIA
As seguintes notações e conceitos básicos são empregados ao longo do texto. A norma Euclidiana de um vetor e a correspondente norma induzida de uma matriz A são denotadas por , respectivamente. O símbolo representa tanto a variável de Laplace quanto o operador diferencial , de acordo com o contexto. A saída de um sistema linear e invariante no tempo com função de transferência e entrada é escrita .O termo genérico é dito exponencialmentedecrescente e escalares ,com podendo depender das condições iniciais do sistema. O conceito de estabilidade ISS (Input-to-State-Stable), assim como as definições de funções de classe encontram-se de acordo com (Khalil, 2002).Adota-se a definição de Filippov para a solução de equações diferenciais descontínuas (Filippov, 1964) e o conceito de controle equivalente estendido (Hsu et al., 2002), válido dentro e fora da superfície de deslizamento.
3 FORMULAÇÃO DO PROBLEMA
Este artigo considera o problema de rastreamento global de sistemas não-lineares MIMO transformáveis na forma normal (Khalil, 2002):
onde é a entrada de controle, é a saída mensurável e os estados do subsistema-, referido por "dinâmica interna'', não estão disponíveis. As funções incertas são contínuas por partes em e localmente Lipschitz contínuas nos outros argumentos. Para cada solução de (1)(2), existe um intervalo máximo de definição dado por , onde pode ser finito ou infinito.
Adicionalmente, considera-se que a matriz de HFG é desconhecida (diz-se também que a direção de controle da planta é desconhecida) com parâmetros incertos pertencendo a algum conjunto compacto . Em , é assumido apenas que:
(Direção de Controle) (i) , (ii) existe uma constante conhecida tal que e (ii) existe um conjunto indexado finito de matrizes conhecidas tal que é Hurwitz para algum .
De acordo com (H1), foca-se o caso mais simples de grau relativo um deixando-se o caso de grau relativo arbitrário e direção de controle desconhecida para trabalhos futuros. Como mencionado acima, a condição Hurwitz é necessária e suficiente para a atratividade da superfície de deslizamento no controle por vetor unitário e modos deslizantes (Baida, 1993; Hsu et al., 2002).
Essa hipótese relaxa significativamente a condição essencial de positividade e simetria da matriz presente em (Tao & Ioannou, 1989; Chien et al., 1996). A simetria é uma propriedade não-genérica, podendo ser destruída por incertezas arbitrariamente pequenas. Além disso, se - é positiva definida, então é Hurwitz, entretanto a recíproca não é verdadeira.
Para o caso SISO, (H1) pode ser interpretada por: as primeiras duas condições indicam que o escalar pode ser positivo ou negativo, isto é, a direção de controle é desconhecida. Além disso, neste caso o conjunto indexado é e um escalar é necessário para fazer negativo.
Aqui, um mecanismo de chaveamento baseado em uma função de monitoração proverá uma troca cíclica através dos elementos do conjunto indexado finito (Ryan, 1993). A existência de é garantida pela teoria dos spectrum-unmixing sets apresentada em (Martensson, 1991). A função de monitoração é projetada com base em um limitante para a norma do erro de rastreamento, válido apenas se for selecionada a correta. Caso contrário, o chaveamento ocorrerá quando a norma do erro de rastreamento violar este limitante superior.
3.1 Problema de Rastreamento Global
O objetivo é encontrar uma lei de controle dinâmica , via realimentação de saída e sem o conhecimento da direção de controle da planta, para levar o erro de saída ou de rastreamento
assintoticamente ou em tempo finito para zero (rastreamento exato), começando-se de qualquer condição inicial da planta/controlador e mantendo-se todos os sinais da malha fechada limitados uniformemente, apesar das incertezas. A trajetória desejada é assumida ser gerada pelo seguinte modelo de referência:
onde é assumida contínua por partes e uniformemente limitada.
A fim de atingir o objetivo de controle, nossa estratégia requer um observador da norma (norm observer) (Sontag & Wang, 1997; Krichman et al., 2001) para o estado da dinâmica interna (1), de acordo com a seguinte definição e hipótese.
Definição 1 Um observador da norma para o subsistema (1) é um sistema dinâmico SISO de primeira ordem da forma (relembrando que é a saída da planta):
com entrada e saída , tal que o estado de (1) satisfaz
, com alguma constante e para cada estado inicial , sendo: (i) uma constante e (ii) uma função não-negativa, contínua em e contínua por partes em , satisfazendo , para algum e alguma constante .
(Observabilidade da Norma) O subsistema interno (1) admite um observador da norma conhecido (5) com também conhecidos.
É sabido que no caso invariante no tempo, se o subsistema interno (1) é ISS com respeito a , então ele admite tal observador da norma e a planta é de fase mínima.
Na Seção 4 (Observadores da Norma), dois casos são apresentados onde (5) pode ser implementado para o subsistema interno variante no tempo. O primeiro deles incorpora uma classe de não-linearidades onde uma condição de crescimento linear é imposta apenas no estado não-medido . No outro caso, adaptado de (Jiang et al., 2004), ilustra um caso onde não-linearidades polinomiais fortes em são também permitidas. Em ambos os casos, (1) possui uma relação ISS com respeito a funções apropriadas de e .
De forma a obter um limitante em norma para em (2), assume-se que:
(Funções Limitantes) Existe uma função não-negativa conhecida, classe e localmente Lipschitz em , contínua em e contínua por partes em tal que .
Note que, (H3) não é restritiva visto que é assumida contínua em . Além disso, diferentemente de (Hsu et al., 2003; Cunha, 2004), nenhuma condição particular de crescimento é imposta na função limitante .
3.2 Do Problema de Rastreamento para o Problema de Regulação
A partir de (2)(4), a dinâmica do erro e pode ser escrita como
Deste modo, o problema de rastreamento global pode ser reformulado como um problema de regulação descrito a seguir. Encontrar uma lei de controle baseada em modos deslizantes e realimentação de saída de forma que, para toda a condição inicial : (i) as soluções de (2), (5) e (7) são limitadas e (ii) tende assintoticamente ou em tempo finito para zero. A lei de controle ideal (8) é considerada como uma perturbação de entrada casada em (7). De (H1)(H3), pode ser limitado em norma por sinais disponíveis
a menos do termo exponencial decrescente , onde é uma constante, c é dada em (H1) e vem do termo exponencial em (6). Para obtermos esta desigualdade, utilizamos o fato de que é localmente Lipschitz em seu primeiro argumento e que .
4 OBSERVADORES DA NORMA
Neste artigo, assume-se que é possível obter um observador da norma da forma (5) para o estado do sistema interno , dado em (1). Nesta seção, caracterizam-se classes de plantas não-lineares MIMO e exemplos para os quais esse observador da norma possa ser implementado. Em ambos os casos, obtém-se uma função de armazenamento satisfazendo conhecidos tais que
onde são funções conhecidas. Além disso, é uma função não-negativa, contínua em e contínua por partes em satisfazendo , para algum e constante . Isso assegura que o sistema interno (1) tem uma relação ISS de para , o que corresponde a uma generalização do conceito de fase mínima e permite concluir que se estiver limitada, também estará.
A função classe- é dita ultimately linearly lower bounded (ULLB), significando que existe , tal que e algum . Em particular, se é linear, i.e., se (para algum ), podemos fazer . Além disso, se é não-linear, podemos tomar . Note que a propriedade ULLB é menos conservativa que o conceito de função stiffening2 introduzido em (Arcak et al., 2002) no contexto de estabilidade absoluta.
Levando em consideração a função ULLB detalhada acima, o observador da norma (5) pode enfim ser obtido seguindo os próximos passos.
Considere a notação e escolha como descrito acima para um dado . A partir de (10), pode-se escrever ou, equivalentemente,
Agora, dado um , tem-se que . Portanto, ou , e consequentemente . Assim sendo, utilizando-se o Teorema da Comparação (Khalil, 2002), conclui-se que
onde é conhecido e denota o operador convolução. Finalmente, pode-se implementar um observador da norma da forma (5) para o estado , com , aplicando-se a função em ambos os lados da última desigualdade.
4.1 Sistema interno com crescimento linear no estado não-medido
Considere a classe de plantas não lineares MIMO (1)(2) com a função dada por
onde podem ser incertas. Considera-se que todas as incertezas paramétricas pertençam a um conjunto compacto tal que os limitantes para as incertezas necessários para o projeto do observador da norma estejam disponíveis.
Em , assume-se que: (i) é Hurwitz, (ii) existem constantes positivas conhecidas tal que , , onde é a solução de e (iii) existe uma constante conhecida e uma função também conhecida tal que
onde é não-negativa, contínua em , contínua por partes em e satisfaz , para algum e alguma constante . Agora, utilizando-se a seguinte função quadrática pode-se obter a desigualdade (10) com
contanto que . Portanto, a função e definindo , o observador da norma (5) pode ser implementado com .
4.2 Sistema interno sem restrição linear de crescimento no estado não-medido
Para ilustrar que a aplicabilidade da estratégia proposta não está restrita a plantas não-lineares com limitado de forma afim com a norma do estado não-medido , como em (11) e (12), considera-se um caso simples invariante no tempo adaptado de (Jiang et al., 2004), onde é dado por
Neste caso, a dinâmica do estado é ISS com respeito a e a função de Lyapunov-ISS (Jiang et al., 2004) é . Assim, tem-se que e aplicando-se a desigualdade de Young ao termo tem-se que e, consequentemente, . Por esta razão, pode-se obter a desigualdade (10) com Assim sendo, e o observador da norma (5) pode ser implementado com .
5 CONTROLE VETORIAL UNITÁRIO VIA REALIMENTAÇÃO DE SAÍDA
Essa seção e a próxima apresentam a primeira generalização dos controladores propostos em (Yan et al., 2008) e (Oliveira et al., 2007) para uma classe de plantas não-lineares MIMO com direção de controle desconhecida e grau relativo unitário.
Seja o índice desconhecido do conjunto indexado finito dado em (H1) para o qual a matriz correspondente também desconhecida assegura que seja Hurwitz. Portanto, a equação de Lyapunov tem uma única solução .
Agora, se a direção de controle fosse conhecida ( conhecido), poderíamos aplicar a seguinte lei de controle vetorial unitário3 (UVC) (Hsu et al., 2002)
em (7) e verificar que, se a função de modulação satisfaz
a menos do termo exponencial decrescente , então a derivada de Dini temporal de ao longo das soluções de (7) satisfaz:
para qualquer , onde em (4), e vindo de (9). Além disso, se , pode-se escolher . A partir do Lema da Comparação (Filippov, 1964), tem-se que:
com (vide [Lemma 1]HCCL:2002a para maiores detalhes).
O principal problema é que é desconhecido e, portanto, não podemos implementar a lei UVC em (14). Em (Yan et al., 2008) e (Oliveira et al., 2007), um esquema de chaveamento baseado em função de monitoração foi desenvolvido para lidar com a falta de conhecimento da direção de controle. Entretanto, apenas plantas SISO foram consideradas. Naquele caso, era um escalar e depois de um número finito de trocas do sinal da lei de controle (), a direção de controle correta pôde ser detectada. Para plantas não-lineares MIMO, a lei UVC é redefinida como
onde satisfaz (15) e o mecanismo de chaveamento também baseado em função de monitoração é utilizado para decidir quando a matriz estática pré-compensadora (Hespanha et al., 2003) deva ser chaveada dentro da coleção de matrizes com .
6 ESQUEMA DE CHAVEAMENTO E FUNÇÃO DE MONITORAÇÃO
Agora construiremos a função de monitoração baseada em um limitante para a norma de e dado em (16). Relembrando que (16) é válido apenas se a matriz é correta , parece natural utilizarmos como benchmark e decidir quando um chaveamento de é necessário, ou seja, o chaveamento ocorrerá apenas quando (16) for violada. Todavia, como não é mensurável, considera-se a seguinte função, definida no intervalo , para substituir :
onde o instante de chaveamento ajusta a mudança de índice , e assim comuta ciclicamente as matrizes , e é qualquer sequência positiva monotonicamente crescente e ilimitada. A função de monitoração pode, portanto, ser definida como
Note que a partir de (18) e (19), tem-se que . Por esta razão, o instante de chaveamento é definido quando a função de monitoração encontra , isto é,
onde (vide Figura 1). A seguinte desigualdade é obtida diretamente da definição (19)
A Figura 1 ilustra a norma do erro de rastreamento assim como a função de monitoração .
Observação 1 (Soluções Ilimitadas e Infinitos Chaveamentos)De acordo com (H2) e a Definição 1, o sistema em malha fechada (1)(2) com a lei de controle (17) tem uma propriedade denominada unboundedness observability (UO), no sentido de que qualquer escape em tempo finito (ou mesmo infinito) de algum sinal do sistema pode ser observado na saída. Assim, qualquer eventual escape é evitado se(ou o erro de rastreamento e) permanece uniformemente limitado. Portanto, pela "característica exponencial decrescente'' da função de monitoraçãoem (19), é claro que soluções ilimitadas podem ocorrer apenas se apresentar um infinito número de chaveamentos .
7 ANÁLISE DE ESTABILIDADE
A fim de levar em conta todas as condições iniciais do sistema em malha fechada, considere
onde denota o estado transitório (Hsu et al., 2002) e é uma constante genérica. O resultado principal é agora estabelecido.
Considere sistemas não-lineares transformáveis na forma normal (1) - (2) com lei de controle UVC (17) e função de monitoração (18)-(19). Assuma que (H1)(H3) sejam verificadas. Se a função de modulação satisfaz (15), então o chaveamento da direção de controle termina após um número finito de chaveamentos. O sistema completo do erro (7) com estado é globalmente assintoticamente estável com respeito a um conjunto compacto independente das condições iniciais e por fim exponencialmente convergente para zero. Além disso, todos os sinais do sistema em malha fechada permanecem uniformemente limitados e se em (15), então o modo deslizante é alcançado em tempo finito. Prova: Ver Apêndice 11.
Observação 2 (Conjuntos Compactos e Transitórios Iniciais) Note que os resultados de estabilidade com respeito a um conjunto compacto, não necessariamente pequeno, leva em conta o transitório inicial enquanto a função de monitoração ainda não parou de chavear. Isso significa que, mesmo que os erros iniciais sejam muito pequenos, o transitório inicial pode não ser correspondentemente pequeno.
Observação 3 (Seleção da Matriz) Sabe-se que se é Hurwitz todas as trajetórias do sistema convergem para a origem do espaço de estados do erro (Hsu et al., 2002, Lemma 1). Além disso, se não é Hurwitz, então para quase toda condição inicial (ou seja, exceto para um conjunto de medida nula) as trajetórias do sistema divergem ilimitadamente ou não convergem para a origem. Isso é uma contradição, visto que se o processo de chaveamento da direção de controle termina, de acordo com o Teorema 7, o estado do erro deve convergir para a origem. Então, quase sempre, a última matriz selecionada faz com que seja Hurwitz.
Observação 4 (Grau Relativo Arbitrário)
A generalização para sistemas não-lineares com grau relativo arbitrário é consideravelmente mais complexa. Alguns resultados preliminares podem ser encontrados em (Oliveira et al., 2007) para o caso SISO. Analogamente a (Nunes et al., 2010), a idéia chave para superar o obstáculo do grau relativo é introduzir um compensador híbrido combinando, através de chaveamento, um observador de alto ganho (Khalil, 2002) com um diferenciador robusto e exato, baseado em modos deslizantes de ordem superior (Fridman et al., 2008), para atingirmos estabilidade global prática e uniforme, além de rastreamento assintótico exato.
Observação 5 (Direção de Controle Variante no Tempo) Devido a propriedade de decaimento exponencial da função de monitoração, o esquema aqui desenvolvido pode ser eficaz no tratamento de sistemas com direção de controle variante no tempo, ou seja . Contudo, é correto pensar que essa dependência com o tempo também não poderá ser arbitrária, o que demanda alguma hipótese sobre o comportamento das mudanças da direção de controle e ao mesmo tempo evitar o fenômeno de escape em tempo finito não excluído a priori para os sistemas não-lineares aqui tratados. Neste sentido, um primeiro caminho seria assumir que as mudanças na direção de controle são tais que estas não possam resultar em um comportamento Zeno ou no fenômeno de Fuller (Van der Schaft & Schumacher, 2000), isto é, não poderá haver um número infinito de chaveamentos da função de monitoração em um intervalo de tempo finito.
8 APLICAÇÃO AO PROBLEMA DE SERVOVISÃO
Para ilustar a aplicabilidade do esquema de chaveamento e monitoração proposto, considera-se um caso simples onde a planta é um integrador MIMO sem subsistema interno. O esquema de controle proposto é utilizado para resolver o problema de controle por servovisão para um manipulador robótico de 6-DOF (degrees of freedom) realizando movimentos planares no espaço cartesiano e utilizando uma câmera fixa, não-calibrada, com eixo óptico ortogonal ao espaço de trabalho do robô.
O modelo simplificado para o movimento de um ponto do efetuador do robô (alvo) no sistema de coordenadas da imagem da câmera, assim como os sistemas de coordenadas do robô, da imagem e da câmera são ilustrados nas Figuras 2 e 3.
8.1 Controle Cinemático Servovisual
Primeiramente, considera-se o problema de controle cinemático para um robô manipulador não-redundante. Nesta abordagem, a posição do efetuador do robô é dada pelo mapeamento cinemático direto , onde é o vetor de ângulos das juntas do manipulador e .
A cinemática diferencial pode ser obtida a partir da derivada temporal do mapeamento cinemático direto sendo dada por
onde é o Jacobiano do manipulador. Esse modelo pode ser aplicado a maioria dos robôs comerciais com elevado fator de redução nas engrenagens e/ou quando a velocidade da tarefa é lenta. Assim sendo, considerando como a entrada de controle , obtém-se o seguinte sistema
Uma lei de controle cartesiana pode ser transformada em sinais de controle das juntas utilizando-se
desde que não leve o robô manipulador para configurações com singularidades, ou seja, é não-singular.
Agora o problema de controle por servovisão de um robô manipulador será considerado. Neste contexto, a abordagem por servovisão é utilizada para fecharmos a malha de controle de posição do efetuador do robô. Seja a posição do efetuador e a trajetória desejada a ser efetuada por um alvo fixado na extremidade do braço robótico, ambas expressas no plano de coordenadas da imagem da câmera. O objetivo de controle pode ser descrito por fazer
onde é o erro de imagem.
Aqui, considera-se que o robô manipulador realiza movimentos planares no espaço cartesiano e, portanto, . Considerando uma câmera CCD (charge-coupled device) monocular fixa com eixo óptico perpendicular ao sistema de coordenadas do robô, a transformação câmera/espaço de trabalho (Hutchinson
et al., 1996) pode ser representada por
com
onde é um termo constante que depende da posição do sistema de coordenadas da câmera com respeito ao sistema de coordenadas do robô, é a matriz de transformação câmera/espaço de trabalho e considera o ângulo de orientação ou desalinhamento da câmera (vide Figura 2) com respeito ao sistema de coordenadas do robô, é a distância focal da câmera, é a distância (profundidade) do sistema de coordenadas da imagem da câmera com relação ao espaço de trabalho do robô (em geral ), e são fatores de escala da câmera [pixel/mm].
O problema de controle cartesiano no sistema de coordenadas da imagem da câmera é descrito a partir de (26) por
onde é a lei de controle a ser projetada.
Baseado em (27) e considerando uma lei de controlefeedforward mais proporcional dada por
tem-se que a dinâmica do erro de imagem é governada por . Assim, por uma escolha apropriada da matriz positiva definida exponencialmente quando .
Entretanto, assumindo que os parâmetros intrínsecos e extrínsecos do modelo da câmera são incertos (câmera não-calibrada), a matriz de transformação também é incerta. Consequentemente, a lei de controle (28) não garante rastreamento assintótico da trajetória desejada, uma vez que o sistema em malha fechada não é perfeitamente linearizado por realimentação.
Neste contexto, alguns esquemas adaptativos foram propostos com o intuito de lidar com as incertezas nos parâmetros de calibração da câmera (Papanikolopoulos
& Khosla, 1994; Kelly et al., 1999; Zergeroglu et al., 1999; Astol et al., 2002; Zachi, Hsu, Ortega & Lizarralde, 2006). Contudo, é sabido que estratégias adaptativas podem resultar em comportamento transitório ruim e falta de robustez a dinâmicas não-modeladas. Além disso, devido a restrições dos algoritmos de controle, nessas abordagens o ângulo de orientação da câmera deve ser escolhido dentro da faixa .
8.2 Controle Vetorial Unitário para
Servovisão
No que se segue, a combinação do controlador vetorial unitário e o esquema de chaveamento baseado em função de monitoração é aplicada para resolver o problema de controle por servovisão de manipuladores robóticos na presença de incertezas nos parâmetros da câmera e sujeito a qualquer desalinhamento do ângulo da mesma.
Para ilustrar a propriedade de rejeição de perturbação do esquema proposto, adicionamos uma perturbação artificial à entrada de controle utilizando-se medidas obtidas de encoders do robô. Então, a partir do mapeamento cinemático inverso e (26), o problema de controle cartesiano no sistema de coordenada da imagem pode ser reescrito como (2) com um apropriado.
A função de monitoração (18)-(19) é utilizada para trocar a matriz em (17). O conjunto finito de matrizes , pode ser escolhido como:
Assim, para qualquer ângulo de desalinhamento , é Hurwitz para algum e a restrição usual pode ser removida. O diagrama em blocos do sistema de controle é apresentado na Figura 8.2.
Diagrama em blocos: esquema de controle servovisual proposto.
9 EXPERIMENTOS E RESULTADOS
Nesta seção descreve-se o ambiente experimental utilizado para a obtenção dos resultados e testes realizados que ilustram o desempenho do esquema de controle.
9.1 Ambiente Experimental
Os resultados experimentais foram obtidos através da implementação do controlador proposto em um robô manipulador de 6-DOF Zebra Zero (Integrated Motions, Inc.). Os efeitos dinâmicos são desprezíveis neste robô devido ao seu elevado fator de redução nas engrenagens das juntas e ao alto ganho na sua malha de controle de velocidade.
Uma câmera KP-D50 CCD (Hitachi, Ltd.) com distância focal [mm] e fatores de escala e [pixel/mm] foi montada em frente ao Zebra Zero (vide Figura 4 do ponto de vista da câmera com ). A profundidade média do plano da imagem para o espaço de trabalho do robô é [m]. A característica da imagem (target) extraída são as coordenadas do centróide de um disco vermelho fixado no punho do robô. As imagens de 640x480 [pixel] são capturadas utilizando-se uma placa Meteor frame-grabber (Matrox, Ltd.) com taxa de amostragem de 30 frames por segundo.
O controlador servovisual é codificado em linguagem C e executado a cada 35.0 [ms] em um processador Pentium Pro 200 MHz com 64 Mbytes de memória RAM utilizando o sistema operacional Linux. O controle de velocidade das juntas gerado pela lei de controle servovisual alimenta a placa ISA do Zebra Zero, fechando a malha de velocidade a partir de um microcontrolador HCTL1100 (HP Inc.) operando em modo de velocidade proporcional com período de amostragem de 0.52 [ms].
O processamento de imagem no formato RGB (red-green-blue) é realizado em uma subjanela de tamanho 100x100 [pixel]. A primeira estimativa das coordenadas do centróide são executadas off-line utilizando-se uma Interface Gráfica de Usuário (GUI) desenvolvida em linguagem Tcl/Tk (Leite & Lizarralde, 2006) como mostrado na Figura 4. Durante a execução da tarefa, a característica da imagem é computada utilizando o algoritmo de momentos de imagens (Haralick & Shapiro, 1993). Devido a sensibilidade ao ruído, o ganho proporcional na malha de controle de velocidade não é grande o suficiente para eliminar o erro em regime permanente devido aos efeitos da gravidade. Essa perturbação foi identificada off-line utilizando um método baseado em mínimos quadrados e depois efetivamente compensada (Spong & Vidyasagar, 1989).
9.2 Resultados Experimentais
Os testes experimentais são realizados sem qualquer procedimento de calibração. A trajetória desejada é gerada pelo modelo (4), com com sinais de referência
onde é a posição inicial das coordenadas do centróide no sistema de coordenadas da imagem, são parâmetros constantes que determinam a direção de movimento, são o raio e a velocidade angular da trajetória de referência, respectivamente.
Nesses experimentos, o robô manipulador tem que executar o rastreamento de uma trajetória circular especificada no sistema de coordenadas da imagem com [pixel] e [rad/s]. Outros parâmetros relevantes são: . O ângulo inicial de rotação da câmera considerado foi [rad].
A função de monitoração é obtida a partir de (18)-(19) com . Uma constante de valor 15 foi adicionada a para reduzir modificações espúrias na direção de controle devido a ruídos de medição. Além disso, sabe-se que o ruído de medição causa chattering no sinal de controle. Entretanto, este pode ser suavizado utilizando-se o método da camada de fronteira (Edwards & Spurgeon, 1998) na lei de controle UVC. A função de modulação foi implementada a fim de satisfazer (15) e um limitante superior para foi obtido utilizando-se o mapeamento cinemático direto. Todos os testes foram pensados de forma a evitar singularidades no Jacobiano em (24). Com o intuito de simplificar a implementação do controlador, a função de modulação foi escolhida constante ( = 28), mostrando-se suficiente para garantir o rastreamento desejado.
A Figura 6 mostra o comportamento da função de monitoração e da norma do erro . O sinal de controle foi inicializado com a matriz (que não é a matriz correta para ). Em seguida, o ângulo de orientação da câmera foi modificado para . Note que, apenas no quarto chaveamento (SW) pelo conjunto indexado , isto é , a matriz correta é novamente selecionada (considerando agora que é Hurwitz) e depois disso .
A Figura 7 descreve o erro de imagem e o sinal de controle , respectivamente. Note que, a convergência assintótica do erro para um conjunto residual é evidente. A trajetória do alvo é ilustrada na Figura 8, onde observa-se que o rastreamento é alcançado mesmo para e mudanças em artificialmente introduzidas durante o experimento.
Apesar das incertezas cinemáticas devido a flexibilidade do manipulador robótico e as não-linearidades do tipo backlash provenientes de folgas nas engrenagens das juntas do robô, o controlador vetorial unitário e por modos deslizantes proposto mostrou-se bastante robusto e conseguiu garantir um excelente desempenho no rastreamento de trajetória.
10 CONCLUSÕES
Um controlador por modos deslizantes utilizando funções de monitoração foi recentemente introduzido para sistemas não-lineares SISO com direção de controle desconhecida. Neste artigo, a abordagem proposta permite incluir não-linearidades fortes no estado não-medido e lidar com sistemas multivariáveis e de grau relativo um. A estratégia é baseada no controle vetorial unitário por realimentação de saída para gerar o modo deslizante ideal e em um esquema de monitoração para reduzir o conhecimento sobre a matriz de ganho de alta frequência usualmente requerido por outros métodos. A estabilidade global assintótica com respeito a um conjunto compacto e o rastreamento exato da saída são provados. O controlador proposto foi testado com sucesso em um experimento de servovisão robótica. Além disso, foi removida a restrição sobre o ângulo de orientação da câmera usualmente requerido nas estratégias adaptativas.
AGRADECIMENTOS
Este trabalho contou com o apoio financeiro da FAPERJ e do CNPq. Os autores também agradecem a Antonio C. Leite por sua valiosa ajuda na execução dos testes experimentais realizados.
Artigo submetido em 28/08/2010 (Id.: 01190)
Revisado em 19/11/2010
Aceito sob recomendação do Editor Associado Prof. Marco Henrique Terra
Apêndice
A DEMONSTRAÇÃO DO TEOREMA 1
Daqui em diante, denota constantes independentes das condições iniciais e . A prova é conduzida em quatro partes a seguir.
(1) O chaveamento da direção de controle termina:Motivado pela Observação 1, suponha por contradição que as trocas ou chaveamentos de em (17) ocorram sem parar , onde pode ser finito ou infinito. Então, em (18)-(19) cresce ilimitadamente à medida que . Assim sendo, existe um valor finito tal que para : (i) o termo será um majorante de em (16) e (ii) é Hurwitz. A partir de , com em (16). A partir de (ii), é um limitante válido para . Consequentemente, nenhum chaveamento ocorrerá após (veja (20)), levando-nos assim a uma contradição. Deste modo, o chaveamento de (19) tem que parar após um número finito de chaveamentos .
(2) Estabilidade com respeito a um conjunto compacto: Não é difícil concluir que N pode ser relacionado com , visto que por definição. De fato, pode-se escrever . Assim, tem-se que . Agora, a partir de (18)-(21), e a simples desigualdade linear recursiva pode ser obtida, levando à conclusão que . Consequentemente, obtém-se , onde é uma constante positiva. Deste modo, dado , para , tem-se que estará sempre limitado por à medida que . Isso implica que é uniformemente limitado e não pode escapar em tempo finito, isto é, . Por esta razão, a estabilidade com respeito à bola de raio é garantida para dentro da bola-. Uma vez que e, portanto, podem ser escolhidos arbitrariamente grandes, a estabilidade global é concluída.
(3) Sinais limitados e convergência exponencial para zero: Uma vez que o chaveamento da direção de controle pára e converge para zero exponencialmente, então, conclui-se (independentemente de uma matriz Hurwitz ser selecionada em ) que e em (22) convergirão para zero ao menos exponencialmente. Relembrando que é uniformemente limitado e que , a partir de (H2) conclui-se que todos os sinais do sistema em malha fechada são uniformemente limitados.
(4) Modo Deslizante Ideal: É sabido que se é Hurwitz, todas as trajetórias do sistema convergem para a origem do espaço de estado do erro (Cunha et al., 2003, Lemma 1). Além disso, se não é Hurwitz, então para quase toda condição inicial (i.e., exceto para um conjunto de medida nula) as trajetórias do sistema divergem ilimitadamente ou não convergem para a origem.
Isso é uma contradição, visto que se o processo de chaveamento cessa, de acordo com o item (3) acima, o estado deve convergir para a origem. Assim, quase sempre, a última matriz selecionada é tal que seja Hurwitz. Portanto, a partir de (Cunha et al., 2003, Lemma 1), podemos adicionalmente concluir que torna-se identicamente nulo após um tempo finito desde que em (15).
Referências bibliográficas
- Arcak, M., Larsen, M. & Kokotovic, P. (2002). Boundedness without absolute stability in systems with stiffening nonlinearities, European J. of Control. 8(3): 243-250.
- Astolfi, A., Hsu, L., Netto, M. & Ortega, R. (2002). Two solutions to the adaptive visual servoing problem, IEEE Trans. Robotics and Automation 18(3): 387-392.
- Baida, S. V. (1993). Unit sliding mode control in continuous- and discrete-time systems, Int. J. Contr. 57(5): 1125-1132.
- Bartolini, G., Ferrara, A. & Giacomini, L. (2003). A switching controller for systems with hard uncertainties, IEEE Trans. on Circuits and Sytems. 50(8): 984-990.
- Bartolini, G., Pisano, A. & Usai, E. (2009). On the second-order sliding mode control of nonlinear systems with uncertain control direction, Automatica 45: 2982-2985.
- Chien, C.-J., Sun, K.-C., Wu, A.-C. & Fu, L.-C. (1996). A robust MRAC using variable structure design for multivariable plants, Automatica 32(6): 833-848.
- Cunha, J. P. V. S. (2004). Controle de Sistemas Multivariáveis Incertos por Realimentação de Saída e Modo Deslizante, PhD thesis, Ph.D. thesis, Programa de Engenharia Elétrica, COPPE/UFRJ, Rio de Janeiro.
- Cunha, J. P. V. S., Hsu, L., Costa, R. R. & Lizarralde, F. (2003). Output-feedback model-reference sliding mode control of uncertain multivariable systems, IEEE Trans. Aut. Contr. 48(12): 2245-2250.
- Deaecto, G. S. & Geromel, J. C. (2009). Controle de sistemas lineares com comutação, Controle & Automação 19: 431-443.
- Drakunov, S. (1993). Sliding mode control of the systems with uncertain direction of control vector, Proc. IEEE Conf. on Decision and Control, San Antonio, pp. 2477-2478.
- Edwards, C. & Spurgeon, S. K. (1998). Sliding Mode Control: Theory and Applications, Taylor & Francis Ltd.
- Filippov, A. F. (1964). Differential equations with discontinuous right-hand side, American Math. Soc. Translations 42(2): 199-231.
- Freidovich, L. B. & Khalil, H. K. (2007). Lyapunov-based switching control of nonlinear systems using high-gain observers, Automatica (43): 150-157.
- Fridman, L., Shtessel, Y., Edwards, C. & Yan, X. G. (2008). Higher-order sliding-mode observer for state estimation and input reconstruction in nonlinear systems, Int. J. of Robust and Nonlinear Control 18: 399-412.
- Fu, M. & Barmish, B. (1986). Adaptive stabilization of linear systems via switching control, IEEE Trans. Aut. Contr. 31(12): 1097-1103.
- Haralick, R. M. & Shapiro, L. G. (1993). Computer and Robot Vision, Vol. II, Addison-Wesley Inc.
- Hespanha, J. P., Liberzon, D. & Morse, A. (2003). Overcoming the limitations of adaptive control by means of logic-based switching, Systems & Contr. Letters 49: 49-65.
- Hsu, L., Costa, R. R. & Cunha, J. P. V. S. (2003). Model-reference output-feedback sliding mode controller for a class of multivariable nonlinear systems, Asian Journal of Control 5(4): 543- 556.
- Hsu, L., Cunha, J. P. V. S., Costa, R. R. & Lizarralde, F. (2002). Multivariable output-feedback sliding mode control, in X. Yu & J.-X. Xu (eds), Variable Structure Systems: Towards the 21st Century, Springer-Verlag, pp. 283-313.
- Hutchinson, S., Hager, G. & Corke, P. (1996). A tutorial on visual servo control, IEEE Trans. Robotics and Automation 12(5): 651-670.
- Jiang, Z. P., Mareels, I., Hill, D. J. & Huang, J. (2004). A unifying framework for global regulation nonlinear output feedback: from ISS to iISS, IEEE Trans. Aut. Contr. 49(4): 549-562.
- Kelly, R., Reyes, R., Moreno, J. & Hutchinson, S. (1999). A two loops direct visual control of direct-drive planar robots with moving target, pp. 599-604.
- Khalil, H. K. (2002). Nonlinear Systems, 3rd edn, Prentice Hall.
- Krichman, M., Sontag, E. D. & Wang, Y. (2001). Input-output-to-state stability, SIAM J. Contr. Optim. 39(6): 1874-1928.
- Leite, A. C. & Lizarralde, F. (2006). Application of Tcl/Tk for a robotic system, Proceedings of 13th Annual Tcl/Tk Conference, pp. 1-3.
- Leite, A. C., Lizarralde, F., Hsu, L. & Zachi, A. R. L. (2004). Rastreamento de trajetórias por servovisão adaptativa, Controle & Automação 15: 309-319.
- Martensson, B. (1991). The unmixing problem, IMA J. Math. Contr. Info. 8: 367-377.
- Mudgett, D. & Morse, A. (1985). Adaptive stabilization of linear systems with unknown high frequency gains, IEEE Trans. Aut. Contr. 30: 549-554.
- Nunes, E. V. L., Peixoto, A. J., Oliveira, T. R. & Hsu, L. (2010). Global exact tracking for uncertain multivariable linear systems by output feedback sliding mode control, Proc. American Contr. Conf. , Baltimore, pp. 974-979.
- Nussbaum, R. (1983). Some results on a conjecture in parameter adaptive control, Systems & Contr. Letters 3: 243-246.
- Oliveira, T. R., Peixoto, A. J. & Hsu, L. (2010). Controle por realimentação de saída para sistemas incertos fortemente não-lineares, Controle & Automação 21: 69-81.
- Oliveira, T. R., Peixoto, A. J., Nunes, E. V. L. & Hsu, L. (2007). Control of uncertain nonlinear systems with arbitrary relative degree and unknown control direction using sliding modes, Int. J. Adaptive Control Signal Process. 21 : 692-707.
- Papanikolopoulos, N. & Khosla, P. (1994). Adaptive robotic visual tracking: Theory and experiments, IEEE Trans. Aut. Contr. 38(3): 429-445.
- Ryan, E. (1993). Adaptive stabilization of multi-input nonlinear systems, Int. J. of Robust and Nonlinear Control 3(2): 169-181.
- Sontag, E. D. & Wang, Y. (1997). Output-to-state stability and detectability of nonlinear systems, Systems & Contr. Letters 29: 279-290.
- Spong, M. W. & Vidyasagar, M. (1989). Robot Dynamics and Control, John Wiley & Sons.
- Tao, G. & Ioannou, P. A. (1989). A MRAC for multivariable plants with zero residual tracking error, Proc. IEEE Conf. on Decision and Control, Tampa, USA, pp. 1597-1600.
- Van der Schaft, A. & Schumacher, H. (2000). An Introduction to Hybrid Dynamical Systems, Springer, London.
- Wu, Y. & Zhou, Y. (2004). Output feedback control for MIMO non-linear systems with unknown sign of the high frequency gain matrix, Int. J. Contr. 77(1): 9-18.
- Yan, L., Hsu, L., Costa, R. R. & Lizarralde, F. (2008). A variable structure model reference robust control without a prior knowledge of high frequency gain sign, Automatica 44: 1036-1044.
- Zachi, A. R. L., Hsu, L., Ortega, R. & Lizarralde, F. (2006). Dynamic control of uncertain manipulators through immersion and invariance adaptive visual servoing, The International Journal of Robotics Research 25(11): 1149-1159.
- Zachi, A. R. L., Lizarralde, F., Hsu, L. & Leite, A. C. (2006). Adaptive control of nonlinear visual servoing systems for 3D cartesian tracking, Controle & Automação 17: 381-390.
- Zergeroglu, E., Dawson, D. M., de Queiroz, M. S. & Nagarkatti, S. (1999). Robust visual-servo control of robot manipulators in the presence of uncertainty, Proc. IEEE Conf. on Decision and Control pp. 4137-4142.
- Zhang, T. P. & Ge, S. S. (2007). Adaptive neural control of MIMO nonlinear state time-varying delay systems with unknown dead-zones and gain signs, Automatica 43: 1021-1033.
Datas de Publicação
-
Publicação nesta coleção
17 Jun 2011 -
Data do Fascículo
Abr 2011
Histórico
-
Recebido
28 Ago 2010 -
Aceito
19 Nov 2010