Acessibilidade / Reportar erro

Controle robusto de robos móveis em formação sujeitos a falhas

Robust and fault tolerant control of wheeled mobile robots in formation

Resumos

Este artigo trata de controle robusto e controle tolerante a falhas de movimentos coordenados de robôs móveis com rodas. O controle robusto é baseado em controle H∞ não linear por realimentação da saída. O controle tolerante a falhas é baseado em controle H∞ por realimentação da saída de sistemas lineares sujeitos a saltos Markovianos para garantir estabilidade da formação quando um dos robôs é perdido durante o movimento coordenado. A coordenação é realizada em função de um lider e qualquer robô da formação pode assumir a liderança de maneira aleatória. Os robôs móveis trocam informações de acordo com um grafo de comunicação direcionado (dígrafo), definido a-priori.

Controle de Formação; Robôs Móveis; Controle H∞ Não Linear; Controle Markoviano


This paper deals with robust and fault tolerant controls of wheeled mobile robots (WMRs) in formation. The robust approach is based on output feedback nonlinear H∞ control. The fault tolerant approach is based on output feedback H∞ control of Markovian jump linear systems to ensure stability of the formation when one of the robots is lost during the coordinated motion. The coordination is performed with the robots following a leader, and any robot of the formation can assume the leadership randomly. The mobile robots exchange informations according to a pre-specified communication directed graph (digraph).

Formation Control; Mobile Robots; Nonlinear H∞ Control; Markovian Control


ROBÓTICA

Controle robusto de robos móveis em formação sujeitos a falhas

Robust and fault tolerant control of wheeled mobile robots in formation

Adriano A. G. SiqueiraI; Marco H. TerraII; Tatiane B. R. FranciscoII

IDepartamento de Engenharia Mecânica, Universidade de São Paulo -13566-590, São Carlos, SP, Brasil, siqueira@sc.usp.br

IIDepartamento de Engenharia Elétrica, Universidade de São Paulo -13566-590, São Carlos, SP, Brasil, terra@sc.usp.br, tatibrf@sel.eesc.usp.br

RESUMO

Este artigo trata de controle robusto e controle tolerante a falhas de movimentos coordenados de robôs móveis com rodas. O controle robusto é baseado em controle H não linear por realimentação da saída. O controle tolerante a falhas é baseado em controle H por realimentação da saída de sistemas lineares sujeitos a saltos Markovianos para garantir estabilidade da formação quando um dos robôs é perdido durante o movimento coordenado. A coordenação é realizada em função de um lider e qualquer robô da formação pode assumir a liderança de maneira aleatória. Os robôs móveis trocam informações de acordo com um grafo de comunicação direcionado (dígrafo), definido a-priori.

Palavras-chave: Controle de Formação, Robôs Móveis, Controle H Não Linear, Controle Markoviano.

ABSTRACT

This paper deals with robust and fault tolerant controls of wheeled mobile robots (WMRs) in formation. The robust approach is based on output feedback nonlinear H control. The fault tolerant approach is based on output feedback H control of Markovian jump linear systems to ensure stability of the formation when one of the robots is lost during the coordinated motion. The coordination is performed with the robots following a leader, and any robot of the formation can assume the leadership randomly. The mobile robots exchange informations according to a pre-specified communication directed graph (digraph).

Keywords: Formation Control, Mobile Robots, Nonlinear H Control, Markovian Control.

1 INTRODUÇÃO

Diversas abordagens têm sido apresentadas na literatura para resolver problemas de controle de múltiplos robôs móveis, (Chaimowicz et al., 2004; Pereira et al., 2008). Em particular, vamos considerar neste artigo estratégias de controle para robôs móveis com rodas (RMRs) que seguem um líder, veja por exemplo (Desai et al., 1998) e (Tanner et al., 2004). Uma abordagem que utiliza teoria dos grafos foi proposta por (Fax and Murray., 2004) para o controle cooperativo de múltiplos sistemas lineares. A teoria dos grafos é uma importante ferramenta capaz de tratar adequadamente os problemas que envolvam comunicação de dados entre agentes do sistema, (Lafferriere et al., 2005; Olfati-Saber and Murray, 2002).

Apesar do grande número de resultados que tem aparecido na literatura, não foram encontrados procedimentos que envolvam controle robusto de robôs móveis em formação sujeitos a alternância de líder. Também não foram encontrados sistemas tolerantes a falhas baseados nos modelos dinâmicos dos robôs para esse tipo de problema. Esses dois aspectos são tratados neste artigo.

Na primeira estratégia de controle formulada consideramos um conjunto de RMRs em formação onde os robôs mantêm constantes as suas posições e orientações relativas durante o movimento. Cada RMR fornece a sua informação de posição somente a um subconjunto do grupo, estabelecido pelo projetista através de um dígrafo. A partir das trajetórias desejadas geradas pelo controlador descrito em (Williams et al., 2005), projetamos um controlador não linear com realimentação da saída que considera as características cinemáticas e dinâmicas dos robôs móveis em formação. O objetivo é aplicar o controle robusto para um grupo de RMRs que devem seguir uma determinada trajetória e se manter em formação mesmo quando há alternância de lider durante o movimento. Esta estratégia de controle é usada para rejeitar primeiramente determinadas incertezas paramétricas e perturbações externas em cada robô da formação. Também vale destacar a vantagem de se utilizar abordagens robustas utilizando os modelos dinâmicos de cada RMR quando o movimento coordenado ocorre em alta velocidade.

Na segunda estratégia de controle desenvolvemos um sistema tolerante a falhas para evitar instabilidade na formação dos robôs quando houver perda de um dos robôs durante o movimento. Com base na teoria de Markov desenvolvemos um modelo que representa as possíveis configurações de formação e considera as mudanças abruptas de configuração. O modelo é desenvolvido baseado em sistemas lineares sujeitos a saltos Markovianos (SLSM) (Siqueira et al., 2007). Para formular este modelo, as dinâmicas dos robôs são linearizadas em torno de pontos de operação. As probabilidades de ocorrência de falhas e dos robôs estarem em determinados pontos de linearização são definidas a priori e dependem de cada aplicação específica. Com o modelo proposto, o controlador por realimentação de saída de SLSM desenvolvido em (de Farias et al., 2000) é utilizado para garantir a estabilidade da formação mesmo quando o sistema está sujeito a falha.

Este artigo está organizado da seguinte maneira: na Seção 2 são apresentados os procedimentos necessários para a geração das trajetórias desejadas, na Seção 3 é apresentado o controle cinemático dos robôs móveis, na Seção 4 é apresentado o controle robusto baseado na dinâmica dos robôs móveis, na Seção 5 é apresentada a estratégia de controle tolerante a falhas baseada nos modelos lineares sujeitos a saltos Markovianos dos robôs móveis com rodas e na Seção 6 são apresentados resultados de simulação referentes as duas estratégias de controle apresentadas.

2 GERAÇÃO DAS TRAJETÓRIAS DE REFERÊNCIA

Nesta seção é apresentado o controlador descentralizado proposto em (Williams et al., 2005) cuja finalidade é gerar as trajetórias de referência para que os RMRs se movimentem em formação rígida. Assume-se que N robôs móveis participem do movimento coordenado sendo que a trajetória de referência de cada robô é representada no sistema de coordenadas inercial (X, Y ) pela seguinte equação de estado:

sendo que xi =[xri ri yriri]T representa as posições para o i-ésimo RMR e suas derivadas, e ui representa as entradas de controle. As matrizes Aveh e Bveh, têm a seguinte forma:

sendo aij constantes relacionadas à trajetória desejada para a formação. A trajetória do líder pode ser alterada variando-se os elementos da matriz Aveh. Por exemplo, se a22 = a24 = a42 = a44 = 0, temos uma reta com inclinação dada pelas condições iniciais; se a22 = a44 = 0 e a24 = -k e a42 = k, com k > 0, temos uma elipse. Esta variação pode ser realizada ao longo do tempo para se criar uma trajetória variável do líder. Os zeros nas colunas um e três de Aveh são necessários para garantir a convergência dos robôs móveis para a formação (veja (Laferriere et al., 2004) Proposição 3.1 e (Veerman et al., 2005) Proposição 4.2).

O vetor descreve a combinação de todas as trajetórias dos N robôs. Os vetores de posição e velocidade são definidos, respectivamente, por

e

,

sendo (xp)i =[xri yri]T e . Assim, o vetor x é reescrito como

sendo que representa o Produto de Kronecker.

A definição de formação a ser considerada neste trabalho é caracterizada pelo vetor

sendo o vetor das posições descritas no sistema de coordenadas inercial (X, Y ) que definem a formação, sendo (hp)i =[hxi hyi].

Os N RMRs estão em formação h no tempo t se existirem vetores q, w

2, tais que,

para i =1, 2, ..., N. Note que q(t)=[qx(t) qy(t)] representa a distância entre a posição atual do robô i ea posição do mesmo robô definida pela formação h. Esta distância deve ser a mesma para cada robô. Da mesma forma, w representa a velocidade da formação, sendo que todos os robôs devem possuir a mesma velocidade.

Os RMRs convergem para a formação h se existirem funções q(.), w(.)

2, tais que,

quando t → ∞, para i = 1, ..., N. A Figura 1 ilustra este conceito de formação, sendo representada apenas a análise com relação à coordenada x do sistema de coordenadas inercial (X, Y ).


A topologia de comunicação entre os robôs móveis é representada por um dígrafo rque captura a conectividade entre os robôs móveis. Cada vértice representa um robô e há uma aresta direcionada de um vértice ao outro se houver comunicação entre os robôs móveis. O robô móvel que envia a informação é considerado vizinho do robô que está recebendo a informação. O par (i, j) pertence ao conjunto de arestas se i é vizinho de j. Para implementar o controle de formação, utiliza-se uma matriz Laplaciana que tem o objetivo de agrupar as informações que definem quais robôs se comunicam entre si.

Seja Γ um dígrafo com conjunto de vértices V e conjunto de arestas E. A matriz de adjacência de Γ é a matriz quadrada Q com entradas

A matriz de grau interno de Γ, definida como sendo diagonal, é denotada por D e formada por

Dado um dígrafo Γ, a matriz Laplaciana associada a ele é dada por (Brualdi and Ryser, 1991)

sendo D uma matriz não invertível e o superescrito + denota pseudoinversa.

O robô considerado líder da formação é caracterizado por não receber nenhuma informação de outro robô móvel. Isto significa que os outros robôs são forçados a arranjar suas posições em resposta ao movimento desse robô (Lafferriere et al., 2005). Para que haja este líder, o dígrafo de comunicação é uma árvore. Trata-se de um dígrafo Γ que não tem ciclos e admite um vértice v (a raiz) tal que há um trajeto direcionado de v a todos os outros vértices em Γ. Neste caso, a linha da matriz de adjacência Q referente ao vértice do líder tem que ser zero.

As informações de cada robô móvel podem ser combinadas de tal forma que os RMRs devem ajustar seus movimentos com relacão ao líder da formação. As funções de saída zi podem ser calculadas pela média dos deslocamentos relativos (e velocidades relativas) da vizinhança dos respectivos robôs móveis como sendo (veja (Fax and Murray., 2004) e (Williams et al., 2005)) para maiores detalhes)

para i = 1 . . . N, sendo que Ji indica o número de vizinhos do i-ésimo robô. O vetor de saída z pode ser escrito como z = L(x - h) sendo L = LΓ

I4 e Lr a matriz direcionada Laplaciana do dígrafo Γ (Williams et al., 2005).

Agrupando as equações para todos os RMRs em um único sistema no espaço de estado tem-se

sendo A = IN Aveh e B = IN Bveh. A existência de uma matriz de realimentação F tal que a solução de

converge para formação h pode ser vista em (Williams et al., 2005). Este é um problema de estabilização envolvendo realimentação da saída. Considerando as estruturas de A, B e L tem-se F da forma F = IN Fveh (que é uma lei de controle descentralizada aplicada a todos os robôs móveis). Neste caso, pode-se reescrever a Eq. (2) como

Note que o conjunto de robôs móveis convergirá para uma dada formação h se o Laplaciano do grafo direcionado LT possuir pelo menos dois autovalores nulos, (Lafferriere et al., 2005). Para obtermos o controlador, a matriz de realimentação, Fveh, pode ser representada da seguinte forma

Em (Williams et al., 2005) mostra-se que as condições necessárias e suficientes para o sistema convergir para a formação são obtidas com f1 < 0 e f2 < 0.

A principal finalidade do controle de formação é encontrar a matriz de realimentação Fveh que garanta a convergência para a formação, dada a estrutura de Aveh. Os elementos da matriz Aveh são os parâmetros que definem a trajetória de referência para o robô líder. O controle mostrado acima gera as trajetórias que os demais RMRs devem realizar para entrar em formação com o líder. Estas curvas são utilizadas como trajetórias de referência para os robôs móveis, sendo consideradas como entradas para o controle cinemático descrito no próxima seção. O controle cinemático fornece, a partir das trajetórias de referência e das posições atuais do robôs, as posições e velocidades desejadas das rodas de cada robô, que por sua vez são utilizadas para realizar o controle baseado no modelo dinâmico dos robôs. A Figura 2 mostra o diagrama de blocos simplificado das estratégias de controle utilizadas neste trabalho.


3 CINEMÁTICA DOS ROBÔS MÓVEIS

Nesta seção é apresentado o controlador cinemático utilizado para garantir que os RMRs do tipo diferencial, considerados neste trabalho, acompanhem as trajetórias de referência geradas pelo controle de formação.

A geometria de cada robô é mostrada na Figura 3. Assume-se que todos os RMRs têm a mesma dimensão e que a roda passiva não influencia o comportamento cinemático e dinâmico do robô. Na Figura 3, (X, Y ) representa o sistema de coordenadas inercial; (X0, Y0)o sistema de cordenadas local; a o comprimento do robô; d a distância entre P0 (centro do eixo das rodas atuadas) e Pc (centro de massa); b a distância entre uma roda atuada e o eixo de simetria do robô; r o raio das rodas atuadas; α o ângulo (direção do robô) entre o eixo X do referencial inercial e o eixo de simetria do robô no sentido horário e θd e θe são os deslocamentos angulares das rodas direita e esquerda, respectivamente.


Robôs móveis do tipo diferencial apresentam três restrições cinemáticas (Coelho and Nunes., 2003). Considerando que para este tipo de robô a velocidade em P0i deve estar na direção do eixo de simetria (eixo X0i), tem-se a primeira restrição com relação a Pci, dada por

sendo (xci, yci) as coordenadas do centro de massa Pci no sistema de coordenadas inercial e αi o ângulo entre o eixo de simetria de cada robô da formação e o eixo X. As outras duas restrições estão relacionadas com a rotação das rodas, em outras palavras, as rodas atuadas não deslizam

Definindo a coordenada generalizada q1i = [xci yci αiθdi θei]T, as três restrições cinemáticas podem ser escritas na forma matricial como R(q1i ) 1i = 0, sendo

A matriz R(q1i) tem posto completo e pode ser expressa como [R1(q1i) R2] de tal forma que R1(q1i) seja não singular e S(q1i) = [(R1 -1(q1i)R2)T I4]T esteja no espaço nulo de R(q1i), i.e., R1(q1i) S(q1i) = 0. Então, encontra-se

sendo c = . A equação cinemática é dada por

ou

sendo q2i = [θdi θei]T o vetor das posições das rodas direita e esquerda do i-ésimo robô e 2i = [di

ei]T o vetor das velocidades angulares das rodas.

O controlador baseado na cinemática proposto por (Kanayama et al., 1990), fornece as velocidades angulares desejadas das rodas esquerda e direita, , tais que os RMRs acompanhem as trajetórias de referência geradas pelo controle de formação.

Considere o erro qei =[xei yei αei]T , entre a postura de referência qri =[xriyri αri]T , obtida pela equação do controle de formação, (3), com

e a postura atual de cada robô móvel na formação qci= [xci yci αci]T . As equações dos erros são dadas por

O controle cinemático fornece as velocidades lineares e angulares desejadas dos RMRs, considerando o erro de postura e as velocidades lineares e angulares de referência dadas, respectivamente, por

sendo

i e i obtidas pela equação do controle de formação, (3), e ri obtida derivando-se (6) com relação ao tempo.

Portanto, o controlador cinemático é dado por

sendo Kx , Ky, Kα constantes definidas pelo projetista.

O controle baseado na dinâmica considera as velocidades angulares desejadas das rodas de cada RMR, . Então, é necessário definir as seguintes relações de velocidades

sendo and as velocidades angulares desejadas das rodas direita e esquerda dos RMRs, respectivamente.

4 REPRESENTAÇÃO QUASE-LPV DOS RMRS

Na seção anterior estabelecemos a maneira como as trajetórias desejadas devem ser geradas para o controle de RMRs em formação, com base em informações cinemáticas dos robôs. Nesta seção vamos considerar os aspectos dinâmicos dos RMRs. Inicialmente será obtida uma representação quase-LPV (quase-Linear com Parâmetros Variantes) dos RMRs. Sistemas LPV são sistemas cujas matrizes dinâmicas variam continuamente conforme a variação no tempo de determinados parâmetros. Quando um sistema não linear é representado como um sistema LPV cujos parâmetros variantes correspondem aos estados ou parte dos estados, dizemos que temos uma representação quase-LPV daquele. Neste trabalho, o projeto de controle com realimentação da saída para sistemas LPV descrito em (Apkarian and Adams, 1998) será utilizado para se obter um controlador baseado na dinâmica dos RMRs.

A equação dinâmica dos robôs móveis, usando a teoria de Lagrange, é descrita por Coelho and Nunes. (2003) como:

sendo λi =[λ1iλ2iλ3i]T o vetor de restrições das forças, E = [0 I4]T a matriz de entrada, τi = [τdi τei]T o vetor de torque nas rodas,

a matriz de forças de coriolis e centrípeta, e

a matriz de inércia. Os parâmetros m e I são dados por m = mc +2mω e I = Ic +2mω(d 2 + b2)+2Im + mcd 2 , sendo mψ o conjunto da massa da roda e do rotor do motor; mc é a massa da plataforma do robô; Ic é o momento de inércia da plataforma do robô em relação ao eixo vertical em Pc; Iw é o momento de inércia da roda em relação ao eixo da roda; Im é o momento de inércia da roda em relação ao eixo definido no plano da roda (perpendicular ao eixo da roda). Diferenciando a Eq. (4) em relação ao tempo, substituindo o resultado na expressão dada em (11), e depois multiplicando o lado esquerdo por S(q1i)T , obtém-se

sendo M2 uma matriz constante, não-singular, dada por ST (q1i ) M (q1i) S (q1i) e C2(1i) = C2(i). Na derivação da equação acima utilizou-se o fato que S(q1i)T R(q1i)T = 0 e E = [0 I4]T. Adicionando uma perturbação no torque δi = [δdiδei]T e substituindo (5) em (12), tem-se

sendo (2i)= -M2-1C2(2i + = M2-1. Define-se o estado de cada robô como

e a representação quase-LPV para o controle de acompanhamento de trajetória de cada RMR em formação é dada por

sendo

Note que o estado é definido com as posições e velocidades angulares das rodas dos RMRs. O controlador baseado na dinâmica proposto neste trabalho considera as posições e velocidades angulares desejadas das rodas, e , respectivamente, para o cálculo do erro de acompanhemento de trajetória. As posições desejadas das rodas,, são calculadas integrando no tempo as velocidades angulares desejadas obtidas pelas equações (3), (9) e (10).

O controle com realimentação da saída para sistemas LPV garante que o ganho 2 entre o distúrbio e a saída seja limitado por um nível de atenuação γ. Para aplicar a técnica de controle apresentada em (Apkarian and Adams, 1998), a equação de acompanhamento de trajetória de cada RMR, (14), deve ser representada de acordo com a seguinte equação

sendo ρi =[ρi1(t),...,ρiM(t)]T o vetor contendo os parâmetros variantes no tempo, ρik (t), k = 1,..., M, que satisfazem |ik (t)| < vik, sendo vik > 0 os limites da taxa de variação dos parâmetros.

Considere o distúrbio atuando no sistema como uma composição da perturbação no torque, δi, e pela posições angulares desejadas das rodas, ou seja, wi = [δTi(qd2i)T]T. A saída medida zi e a saída de controle yi são definidas em termos dos erros de posição,- q2i. Então, (16) pode ser caracterizada pelas seguintes matrizes

sendo A2(2i) e B definidas em (13). A dinâmica do controlador é definida como

Para obter o controlador, é preciso resolver o seguinte conjunto de desigualdades matriciais lineares (DMLs) para X(ρi) e Y (ρi) minimizando γ

sendo Nx e Ny projetadas para qualquer base de [C2 D21] e , respectivamente. Note que embora as matrizes dependam de ρi, essa dependência foi omitida por conveniência. O controlador LPV pode ser encontrado através do seguinte procedimento

• Calcule a solução Dk para

e o conjunto Dcl := D11 + D12DkD21.

• Calcule as soluções k e k para as equações matriciais lineares

• Calcule

• Resolva o problema de fatoração para N e M

• Finalmente, encontre Ak, Bk e Ck dados por

Algumas considerações devem ser tomadas para se obter o controlador acima. Primeiro, a solução do con-junto de desigualdades matriciais lineares (DMLs) é um problema de dimensão infinita, uma vez que o vetor de parâmetros ρi varia continuamente. Para resolver este problema, o espaço de parâmetros é dividido em um conjunto de pontos para cada parâmetro, formando-se uma malha de pontos. As DMLs devem ser satisfeitas em todos os pontos desta malha.

Segundo, as matrizes X(ρi)e Y (ρi) devem variar continuamente com o vetor de parâmetros. A questão é: como expressar estas matrizes em função de ρi? Uma maneira de se resolver este problema é definir funções bases para X(ρi) e Y (ρi) da seguinte forma

sendo e funções diferenciáveis em ρi. Uma regra prática para escolhermos essas funções e definí-las de maneira semelhante as funções que aparecem na matriz dinâmica do sistema a ser controlado.

A terceira consideração diz respeito às derivadas das variáveis X(ρi)e Y (ρi) que aparecem nas DMLs. Considera-se neste trabalho que a taxa de variação dos parâmetros é limitada ou, como descrito anteriormente, |ik(t)| < vik. Sendo as matrizes X(ρi) e Y (ρi) descritas como combinações das funções base, as suas derivadas nas DMLs podem ser reescritas como

O sinal ± significa que todas as combinações de sinais positivos e negativos devem ser consideradas para se obter o conjunto de DMLs. Veja (Apkarian and Adams, 1998; Wu et al., 1996) para mais informações sobre a síntese deste tipo de controlador. Observe que com o aumento do número de robôs, o custo computacional para resolver as DMLs aumenta exponencialmente. Entretanto, a implementação dos controladores pode ser realizada dentro de um intervalo de amostragem aceitável e de forma descentralizada.

5 MODELO MARKOVIANO DOS ROBOS MÓVEIS

Nesta seção será apresentada a formulação do controle de formação tolerante a falhas baseado nas metodologias de projeto para sistemas lineares sujeitos a saltos Markovianos. A falha considerada aqui corresponde à perda de um dos robôs da formação, em especial, podese considerar a perda do líder. Após a ocorrência da falha, a dinâmica do robô perdido não é considerada no projeto do controlador baseado em SLSM. Além disso, considera-se que o robô perdido não se tornará, após a falha, um obstáculo para os demais robôs da formação. As metodologias apresentadas neste trabalho podem ser aplicadas em ambientes com obstáculos. Neste caso, a trajetória desejada do líder é alterada para se evitar o obstáculo. Em formações com número elevado de robôs, uma estratégia é dividir a formação em duas formações independentes, cada uma com um líder, cujas trajetórias desejadas evitam os obstáculos.

Os modelos dinâmicos dos robôs móveis em formação são linearizados em torno de pontos definidos na faixa de operação dos robôs móveis, caracterizada a partir dos limites máximos e mínimos das variáveis de posição e velocidade. O modelo Markoviano para este sistema considera os pontos de operação utilizados e a configuração de formação (se há ou não perda de robôs). O estado Markoviano atual é definido pelo ponto de operação atual, pelo número de robôs na formação e pela informação de qual robô é o líder.

Cabe salientar que esta abordagem permite considerar outros aspectos que podem ser úteis para determinadas aplicações como a alternância de líder, falhas de comunicação e obstáculos estáticos e dinâmicos. Tais aspectos serão considerados em trabalhos futuros.

Para obter o sistema linear referente aos pontos de operação, o modelo dinâmico dos RMRs (12), com o acréscimo da perturbação no torque, é representado por

sendo bi = C2(2i)2i. A linearização de (18) em torno de um ponto de operação ψ com posição e velocidade, para cada RMR em formação, é dada por

sendo

i a entrada de controle calculada de acordo com o controlador Markoviano apresentado a seguir e i = δi. αi e βi são ponderações definidas pelo projetista para os erros de acompanhamento de trajetória e para a entrada de controle, respectivamente. O torque aplicado pelos atuadores do i-ésimo robô é definido por

Considera-se neste trabalho que o número de pontos de operação, Ψ, é o mesmo para cada uma das formações.

Considera-se também que as formações resultantes de falha possuem apenas um robô perdido. Ou seja, para uma formação inicial com N robôs, teremos N + 1 possibilidades de formação. Uma formação com todos os robôs e N formações com um robô perdido. Formações com mais robôs perdidos também podem ser consideradas.

A matriz dinâmica de uma formação inicial com N robôs, para um determinado ponto de operação, é dada por

A matriz dinâmica de uma formação com perda do i-ésimo robô é dada por

As demais matrizes do sistema, iEψ, iBψ,, , e , podem ser construidas de forma similar às matrizes iAψ, = 1, ··· , Ψ.

Considere as coleções de matrizes reais dadas por

sendo o conjunto Θ definido como Θ = {1, ··· , Ψ(N + 1)}. O número de elementos do conjunto Θ define o número de estados Markovianos do sistema.

O controle com realimentação da saída para SLSM apresentado neste artigo pode ser visto em (Siqueira et al., 2007) e em (de Farias et al., 2000). Considere uma cadeia de Markov homogênea de tempo contínuo, θ(t)= {θ Θ: t > 0}, com probabilidade de transição Pr definida como:

com i, j Θ, Δ > 0, e λij > 0 a taxa de transição do estado Markoviano i para o estado j (i j), sendo

A distribuição de probabilidade da cadeia de Markov no tempo inicial é dada por µ =(µ1, ..., µΨ(N+1)), sendo Pr(θ(0) = i)= µi. O sistema linear sujeito a salto Markoviano é dado por

com

O controlador dinâmico é dado por

sendo Acθ(t) AcΘ, Bcθ(t) BcΘ e Ccθ(t) CcΘ. O problema de controle via realimentação de saída para SLSM consiste em encontrar controladores (Acθ, Bcθ, Ccθ), com θ Θ, tais que, a norma do sistema em malha fechada seja menor que γ.

Para encontrar estes controladores, o conjunto de DMLs descrito em (19-21) deve ser resolvido. Uma vez obtida a solução para o conjutno de DMLs, os controladores são projetados por

sendo,

Embora o custo computacional para se encontrar soluções factiveis para os controladores seja elevado, a implementação destes controladores pode ser realizada dentro

sendo

de um intervalo de amostragem aceitável e de forma descentralizada. A grande dificuldade está no projeto, com o aumento do número de robôs o custo computacional para resolver as DMLs aumenta exponencialmente.

6 RESULTADOS

Nesta seção vamos apresentar resultados de simulação para o controle robusto de robôs em formação com alternância de líder baseado no controlador não linear apresentado na Seção 4 e para o controle de formação tolerante a falhas baseado no controle Markoviano apresentado na Seção 5. O diagrama de blocos das estratégias de controle propostas neste artigo é mostrado na Figura 4.


Inicialmente, consideram-se seis RMRs em formação. A Fig. 5 mostra seis possíveis dígrafos, um para cada possiblidade de alternância dos robôs na liderança da formação, ou seja, para cada robô na liderança tem-se uma LΓ. Observe que os círculos em vermelho correspondem ao robô líder da formação. Foi considerada a seguinte formação para os RMRs


Os robôs serão denominados conforme sua posição na formação, ou seja, o Líder 1 será o robô que está na posição h1 e assim por diante. A matriz de realimentação Fveh aplicada a todos os robôs da formação é dada por

Para o controlador baseado na cinemática, os ganhos foram definidos como Kx = 7, Ky = 52, Kα = 27. Os valores destes ganhos foram escolhidos heuristicamente buscando obter uma resposta rápida, porém suave, da trajetória. As trajetórias de referência, xri e yri, são dadas pela Eq. (3) com condições iniciais

Os seguintes parâmetros nominais são considerados para todos os robôs, eles correspondem aos parâmetros do robô móvel construído em nosso laboratório (Inoue et al., 2009): mω = 0; 075 (kg), mc = 0; 597 (kg), a = 0; 17 (m), b = 0; 065 (m), d = 0; 01 (m), r = 0; 028 (m), Ic = 0; 0023 (kg.m2), Iω = 0; 00038 (kg.m2) e Im = 3; 7 × 10-7 (kg.m2).

Para o controlador via representação quase-LPV, o espaço de variação dos parâmetros ρi, , definido como

com , é dividido em L = 3 pontos para cada parâmetro. Note que os parâmetros selecionados correspondem aos erros de velocidade das rodas direita e esquerda de cada robô. As funções base foram selecionadas de modo a apresentar um comportamento semelhante ao sistema a ser controlado f1(ρi)= g1(ρi) = 106 , g2 = 1011cos e g3(ρi) = 109sen, sendo X(θ)e Y (θ) definidas como segue

O melhor nível de atenuação encontrado foi γ = 2:61. Para testar a robustez dos controladores, distúrbios externos foram introduzidos nos torques das rodas da seguinte forma

A simulação do controlador com realimentação da saída foi realizada para os seis robôs móveis, que se alternaram na liderança da formação (sendo o robô 1 o líder inicial, o robô 6 o líder intermediário e o robô 4 o líder final) durante a trajetória, Fig. 6. A sequência de liderança é definida aleatoriamente segundo uma matriz de probabilidade uniforme para todos os robôs da formação, ou seja, qualquer robô pode assumir a liderança com a mesma probabilidade (no exemplo considerado, esta probabilidade é 1/6). Note que, para fins de simulação, foram realizadas duas alternâncias de líder dentro do intervalo de tempo considerado, em espaços regulares da trajetória, respectivamente, a um terço e dois terços desta. O projetista também pode definir uma função densidade de probabilidades que descreve os instantes de tempo em que há maior probabilidade de ocorrer a alternância de líder.


O erros de direção dos robôs durante a trajetória com alternância de líder são mostrados na Figura 7. Observe que os distúrbios foram rejeitados adequadamente. Nas figuras 8 e 9 são mostrados os distúrbios e torques, respectivamente, aplicados nas rodas atuadas.




Para o controle tolerante a falhas, foi considerada como falha a remoção do líder de uma formação composta por três robôs (N = 3). Assim, o sistema inicia o movimento coordenado com um conjunto de três robôs e durante o movimento o robô líder inicial é removido. Imediatamente um segundo robô assume a liderança até que o movimento seja finalizado. Neste experimento não está sendo considerada a alternância aleatória de líder. Considera-se também que um ponto de linearização em 1 rad/s caracterize ambos os cenários pré e pós falha para calcular as respectivas matrizes dinâmicas do sistema linear, ou seja, Ψ = 1. Portanto, temos 2 estados Markovianos, um para cada formação. Seguindo a notação apresentada na Seção 5, o conjunto de matrizes dinâmicas do modelo Markoviano é dado por AΘ =(0A1, 1A1, ), sendo que 0 a`esquerda de A significa que o movimento coordenado evolui inicialmente com todos os robôs e 1 significa que houve uma falha e o robô 1 foi excluído da formação. Para esse modelo Markoviano Θ = {1, 2}.

As taxas de transição entre os estados Markovianos são agrupadas em uma matriz de taxa de transição Λ de dimensão 2 x 2. A matriz Λ é particionada nas seguintes submatrizes

As submatrizes Λpi mostram as relações entre os pontos de operação, e a submatriz diagonal Λf determina a probabilidade de ocorrência de falha. Depois da falha ter ocorrido o sistema muda para a segunda linha de Λ, e Λ0 mostra que a formação inicial não pode ser recuperada. Para o problema em questão, a matriz de taxa de transição Λ foi selecionada como sendo

A Figura 10 mostra os resultados experimentais da trajetória efetuada pela formação utilizando o controlador Markoviano via realimentação de saída. Inicialmente o líder da formação era o robô representado pelo círculo em vermelho, e, em td = 0, 5 s este robô foi removido e a falha detectada. A partir deste instante, o robô 2 assumiu a liderança da formação (indicado na figura pelo círculo verde). Note que neste experimento não há uma alternância aleatória de líder, e sim, uma troca devido à falha do robô 1. Após a falha, o robô 1 não influencia a dinâmica dos demais robôs, pois ele não pertence à nova formação. As linhas tracejadas na Figura 10 denotam as trajetórias desejadas dos RMRs e a linha contínua a trajetória real. Também é mostrado na Figura (11) o erro de direção do robô 1 durante a trajetória. Das simulações obtidas, observa-se que após a ocorrência da falha o sistema mantém a estabilidade com os robôs em movimento coordenado durante a reconfiguração do controle.



7 CONCLUSÕES

Neste artigo foram propostas duas estratégias de controle para movimentos coordenados de robôs móveis com rodas, uma robusta e outra tolerante a falhas. Inicialmente, considerou-se uma formação com alternância de líder sujeita a distúrbios externos. O controle robusto não linear por realimentação da saída, em conjunto com os controles de formação e cinemático, garante a estabilidade da formação considerando as características dinâmicas dos robôs móveis. A segunda estratégia considera que a formação pode sofrer a perda de robôs, inclusive do líder. Neste caso, foi proposto um controle tolerante a falhas baseado na teoria de sistemas lineares sujeitos a saltos Markovianos. Novamente, o controlador por realimentação da saída para SLSM garante a estabilidade global do sistema mesmo com a perda de robôs da formação. Os aspectos principais das duas metodologias propostas foram considerados nos exemplos apresentados, robustez a distúrbios externos e tolerância a falhas. Entretanto, há uma infinidade de situações nas quais a metodologia proposta neste artigo precisa ser aperfeiçoada para funcionar com eficiência, por exemplo quando ocorrem falhas de comunicação ou quando aparecem obstáculos de maneira aleatória. Esses problemas serão tratados futuramente.

AGRADECIMENTOS

Este trabalho contou com o apoio FAPESP através do processo 06/02303-7.

Artigo submetido em 16/04/2009 (Id.: 00993)

Revisado em 22/06/2009, 23/09/2009, 29/10/2009

Aceito sob recomendação do Editor Associado Prof. Alexandre Bazanella

  • Apkarian, P. and Adams, R. (1998). Advanced gain-scheduling techniques for uncertain systems, IEEE Transactions on Control Systems Technology 6(1): 21-32.
  • Brualdi, R. and Ryser, H. (1991). Combinatorial Matrix Theory, Cambridge University Press, USA.
  • Chaimowicz, L., Kumar, V. and Campos, M. F. M. (2004). A paradigm for dynamic coordination of multiple robots, Autonomous Robots 17(1): 7-21.
  • Coelho, P. and Nunes., U. (2003). Lie algebra application to mobile robot control: A tutorial, Robotica 21: 483-493.
  • de Farias, D. P., Geromel, J. C., do Val, J. B. R. and Costa, O. L. V. (2000). Output feedback control of Markov jump linear systems in continuous-time, IEEE Transactions on Automatic Control 45(5): 944-949.
  • Desai, J., Ostrowski, J. and Kumar., V. (1998). Controlling formations of multiple robots, Proceedings of the IEEE International Conference on Robotics and Automation (ICRA98), Leuven, Belgium, pp. 2864-2869.
  • Fax, J. and Murray., R. (2004). Information flow and cooperative control of vehicle formations, IEEE Transactions on Automatic Control 49(9): 1465-1476.
  • Inoue, R. S., Siqueira, A. A. G. and Terra, M. H. (2009). Experimental results on the nonlinear H control via quasi-LPV representation and Game Theory for wheeled mobile robots, Robotica 27(4): 547-553.
  • Kanayama, Y., Kimura, Y., Miyazaki, F. and Noguchi., T. (1990). A stable tracking control method for an autonomous mobile robots, in Proc. IEEE International Conference on Robotics and Automation pp. 384-389.
  • Laferriere, G., Caughman, J. and Willians, A. (2004). Graph theoretic methods in the stability of vehicle formations, Proceeding of American Control Conference pp. 3724-3729.
  • Lafferriere, G., Williams, A., Caughman, J. and Veerman., J. J. P. (2005). Descentralized control of vehicle formations, Systems and Control Letters 54(9): 899-910.
  • Olfati-Saber, R. and Murray, R. M. (2002). Distributed sctrutural stabilization and tracking for formations of dynamic multiagents, Procedings of IEEE Conference on Decision and Control pp. 209-215.
  • Pereira, G. A. S., Kumar, V. and Campos, M. F. M. (2008). Closed loop motion planning of cooperating mobile robots using graph connectivity, Robotics and Autonomous Systems 56(4): 373-384.
  • Siqueira, A. A. G., Terra, M. H. and Buosi, C. (2007). Fault-tolerant robot manipulators based on output-feedback H controllers, Journal of Robotics and Autonomous Systems 55(10): 785-794.
  • Tanner, H., Pappas, G. and Kumar., V. (2004). Leader-to-formation stability, IEEE Transactions on Robotics and Automation 20(3): 443-455.
  • Veerman, J. J. P., Lafferriere, G., Caughman, J. S. and Williams, A. (2005). Flocks and formations, Journal of Statistical Physics 121(5-6): 901-936.
  • Williams, A., Lafferriere, G. and Veerman, J. (2005). Stable motions of vehicles formations, Proceedings of the IEEE Conference on Decision and Control and the European Control Conference pp. 12-15.
  • Wu, F., Yang, X. H., Packard, A. and Becker., G. (1996). Induced L2 norm control for LPV systems with bounded parameter variation rates, International Journal of Robust and Nonlinear Control 6(910): 983-998.

Datas de Publicação

  • Publicação nesta coleção
    09 Mar 2010
  • Data do Fascículo
    Fev 2010

Histórico

  • Aceito
    29 Out 2009
  • Revisado
    23 Set 2009
  • Recebido
    16 Abr 2009
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br