Acessibilidade / Reportar erro

Uma abordagem usando redes neurais artificiais para resolução de problemas de otimização restrita

Resumos

Sistemas baseados em redes neurais artificiais fornecem altas taxas de computação devido ao uso de um número massivo de elementos processadores simples. Redes neurais com conexões realimentadas fornecem um modelo computacional capaz de resolver uma rica classe de problemas de otimização. Este artigo apresenta uma nova abordagem para resolver problemas de otimização restrita utilizando redes neurais artificiais. Mais especificamente, uma rede de Hopfield modificada é desenvolvida cujos parâmetros internos são calculados usando a técnica de subespaço válido de soluções. A partir da obtenção destes parâmetros a rede tende a convergir aos pontos de equilíbrio que representam as possíveis soluções para o problema. Exemplos de simulação são apresentados para justificar a validade da abordagem proposta.

otimização restrita; redes neurais artificiais; redes de Hopfield


Systems based on artificial neural networks have high computational rates due to the use of a massive number of simple processing elements and the high degree of connectivity between these elements. Neural networks with feedback connections provide a computing model capable of solving a large class of optimization problems. This paper presents a novel approach for solving constrained optimization problems using artificial neural networks. More specifically, a modified Hopfield network is developed and its internal parameters are computed using the valid-subspace technique. These parameters guarantee the convergence of the network to the equilibrium points, which represent the feasible solutions to problem. Simulated examples are presented to demonstrate the validity of the proposed method.

constrained optimization; artificial neural networks; Hopfield networks


Uma abordagem usando redes neurais artificiais para resolução de problemas de otimização restrita

Ivan Nunes da SilvaI, * * Corresponding author / autor para quem as correspondências devem ser encaminhadas ; Wagner Caradori do AmaralII; Lúcia V. R. de ArrudaIII

IDEE / Faculdade de Engenharia (FE) Universidade Estadual Paulista (UNESP) Bauru — SP ivan@feb.unesp.br

IIDCA / Faculdade de Eng. Elétrica e Computação (FEEC) Universidade Estadual de Campinas (UNICAMP) Campinas — SP

IIIProgr. Pós-Grad. Eng. Elétrica e Inform. Industrial (CPGEI) Centro Federal de Educ. Tecnol. do Paraná (CEFET-PR) Curitiba — PR

RESUMO

Sistemas baseados em redes neurais artificiais fornecem altas taxas de computação devido ao uso de um número massivo de elementos processadores simples. Redes neurais com conexões realimentadas fornecem um modelo computacional capaz de resolver uma rica classe de problemas de otimização. Este artigo apresenta uma nova abordagem para resolver problemas de otimização restrita utilizando redes neurais artificiais. Mais especificamente, uma rede de Hopfield modificada é desenvolvida cujos parâmetros internos são calculados usando a técnica de subespaço válido de soluções. A partir da obtenção destes parâmetros a rede tende a convergir aos pontos de equilíbrio que representam as possíveis soluções para o problema. Exemplos de simulação são apresentados para justificar a validade da abordagem proposta.

Palavras-chave: otimização restrita; redes neurais artificiais; redes de Hopfield.

ABSTRACT

Systems based on artificial neural networks have high computational rates due to the use of a massive number of simple processing elements and the high degree of connectivity between these elements. Neural networks with feedback connections provide a computing model capable of solving a large class of optimization problems. This paper presents a novel approach for solving constrained optimization problems using artificial neural networks. More specifically, a modified Hopfield network is developed and its internal parameters are computed using the valid-subspace technique. These parameters guarantee the convergence of the network to the equilibrium points, which represent the feasible solutions to problem. Simulated examples are presented to demonstrate the validity of the proposed method.

Keywords: constrained optimization; artificial neural networks; Hopfield networks.

1. Introdução

Problemas de otimização não-linear restrita referem-se, geralmente, ao problema de minimizar ou maximizar uma função objetivo não-linear sujeita a um conjunto de restrições (lineares e/ou não-lineares) de igualdade e/ou desigualdade (Bazaraa & Shetty, 1979).

Embora existam na literatura diversos métodos de programação matemática que possam ser aplicados na resolução de problemas de otimização não-linear restrita, há a necessidade crescente de investigar métodos alternativos que exploram arquiteturas de processamento inerentemente paralelas e adaptativas. Assim sendo, as redes neurais artificiais torna-se uma abordagem promissora que pode ser aplicada eficientemente nestes tipos de problemas. Entre as principais vantagens em se utilizar a abordagem de redes neurais artificiais em otimização não-linear restrita destacam-se as seguintes: i) a capacidade intrínseca de operação em paralelo; ii) a simplicidade de implementação em hardware; e iii) o alcance de altas taxas de computação por intermédio de elementos simples de processamento.

Basicamente, as redes neurais utilizadas para resolver problemas de otimização não-linear restrita são desenvolvidas utilizando parâmetros de penalidade (Kennedy & Chua, 1988; Vazquez et al., 1990; Zhang et al., 1992). Os pontos de equilíbrio destas redes, correspondentes às soluções do problema, são obtidos através de uma escolha adequada dos parâmetros de penalidade que devem ser suficientemente grandes para garantir a convergência da rede (Kennedy & Chua, 1988). Entretanto, a escolha destes parâmetros é uma tarefa árdua, sendo normalmente realizada através de técnicas de tentativas e erros, as quais podem demandar um esforço computacional bastante excessivo. Além disso, a qualidade da solução final também depende do ajuste destes parâmetros. Algumas outras dificuldades relacionadas ao processo de convergência para os pontos de equilíbrio da rede, que representam as soluções do problema de otimização, são também evidenciadas. Uma análise minuciosa dos resultados apresentados nestes artigos demonstra que muitas vezes resultados infactíveis são apontados como soluções do problema.

Com a finalidade de contornar estes problemas de convergência, de aperfeiçoar a eficiência de simulações por computador, e de fornecer uma nova metodologia para mapeamento de problemas de otimização não-linear restrita, uma rede de Hopfield modificada foi desenvolvida. A referida rede foi implementada com o propósito de que seus pontos de equilíbrio correspondam à solução do problema de otimização não-linear restrita. As principais características desta rede são: i) inexistência de constantes de ponderação; ii) todas as restrições estruturais envolvidas ao problema de otimização não-linear restrita são agrupadas em um único termo de restrição; iii) não há interferência entre termo de otimização e termo de restrição; e iv) nenhum parâmetro de iniciação é requerido para a execução da simulação. Uma análise do comportamento dinâmico da rede será também realizada para ilustrar o processo de convergência da rede em direção às soluções ótimas (pontos de equilíbrio).

Portanto, o problema a ser estudado neste artigo consiste de aplicar uma rede de Hopfield modificada a fim de minimizar uma função de energia Eot, a qual representa a função objetivo do problema, estando sujeita a diversas restrições de igualdade e desigualdade. Essas restrições são todas agrupadas em um único termo de energia denominado Econf, o qual possui o objetivo de confinar todas as restrições envolvidas com o problema de otimização.

Para este propósito a organização deste artigo está como segue. Na Seção 2, a rede de Hopfield modificada é apresentada, e a técnica do subespaço-válido de soluções utilizada para projetar os parâmetros internos da rede é descrita. A Seção 3 contém uma análise do comportamento dinâmico da rede no contexto do subespaço-válido. Na Seção 4, o mapeamento de problemas de otimização não-linear restrita é formulado utilizando a rede de Hopfield modificada. Resultados de simulação são apresentados na Seção 5 para validar a abordagem proposta. Na Seção 6, as conclusões e os pontos chave deste artigo são apresentados.

2. A Rede de Hopfield Modificada

Além de fornecer um novo método para resolver problemas de otimização não-linear restrita, redes neurais artificiais oferecem um método que explora arquiteturas de processamento intrinsecamente paralelas e adaptativas. Neste artigo, uma rede de Hopfield modificada, cujos pontos de equilíbrio representam uma solução do problema de otimização não-linear restrita, é desenvolvida.

A rede de Hopfield é provavelmente o melhor exemplo conhecido de uma rede recorrente. Como definida em Hopfield (1984), esta rede apresenta geralmente uma única camada com conexões realimentadas entre os nós. Na maioria dos casos, os nós (neurônios) são completamente interconectados, ou seja, todos os neurônios da rede estão conectados aos outros e a si próprio. A equação nodal para a rede de Hopfield contínua no tempo é dada por:

onde:

ui(t) é o estado corrente do i-ésimo neurônio.

vi(t) é a saída do i-ésimo neurônio.

Tij é o peso conectando o i-ésimo neurônio ao j-ésimo neurônio.

é a entrada do i-ésimo neurônio (input bias).

h.ui(t) é um termo de decaimento passivo.

Na equação (2), g(ui(t)) é uma função de ativação, monótona crescente, que limita a saída de cada neurônio para um intervalo pré-definido. Em Hopfield (1984) mostra-se que os pontos de equilíbrio da rede correspondem aos valores de v(t) que minimizam a função de energia da rede. A função de energia associada à rede de Hopfield é definida por:

De fato, a função de energia dada em (3) é uma função de Lyapunov (Vidyasagar, 1992) e, neste caso, a estabilidade assintótica da rede pode ser demonstrada utilizando o segundo método de Lyapunov, isto é, mostrando que o sistema dissipa energia com o passar do tempo. Para tanto, basta mostrarmos que as derivadas parciais de (3) são não crescentes. Esta condição é alcançada quando a matriz T é simétrica. Uma demonstração envolvendo o processo de convergência da rede de Hopfield é apresentada no

Assim, o mapeamento de problemas de otimização utilizando uma rede de Hopfield consiste em determinar, em cada tipo de problema, a matriz de pesos T e o vetor de entradas ib associados à função de energia da rede (3).

A dificuldade em mapear problemas de otimização distintos através de uma rede de Hopfield convencional está em satisfazer as várias restrições que são impostas por cada tipo de problema. Uma técnica simples de mapeamento codifica as restrições como termos na função de energia que são minimizados quando as restrições são satisfeitas, ou seja:

onde ci são constantes positivas que ponderam cada uma das restrições. Assim, a rede atua com o propósito de minimizar simultaneamente uma função de energia (Eot) correspondente à função objetivo associada ao problema, e as funções () que representam as k-ésimas restrições envolvidas no problema. Portanto, se qualquer uma destas restrições for violada, a solução é considerada 'inválida' (Silva, 1997).

No processo de otimização com uma rede de Hopfield convencional, a multiplicidade de termos de restrições em (4) pode cancelar uma ou várias restrições simultaneamente. Como resultado, as soluções obtidas no final do processo de otimização podem ser infactíveis; e o desempenho da rede é sensível aos valores dos parâmetros ci , que são geralmente especificados através de procedimentos não formais (Silva et al., 1997).

Para contornar estes problemas, realizou-se em Aiyer et al. (1990) uma análise da convergência da rede que permite verificar como Eot e os termos de restrições em (4) podem ser separados dentro de subespaços diferentes para evitar a infactibilidade do problema. Este subespaço que agrupa todas as restrições impostas pelo problema é denominado subespaço-válido de soluções, com equação definida por:

onde Tconf é uma matriz projeção (Tconf.Tconf = Tconf) que projeta o vetor v para o subespaço-válido, e Tconf.iconf = 0 (iconf é um vetor ortogonal ao subespaço-válido). Um estudo detalhado dos aspectos teóricos relacionados ao subespaço-válido é apresentado em Silva et al. (1997).

Assim, utilizando o subespaço-válido com o objetivo de agrupar todas as restrições envolvidas a um determinado problema, a função de energia dada em (4) passa a ser definida por:

onde Econf confina todas as restrições , pertencentes a equação (4), para o subespaço-válido. A função de energia Eot e Econf dadas na equação (6) são definidas por:

A necessidade de assegurar que Eot seja otimizado quando todas as restrições contidas em Econf estejam são satisfeitas, implica em atribuir um valor elevado para a constante c0 em (6). Esta condição torna a simulação da rede ineficiente, desde que a maioria do esforço computacional é para forçar o confinamento das restrições.

Portanto, com o objetivo de evitar esses problemas de convergência, uma rede de Hopfield modificada que utiliza a técnica de subespaço-válido de soluções é então proposta. A arquitetura desenvolvida (Figura 1) diretamente garante a validade das restrições agrupadas por Econf, dispensando assim a utilização da constante de ponderação c0. Assim, a principal contribuição da arquitetura proposta, em constaste com a maioria das abordagens neurais propostas na literatura, está na inexistência de parâmetros de ponderação e/ou penalidade, implicando então na não necessidade de especificação dos mesmos. Uma análise da convergência da rede de Hopfield modificada proposta neste trabalho é realizada da Seção 3.


A dinâmica da rede de Hopfield modificada, ilustrada na Figura 1, é explicitada através de três passos principais:

(I) Minimização de Econf: corresponde à projeção de v sobre o subespaço-válido que confina todas as restrições impostas pelo problema:

Esta operação realiza uma minimização indireta de Econf.

(II) Aplicação de uma função de ativação do tipo 'rampa simétrica', restringindo v dentro de um hipercubo pré-definido:

onde . Esta função de ativação é similar àquela utilizada em (1).

(III) Minimização de Eot: alteração de v em direção a uma solução de custo ótimo (definida por Tot e iot), correspondente aos pontos de equilíbrio da rede, que são as soluções para o problema de otimização considerado. Utilizando a função de ativação 'rampa-simétrica' e dado que h =0, pois as alterações nos neurônios são realizadas de forma síncrona, ou seja, todos os neurônios serão alterados simultaneamente, então a equação (1) torna-se:

Assim, a minimização de Eot consiste na alteração de v na direção oposta ao gradiente da função Eot em relação a v. Estes resultados são também válidos quando uma função de ativação do tipo tangente hiperbólica é utilizada.

Deve-se ressaltar que a aplicação dos passos (I) a (III) são realizados de forma discreta. Neste caso, após as considerações realizadas no passo (III), a resolução da equação diferencial representada em (10) será similar ao método de Euler.

3. Análise da Dinâmica da Rede

Nesta seção, realiza-se uma análise linearizada da convergência da rede de Hopfield modificada cuja dinâmica de operação é implementada através dos passos (I)-(III) apresentados anteriormente. Em particular, considera-se que a região de operação na qual o vetor v está contido é limitada pelo hipercubo definido pela função de ativação 'rampa-simétrica' (9). A equação nodal descrevendo o comportamento dinâmico desta rede é obtida a partir de (1) para h = 0 e v(t) = u(t), ou seja:

A análise dinâmica da rede é portanto inicializada com a obtenção de uma equação para , componente de que pertence ao subespaço-válido.

Como na rede de Hopfield modificada a saída v é constantemente confinada ao subespaço-válido pela aplicação do passo (I) descrito na Seção 2, isto é {v ¬ Tconf.v + iconf}, então a aplicação deste processo iterativo implica que qualquer componente de ortogonal a é continuamente suprimida. Logo, a componente (não ) caracteriza melhor a dinâmica global da rede. Assim, tem-se:

A partir da equação (11), verifica-se que a componente é constituída de duas partes, um termo constante {Tconf(Tot.iconf + iot)}; e um termo dependente de v, {TconfTotT conf.v}. Estas expressões podem ser simplificadas por:

Substituindo (12) e (13) em (11), obtém-se:

Com v confinado ao subespaço-válido (isto é: v = Tconf.v + iconf e Tconf.iconf = 0), Eot pode ser expressado como:

Na equação (15) observa-se que a dinâmica de = = A.v + b simplesmente resulta num processo de otimização de Eot em relação ao subespaço-válido. Logo, o objetivo consiste em obter uma solução válida que minimiza Eot.

Corolário: A solução geral de um sistema linear invariante no tempo (autônomo) do tipo descrito por é dada por:

onde é um vetor de elementos aleatórios correspondendo ao valor de no instante de tempo t = 0. Deve-se observar que quando estamos começando a execução da rede, o Passo (I) é realizado em primeira instância seguido do passo (II). Neste caso, deve-se atribuir valores aleatórios para o vetor v, representado aqui inicialmente por , a fim de iniciar o processo de confinamento do mesmo para o subespaço-válido. Somente após a convergência ao subespaço-válido é que o passo (III) será aplicado pela primeira vez. Assim, daqui por diante, o valor atribuído será igual ao valor de v obtido no passo (III).

Definição: A exponencial de uma matriz quadrada A é definida pela série de potências dada por:

Então, rescrevendo a equação (16) como séries de potências, tem-se:

Para analisar o comportamento de durante o processo de convergência da rede, considera-se os vetores , e b escritos em termos de suas componentes que serão expressas no espaço coordenado gerado a partir dos autovetores normalizados de A. Assim, considera-se que A tem autovalores l 1, l 2, ..., l n, cujos autovetores normalizados são u1, u2,..., un. Para distinguir os autovalores nulos e não-nulos de A, define-se o conjunto Z tal que l i = 0 para i Î Z e l i ¹ 0 para i Ï Z. Decompondo-se , e b ao longo dos autovetores de A, tem-se:

onde vi, oi e bi referem-se respectivamente aos valores da i-ésima componente de , e b, representado no espaço coordenado gerado a partir dos autovetores de A. Portanto, a partir de (18), obtém-se:

Substituindo a equação (19) em (17) resulta-se em:

A equação (20) é completamente geral para quaisquer valores arbitrários de A, b e . Entretanto, esta equação pode ser simplificada se A e b forem definidas como nas equações (12) e (13). Neste caso, os autovetores de A com autovalores zero serão confinados ao transpor o subespaço ortogonal ao subespaço-válido, enquanto b sempre permanece no subespaço-válido {bi = 0 para i Î Z}. Assim, a equação (20) torna-se:

Agora torna-se também importante examinar a equação (21) para valores pequeno e grande de t. Para t suficientemente pequeno, tem-se a seguinte aproximação:

Substituindo esta aproximação em (21), tem-se:

Observa-se que para um aleatoriamente pequeno, os termos oi são freqüentemente pequenos em comparação com os bi . Logo, a equação (23) transforma-se em:

Analisando a equação (24), nota-se que vconf inicialmente parte na direção do vetor b. No limite, quando t é muito grande, a equação (21) indica que vconf tenderá em direção aos autovetores de A correspondente ao maior autovalor positivo. Neste caso, a partir dos resultados advindos de Aiyer et al. (1990) e Vidyasagar (1992), os pontos de equilíbrio da rede podem ser iterativamente computados visto que o estado da rede partindo de uma posição inicial arbitrária sempre convergirá para um ponto de equilíbrio estável. Este ponto de equilíbrio é sempre limitado pela função de ativação 'rampa-simétrica' definida em (9).

Embora o processo de convergência em direção aos pontos de equilíbrio seja assegurado, deve-se observar que isto não implica na obtenção de um ponto de mínimo global em relação à função de energia Em(t) associada à rede de Hopfield modificada.

4. Formulação do Problema de Otimização Não-Linear Restrita

Considera-se o seguinte problema de otimização não-linear restrita contendo p-restrições de desigualdade, com variáveis limitadas, ou seja:

onde v, zmin, zmaxÎ Â N; f(v) e hi(v) são funções contínuas e diferenciáveis. As condições (26) e (27) definem um conjunto fechado em  N no qual o vetor v deve permanecer para representar uma solução válida para o problema de otimização (25). Uma solução para o problema pode ser obtida por uma rede de Hopfield modificada cujo subespaço-válido garante a satisfação das condições definidas em (26). Além disso, o hipercubo inicial representado pelas restrições de desigualdade (variáveis canalizadas) em (27) é definido pela função de ativação 'rampa-simétrica'.

Os parâmetros Tconf e iconf, pertencentes ao subespaço-válido, são calculados transformando-se as restrições de desigualdade em (26) num conjunto de restrições de igualdade através da utilização de uma variável auxiliar para cada restrição de desigualdade:

onde wj > 0 são as variáveis auxiliares que podem ser tratadas como variáveis vi , e dij é definida pela função impulso de Kronecker dada por:

Após esta transformação, o problema definido pelas equações (25), (26) e (27) podem ser rescritas como:

onde é um vetor de variáveis estendidas. Deve-se notar que Eot não dependerá das variáveis auxiliares w.

A matriz projeção Tconf da equação do subespaço-válido é obtida através da projeção de v+, obtido a partir da minimização de Eot(v+) = f(v+), para o subespaço tangente à superfície delimitada pelas restrições dadas por (31). Assim, uma equação para Tconf pode ser definida por (Luenberger, 1984):

onde:

Substituindo-se a matriz Tconf dada por (34) na equação do subespaço-válido (5), obtém-se:

Por fim, resultados da teoria de estabilidade de Lyapunov (Vidyasagar, 1992) devem ser introduzidas na equação (36) para garantir a estabilidade do sistema não-linear, e conseqüentemente, forçar a convergência da rede para os pontos de equilíbrio que representam uma solução para o sistema. Pela definição de Jacobiano, quando v tende ao ponto de equilíbrio implica que ve = 0. Neste caso, o valor de iconf deve ser também nulo, pois caso contrário a igualdade não é satisfeita para a condição de equilíbrio, ou seja, ve = v( t) = v(t + Dt) = 0. Assim, a equação (31) pode ser aproximada por:

Na vizinhança do ponto de equilíbrio ve = 0, obtém-se a seguinte equação:

Introduzindo-se os resultados das equações (37) e (38) na equação (36), obtém-se:

Portanto, a equação (39) sintetiza a equação do subespaço-válido para sistemas de equações não-lineares. Neste caso, a equação original do subespaço-válido em (5), o qual está representado pelo passo (I) na Figura 1, deve ser substituída pela equação (39). A aplicação sucessiva do passo (I) seguido do passo (II), ilustrado na Figura 1, faz com que v seja uma solução que satisfaça todas as restrições impostas pelo problema de otimização não-linear.

Os parâmetros Tot e iot do termo de energia Eot, dado por (7) e representado em (30), são definidos com o objetivo de que a solução ótima corresponda à minimização de Eot. Este procedimento pode ser feito alterando-se o vetor v+ na direção oposta ao gradiente da função de energia Eot. Assim, os pontos de equilíbrio da rede podem ser calculados assumindo-se os seguintes valores para Tot e iot:

Vale aqui ressaltar que a obtenção das expressões de Tconf e iconf, as quais caracterizam o subespaço válido de soluções, é realizada a partir do conhecimento a priori sobre o inter-relacionamento envolvendo as variáveis do problema. O processo envolvido com a especificação de Tconf e iconf deve levar em consideração as propriedades do subespaço válido, ou seja, Tconf.Tconf = Tconf e Tconf.iconf = 0.

Conforme mencionado anteriormente, visto que v+T = [vT wT] então o vetor iot dado em (40) seria representado por:

Como o processo de otimização de Eot não depende dos valores das variáveis auxiliares w, então a equação dada em (42) pode ser substituída pela seguinte expressão:

A fim de sintetizar todos os passos envolvidos com o mapeamento de problemas de otimização restrita através da rede de Hopfield modificada, ilustra-se na Figura 2 os passos algorítmicos básicos envolvidos com a abordagem proposta.


Para ilustrar o desempenho da rede neural proposta, alguns resultados de simulação são apresentados na próxima seção.

5. Resultados de Simulação

A rede de Hopfield proposta nas seções anteriores foi utilizada para resolver três problemas de otimização não-linear restrita propostos na literatura.

O primeiro problema, conforme proposto em Bazaraa & Shetty (1979), a função objetivo está sujeita somente às restrições de desigualdade, ou seja:

Para este problema, com três restrições de desigualdade e com variáveis limitadas, o vetor solução (ponto de equilíbrio) obtido após a convergência da rede de Hopfield modificada é dado por v = [0,00001 1,50002 0,00000]T, com função objetivo f(v) = —3,49999. Estes resultados são bem próximos ao valor da solução ótima fornecida por v* = [0.00000 1,50000 0.00000]T e f(v*) = —3,50000.

A Figura 3 ilustra a evolução dos valores de v1 , v2 e v3 obtidos pela rede de Hopfield modificada em relação ao número de iterações. O esboço do comportamento da função objetivo do problema é apresentado na Figura 4. As restrições dadas em (C4), (C5) e (C6) são diretamente tratadas pela função de ativação da rede que é definida em (9).



O segundo problema tratado pela rede de Hopfield modificada é constituído por restrições de igualdade e desigualdade, sendo o mesmo definido pelas seguintes expressões:

Em relação a este problema, a Figura 5 mostra a evolução dos valores de v1 , v2 e v3 em função do número de iterações. O vetor solução obtido, após a convergência da rede, é dado por v = [0,00000 4,00000 0,00001]T, sendo o valor da função objetivo f(v) = Eot(v) = 0.00034. A solução ótima para o problema é fornecida por v* = [0,00000 4.00000 0.00000]T, com Eot(v*) = 0,00000.


A Figura 6 ilustra o comportamento da função objetivo do problema em função do número de iterações. Os valores iniciais atribuídos ao vetor v foram gerados aleatoriamente entre zero e um.


O terceiro problema, conforme proposto em Kennedy & Chua (1988), visa confirmar a aplicabilidade da rede proposta quando todas as restrições associadas ao mesmo são do tipo linear, ou seja:

A Figura 7 apresenta a evolução dos valores dos elementos do vetor de saída da rede em relação ao número de iterações. Após a convergência da rede, o vetor solução obtido é dado por v = [0,3398 0,3301]T, com Eot(v) = 0,2456. Estes resultados são bem próximos aos valores da solução exata fornecida por v* = [0,3395 0,3302]T, com função objetivo Eot(v*) = 0,2455.


A Figura 8 apresenta o comportamento da função objetivo do problema em função do número de iterações. Neste caso, a rede foi iniciada com valores aleatórios, uniformemente distribuídos, entre zero e um.


Estes resultados mostram a aplicação efetiva da rede de Hopfield modificada para resolver problemas de otimização não-linear. A rede foi também simulada considerando diversos valores iniciais atribuídos ao vetor de saída v. Para todas as simulações, a rede sempre convergiu para as mesmas soluções.

Embora o número de iterações seja elevado o tempo gasto para a obtenção das soluções tem sido bastante curto. Em relação a este aspecto vale ressaltar que embora tenhamos utilizado computadores seqüenciais em nossas simulações, o desempenho da rede alcançará eficiência máxima quando a mesma for executada em computadores com processadores operando em paralelo, pois neste caso cada unidade de processamento corresponderia a uma unidade neural.

Outro aspecto relevante diz respeito à qualidade das soluções obtidas pela rede. Embora os valores das soluções apresentem alguns desvios em relação aos valores ótimos, observa-se que os mesmos são menores quando comparados com outras abordagens neurais utilizadas nesses tipos de problemas.

É também motivo de registro que alguns testes realizados com problemas de dimensões maiores, tendo cerca de 800 restrições de desigualdade, mostraram que a rede pode tornar-se lenta em sua procura pelos pontos de equilíbrio que representam a solução do sistema. Este comportamento deve-se ao fato de estarmos realizando toda a simulação em computadores seqüenciais. A utilização de máquinas com processadores em paralelo, conforme mencionado anteriormente, pode contornar esta situação.

Finalmente, o mapeamento de problemas de otimização não-linear restrita através da rede de Hopfield modificada apresenta algumas particularidades em relação aos métodos primais (Bazaraa & Shetty, 1979) que são também utilizados na solução destes problemas, podendo se destacar as seguintes: i) a não necessidade do cálculo do conjunto ativo de restrições em cada iteração; ii) o vetor de inicialização da rede (solução inicial) não precisa pertencer ao conjunto factível definido pelas restrições; iii) não necessidade de obtenção, em cada iteração, de uma direção admissível de busca; e iv) mecanismo de busca independe da utilização de multiplicadores de Lagrange.

6. Conclusões

Neste artigo, uma rede de Hopfield modificada foi desenvolvida para resolver problemas de otimização não-linear restrita. Os resultados de simulação mostraram que a rede proposta fornece resultados expressivos, tornando assim um método alternativo para resolver estes problemas eficientemente. Os parâmetros internos da rede foram obtidos utilizando conceitos relativos às teorias de otimização não-linear e de estabilidade de Lyapunov. Todas as restrições associadas ao problema são mapeadas através do subespaço-válido de soluções.

O mapeamento de problemas de otimização não-linear restrita através da rede de Hopfield modificada além de fornecer um novo método para resolver estes problemas, não requer a definição (ajuste) de nenhum parâmetro de penalidade ou ponderação.

A estabilidade assintótica da rede Hopfield pode ser mostrada utilizando o segundo método de Lyapunov (Vidyasagar, 1992), isto é, mostrando que o sistema dissipa energia com o passar do tempo. Para isso, dada uma função de Lyapunov (ou função de energia) associada à rede, mostra-se que suas derivadas temporais são não crescentes. Uma função de Lyapunov para a rede de Hopfield é definida por:

cujas derivadas temporais são dadas por:

onde Ñv é o operador gradiente com relação a v. Para a condição de T simétrica, tem-se:

Comparando a equação (1) com (47), conclui-se que:

Inserindo o resultado de (48) em (46), obtém-se:

Como é sempre positivo, precisa-se verificar apenas que para se mostrar que . Isto é trivialmente verdadeiro desde que a função de ativação da rede dada em (2) seja monótona crescente. A partir da equação (48), nota-se também que apenas quando . Isto completa a prova de estabilidade assintótica para a rede de Hopfield.

Recebido em 08/2003; aceito em 06/2004 após 1 revisão

Received August 2003; accepted June 2004 after one revision

  • (1) Aiyer, S.V.B.; Niranja, M. & Fallside, F. (1990). A theoretical investigation into the performance of the Hopfield model. IEEE Transactions on Neural Networks, 1, 53-60.
  • (2) Bazaraa, M.S. & Shetty, C.M. (1979). Nonlinear Programming. John Wiley & Sons, New York.
  • (3) Hopfield, J.J. (1984). Neurons with a graded response have collective computational properties like those of two-state neurons. Proc. of the National Academy of Science, 81, 3088-3092.
  • (4) Kennedy, M.P & Chua, L.O. (1988). Neural networks for nonlinear programming. IEEE Transactions on Circuits and Systems, 35, 554-562.
  • (5) Luenberger, D.G. (1984). Linear and Nonlinear Programming Addison-Wesley, Reading, Massachusetts.
  • (6) Silva, I.N. (1997). Uma Abordagem Neuro-nebulosa Para Otimização de Sistemas e Identificação Robusta. Tese de Doutorado, UNICAMP/FEEC/DCA.
  • (7) Silva, I.N.; Arruda, L.V.R. & Amaral, W.C. (1997). Robust estimation of parametric membership regions using artificial neural networks. International Journal of Systems Sciences, 28, 447-455.
  • (8) Vázquez, A.R.; Castro, R.D.; Rueda, A.; Huertas, J.L. & Sinencio, S. (1990). Nonlinear switched-capacitor neural network for optimization problems. IEEE Transactions on Circuits and Systems, 37, 384-398.
  • (9) Vidyasagar, M. (1992). Nonlinear Systems Analysis Prentice-Hall, Englewood Cliffs, New Jersey.
  • (10) Zhang, S.; Zhu, X. & Zou, L.H. (1992). Second-order neural nets for constrained optimization. IEEE Transactions on Neural Networks, 6, 1021-1024.

Apêndice

  • ApêndiceApêndice.
  • *
    Corresponding author / autor para quem as correspondências devem ser encaminhadas
  • Datas de Publicação

    • Publicação nesta coleção
      20 Set 2004
    • Data do Fascículo
      Ago 2004

    Histórico

    • Recebido
      Ago 2003
    • Aceito
      Jun 2004
    Sociedade Brasileira de Pesquisa Operacional Rua Mayrink Veiga, 32 - sala 601 - Centro, 20090-050 Rio de Janeiro RJ - Brasil, Tel.: +55 21 2263-0499, Fax: +55 21 2263-0501 - Rio de Janeiro - RJ - Brazil
    E-mail: sobrapo@sobrapo.org.br