Acessibilidade / Reportar erro

Redes dinâmicas cognitivas aplicadas no controle supervisório de um fermentador

Dynamic Cognitive Netowrks applied to supevisory control of a fermentation process

Resumos

Este trabalho usa redes cognitivas dinâmicas (Dynamic Cognitive Networks - (DCN), como uma ferramenta inteligente para controle supervisório. As DCNs são uma evolução dos mapas cognitivos fuzzy (Fuzzy Cognitve Map - FCM). Os sistemas inteligentes se baseiam no conhecimento de especialistas a fim de construir modelos com capacidade de inferência e/ou tomada de decisão. Uma arquitetura de controle supervisório para um processo de fermentação alcoólica é desenvolvida a partir da aquisição de conhecimento empírico de um especialista. O objetivo do supervisor é operar o processo em situações normal e crítica. Para isto, propõe-se o uso de uma DCN que incorpora novos tipos de conceitos e relações que não apenas as relações de causa-efeito presentes nos modelos baseados em FCMs. Resultados de simulação são apresentados para validar a arquitetura desenvolvida.

Redes cognitivas dinâmicas; mapas cognitivos fuzzy; grafo; controle inteligente; supervisão


This paper uses dynamic cognitive networks (DCN) as an intelligent tool for supervisory control. The DCNs are an evolution of fuzzy cognitive maps (FCM). Intelligent systems and tools use expert knowledge to build models with inference and / or decision taking abilities. A supervisory control architecture for an alcoholic fermentation process is developed from the acquisition of empirical knowledge from an expert. The objective of the supervisor is to operate the process in normal and critical situations. For this, we propose the use of a DCN model with new types of concepts and relationships that not only represent cause-effect as in FCM models. Simulation results are presented to validate the architecture developed.

Dynamic cognitive networks; fuzzy cognitive maps; graph; intelligent control; supervision


SISTEMAS INTELIGENTES

Redes dinâmicas cognitivas aplicadas no controle supervisório de um fermentador

Dynamic Cognitive Netowrks applied to supevisory control of a fermentation process

Márcio MendonçaI; L. V. R. ArrudaII; Flávio Neves-Jr.II

IUniversidade Tecnológica Federal do Paraná, Campus Cornélio Procópio Av. Alberto Carazzai, 1640, CEP 86300-000, Cornélio Procópio, Paraná, Brasil. mendonca@utfpr.edu.br

IICampus Curitiba Av. Sete de Setembro, 3165, CEP 80230-901, Curitiba, Paraná, Brasil. lvrarruda@utfpr.edu.br, neves@utfpr.edu.br

RESUMO

Este trabalho usa redes cognitivas dinâmicas (Dynamic Cognitive Networks – (DCN), como uma ferramenta inteligente para controle supervisório. As DCNs são uma evolução dos mapas cognitivos fuzzy (Fuzzy Cognitve Map – FCM). Os sistemas inteligentes se baseiam no conhecimento de especialistas a fim de construir modelos com capacidade de inferência e/ou tomada de decisão. Uma arquitetura de controle supervisório para um processo de fermentação alcoólica é desenvolvida a partir da aquisição de conhecimento empírico de um especialista. O objetivo do supervisor é operar o processo em situações normal e crítica. Para isto, propõe-se o uso de uma DCN que incorpora novos tipos de conceitos e relações que não apenas as relações de causa-efeito presentes nos modelos baseados em FCMs. Resultados de simulação são apresentados para validar a arquitetura desenvolvida.

Palavras-chave: Redes cognitivas dinâmicas, mapas cognitivos fuzzy, grafo, controle inteligente, supervisão.

ABSTRACT

This paper uses dynamic cognitive networks (DCN) as an intelligent tool for supervisory control. The DCNs are an evolution of fuzzy cognitive maps (FCM). Intelligent systems and tools use expert knowledge to build models with inference and / or decision taking abilities. A supervisory control architecture for an alcoholic fermentation process is developed from the acquisition of empirical knowledge from an expert. The objective of the supervisor is to operate the process in normal and critical situations. For this, we propose the use of a DCN model with new types of concepts and relationships that not only represent cause-effect as in FCM models. Simulation results are presented to validate the architecture developed.

Keywords: Dynamic cognitive networks, fuzzy cognitive maps, graph, intelligent control, supervision.

1 INTRODUÇÃO

Seres humanos são capazes de lidar com processos complexos, baseados em informações imprecisas e/ou aproximadas. A estratégia adotada por eles é também de natureza imprecisa e geralmente passível de ser expressa em termos linguísticos. Deste modo, através de conceitos da lógica fuzzy, é possível modelar esse tipo de informação (Zadeh, 1992). Entretanto, informações também podem ser adquiridas a partir dos dados de operação e/ou, funcionamento de um sistema através de técnicas de identificação e modelagem (Passino e Yourkovich, 1998). Entre estas técnicas as redes neurais se destacam pela capacidade de processar dados massivos de uma maneira paralela (Haykin, 2000). Por outro lado, os mapas cognitivos difusos, do inglês Fuzzy Cognitive Maps (FCM), é uma ferramenta para a modelagem do conhecimento humano, principalmente relações de causa-efeito, obtido através de termos linguísticos, inerentes aos sistemas fuzzy, mas com uma estrutura semelhante a das Redes Neurais Artificiais (RNA). Esta estrutura confere ao mapa a capacidade de treinamento e adaptação baseada em dados do sistema (Kosko, 1986). Neste contexto, um FCM pode ser considerado um modelo híbrido (fusão de duas áreas de conhecimento) de sistema inteligente com um forte grau de iteração, no qual não se pode identificar e separar as estruturas das áreas de origens, somente a semântica de construção. Além das vantagens e características herdadas das técnicas primárias, FCM tem sido usado como uma ferramenta para construção de modelos e/ou mapas mentais em diversas áreas de conhecimento (Taber, 1991), (Miao e Liu, 1999), (Stach, et al., 2005), (Chun-Mei, 2008). Este fato sugere que a técnica é versátil na abstração de informações, facilitando a modelagem do conhecimento devido à sua semelhança de construção com o raciocínio humano. Entretanto, esses modelos cognitivos têm dificuldades para modelar não linearidades e principalmente comportamentos variantes no tempo (Miao et al., 2001)-(Kolouriotis et al., 2005).

Para contornar esses problemas e conferir adaptabilidade aos modelos baseados em FCMs, alguns autores propuseram diversas variantes dos FCMs aptas a modelar sistemas dinâmicos, entre elas destacam-se as Redes Cognitivas Dinâmicas (Miao et al., 2001) - (Kolouriotis et al., 2005). De acordo com a literatura, os FCMs estendem os mapas cognitivos (Axelrold, 1976), descrevendo a força das relações causais (Kosko, 1986) e as DCNs estendem os FCMs por incluir os aspectos dinâmicos, ao considerar que ao longo do tempo uma mesma relação de causa-efeito pode apresentar diferentes graus de intensidade (Miao et al., 2001).

Sendo técnicas neuro-fuzzy, os FCMs, e em especial as DCNs, são capazes de modelar sistemas complexos com boa precisão. De fato os mapas cognitivos em geral são grafos ponderados e direcionados (dígrafo) com realimentação, formados por nós e arcos. Os nós do grafo são utilizados para modelar conceitos descrevendo o comportamento do sistema. Estes conceitos são conectados entre si por arcos ponderados que representam as relações de causalidade existentes entre eles. Os mapas cognitivos fuzzy, por sua vez, são uma classe de mapa cognitivo em que os valores dos conceitos e relações causais são números fuzzy (Kosko, 1986). Como um grafo ponderado e direcionado, um FCM pode também ser considerado um autômato (ou máquina de estado finito), gerado a partir de conhecimento especialista e calibrado com dados do sistema (Miao e Liu, 1999). Nesse sentido, Miao e Liu (1999) também demonstram a convergência das trajetórias de inferência de um FCM e propõem teoremas que mostram que para um grande FCM, estas trajetórias podem ser decompostas, gerando uma hierarquia de FCM menores que são mais facilmente construídos. Com isto eles demonstram que os FCM são uma ferramenta eficiente para a análise e modelagem de sistemas de grande escala existentes no mundo real.

As DCNs por sua vez, são mapas cognitivos, fuzzy ou não, que consideram os seguintes aspectos de uma relação causal:

  • A força da relação de causalidade;

  • A força da causa;

  • O grau de efeito.

Deste modo as relações de causalidade em DCNs diferem não apenas na duração do efeito provocado por uma determinada causa, mas também sobre como a causa gera o efeito. As DCNs têm a capacidade de modelar e gerenciar comportamentos não-lineares dependentes do tempo, muitas vezes em tempo real, porém não existe uma solução fechada e ainda há um amplo espaço para modificações e atualizações dessa técnica (Koulouriotis, et al., 2005),(Miao et al., 2010). Neste contexto, se insere o presente trabalho ao propor uma nova arquitetura de DCN aplicada a controle de processos.

Para processos complexos como os existentes nas indústrias químicas e petroquímicas, a operação e supervisão das malhas de controle tem se tornado cada vez mais crítica. Um dos motivos disso é que os processos não são bem compreendidos e a sua operação é realizada com base na experiência antes que em leis de controle rígidas. Algumas abordagens existentes na literatura para a supervisão de tais processos são baseadas em técnicas de aquisição de dados e, especificamente em métodos de agrupamento para tratar com a dificuldade na modelagem dos processos. Com isso, o comportamento do sistema é modelado com uma máquina de estado finito (Kempowsky et al, 2006) que evolui ao longo de uma trajetória de estados alcançáveis. Este tipo de técnica considera o comportamento de um sistema dinâmico como uma sequência de estados em que o estado atual contém todas as informações do comportamento do sistema. Neste contexto, Kempowsky e seus colaboradores (2006) discutem aspectos teóricos e práticos da construção de um sistema supervisório para controle de processos modelados como máquina de estado finito.

A partir dos resultados apresentados por esses autores (Miao e Liu, 1999), (Miao et al., 2001), (Kempowsky et al, 2006), o presente artigo propõe o desenvolvimento de um sistema supervisório em que a máquina de estado finito é substituída por uma DCN construída a partir do conhecimento especialista de como controlar um processo. A fim de modelar todas as relações existentes em um sistema dinâmico não linear, são utilizadas na construção da DCN além das relações de causa-efeito comuns aos mapas cognitivos, relações do tipo fuzzy e do tipo seleção. A inclusão destas relações na DCN agrega versatilidade à técnica e é uma contribuição deste trabalho para á área de representação de conhecimento e modelagem de sistemas utilizando DCNs.

O artigo é organizado como segue: a sessão 2 faz uma introdução à teoria de modelagem baseada em mapas cognitivos e apresenta uma breve revisão da literatura associada à utilização de FCM e DCN em controle de processos. A sessão 3 descreve o processo de fermentação que foi utilizado para testar a proposta do artigo e constrói um sistema supervisório para este processo. A sessão 4 apresenta os resultados de simulação e a sessão 5 conclui o trabalho.

2 MODELOS COGNITIVOS

Os mapas cognitivos foram inicialmente propostos por Axelrod (1976) para representar palavras, idéias, tarefas ou outros itens ligados a um conceito central e dispostos radialmente em volta deste conceito. Axelrod desenvolveu também um tratamento matemático para esses mapas, baseado na, teoria de grafos e em operações com matrizes. Através de mapas cognitivos, as crenças ou afirmações a respeito de um domínio de conhecimento limitado são expressas por meio de palavras ou expressões linguísticas, interligadas por relações simples de causa e efeito (causa/não-causa).

Estes mapas podem assim ser considerados como um modelo matemático da estrutura de crenças de uma pessoa ou grupo, permitindo inferir ou predizer as consequências que esta organização de idéias causa no universo representado. Este modelo matemático foi adaptado para inclusão de incertezas através da lógica fuzzy por Kosko (1986) gerando os mapas cognitivos fuzzy. Posteriormente, os FCMs foram adaptados para a inclusão de um comportamento dinâmico gerando as redes dinâmicas cognitivas (Miao et al., 2001).

À semelhança dos mapas cognitivos originais, os FCMs e as DCNs são grafos direcionais (dígrafos), em que os valores numéricos são variáveis ou conjuntos fuzzy. Os nós destes grafos são conceitos linguísticos, representados por conjuntos fuzzy e cada nó é associado com outros através de conexões. A cada uma dessas conexões é associado um peso numérico, que representa uma variável fuzzy relacionada com o nível de causalidade existente entre os conceitos. Um exemplo de mapa cognitivo é dado na figura 1 e a sua matriz de conexão ou pesos equivalente é dada na equação 1.


Os conceitos de um mapa cognitivo podem ser atualizados através da iteração com os outros conceitos e com o seu próprio valor. Isto é dado pela equação () em que as relações causais são representadas pelos pesos da somatória. Resumindo, os valores dos conceitos vão evoluindo após várias iterações até normalmente estabilizarem-se num ponto fixo ou num ciclo limite.

Onde k é o contador de iterações, n é o número de nós no grafo, Wij é o peso do arco que conecta o conceito Ci ao conceito Cj, é o valor do conceito Ci na iteração k e a função ƒ é uma função do tipo sigmóide:

Desta forma um modelo baseado em FCM ou DCN usa uma representação de conhecimento estruturada através de relações causais calculadas matematicamente a partir de operações matriciais.

No caso particular dos FCMs, alguns autores argumentam que esses modelos não estão aptos a representar os sistemas reais corretamente, em especial os sistemas dinâmicos, pois através deles é possível apenas expressar relações causais monotônicas e simétricas. Essas relações causais também não conseguem modelar o conceito de realimentação e os aspectos temporais associados aos sistemas reais (Miao et al, 2001), (Carvalho, 2001). Como solução, Carvalho (2001) introduz outros tipos de relações além das relações causais nos FCMs, e também classifica os conceitos de acordo com o seu comportamento temporal. Já Miao e seus colaboradores (2001) propõem a utilização de conexões variantes no tempo e utilizam funções de transferência no domínio de Laplace para calcular ao longo do tempo os valores das ponderações dadas pela matriz (1). Esses autores denominam os mapas cognitivos assim obtidos de redes cognitivas dinâmicas (DCN).

Seguindo as recomendações de Carvalho (2001), Miao et al. (2001) e Stylios et al (2008), utilizam-se neste artigo para a construção da DCN, além de conceitos e relações causais empregados no desenvolvimento de mapas cognitivos, os seguintes tipos de conceito e relação:

Conceito Nível: é um conceito que é perfeitamente representado por um valor absoluto.

Conceito Variação: é um conceito cujo valor representa uma variação em um determinado instante de tempo.

Conceito de entrada: é um conceito que recebe dados de entrada, descritivos do estado do sistema, e que podem interagir entre si, para representar a evolução do sistema.

Conceito de saída (decisão): são os conceitos resultantes da evolução da DCN e que não interagem entre si.

Relações causais: são relações de causa e efeito entre dois conceitos, modeladas através das equações (1) As relações causais podem ser estáticas calculadas através de uma matriz W constante ou variantes no tempo, calculadas a partir de um W(t).

Relações fuzzy: são relações de causa-efeito entre um antecedente e um consequente modelada através de uma regra fuzzy. Estas relações são naturalmente variantes no tempo, já que o valor da matriz W(t) é resultado da execução de um sistema lógico fuzzy.

Declarações condicionais: são relações de causa-efeito expressas na forma de regras se-então. Como as anteriores, estas declarações também geram conexões variantes no tempo.

Outro aspecto relativo à construção de FCMs e por extensão de DCNs diz respeito à otimização da matriz de pesos dada em (1) e a sua aderência aos dados reais do sistema.

Para isto, uma estratégia de aprendizado baseado em dados pode ser aplicada após a construção do mapa por especialista. Os métodos utilizados nessas estratégias são em geral baseados em aprendizado hebbiano (Dickerson e Kosko, 1994), (Papageorgiou, Stylios e Groumpos, 2004) ou algoritmo evolucionários (Koulouriotis, Diakoulakis e Emiris, 2001), (Stach, Kurgan e Pedrycz, 2005), simulated annealing (Ghazanfari et al., 2007), ou ainda otimização por nuvem de partículas (Papageorgiou et al, 2005), (Petalas, Parsopoulos, e Vrahatis, 2009). Uma extensão destes métodos pode ser mantida para garantir a adaptabilidade do mapa a mudanças no sistema durante sua utilização. Este tipo de estratégia não é utilizado nesse artigo.

2.1 Construção de uma Rede Dinâmica Cognitiva

A construção de uma rede cognitiva dinâmica (DCN), como uma evolução do mapa cognitivo fuzzy (FCM), pode ser realizada em seis passos, de acordo com o algoritmo mostrado no Quadro 1. Este algoritmo é uma modificação do algoritmo de construção de FCMs utilizado em (Kosko, 1986), (Stylios e Groumpos, 2000) e (Ghazanfari et al., 2007). Nesses trabalhos, por exemplo, o Passo 1 do algoritmo do Quadro 1 possui apenas relações causais, a extensão para outros tipos de relação é uma proposta deste trabalho.


2.2 Revisão da literatura – FCM e DCN

Desde o trabalho pioneiro de Kosko em 1986, que estendeu os mapas cognitivos de Axerold para a inclusão de incertezas no modelo cognitivo, através da lógica fuzzy, várias aplicações de FCM são reportadas na literatura. Essas aplicações abrangem diversas áreas, tais que sistemas sociais (Taber, 1991), vida artificial (Dickerson e Kosko, 1994), tomada de decisão em rodovias de acesso rápido (Perusich, 1996), modelagem e tomada de decisão em ambientes corporativos, comércio eletrônico (Lee e Lee, 2003), detecção de pontos em imagens geradas por sistema de câmeras estéreo (Pajares e de La Cruz, 2006), tomada decisão na área médica (Papageorgiou, Stylios e Groumpos, 2007) entre vários outros. Observa-se que, estes trabalhos também apresentam variações semânticas da proposta original de FCM, adaptando a estrutura do FCM de acordo com o problema tratado e tentando atenuar as dificuldades de modelagem reportadas nas sessões anteriores.

De um modo mais específico, os trabalhos a seguir empregam FCM para apoiar a tomada de decisão em sistemas dinâmicos, em especial para controle supervisório e/ou adaptativo de aplicações industriais, área de pesquisa na qual se enquadra este artigo.

Stylios e Groumpos (2000) apresentam um sistema de controle supervisório em dois níveis aplicado a um processo de manufatura. O FCM de baixo nível modela o funcionamento do processo e características qualitativas do produto final, com vistas à detecção de falhas. O segundo FCM utiliza técnicas de agrupamento na construção de diferentes funcionalidades no nível supervisório. Para ambos os FCM, regras de tomada de decisão fuzzy do tipo SE-ENTÃO são empregadas nas relações causais do mapa e uma interface dedicada permite a comunicação e troca de dados entre os dois níveis. A mesma arquitetura é utilizada para modelar e descrever o comportamento dinâmico de um trocador de calor em Stylios e Groumpos (2004) e para controle de nível de um sistema de tanques acoplados em (Papageorgiou et al., 2004).

O controle hierárquico de um sistema de radioterapia para cálculo e tomada de decisões quanto à dosagem a ser aplicada em pacientes com câncer é proposto em (Papageorgiou, Stylios e Groumpos, 2007). O FCM de baixo nível é responsável pelo cálculo de três variáveis de saídas (fatores e seletores) associadas a níveis de radiação, as quais devem ser analisadas no nível superior. O FCM de alto nível atua como um sistema de tomada de decisão. As diferentes opções de ajuste entre os parâmetros dos fatores e seletores são feitos através de regras de decisão simples do tipo SE-ENTÃO. Observa-se que as inferências alteram os valores dos conceitos e não das relações causais previamente ajustadas de acordo com o conhecimento empírico do processo. O FCM do nível superior ajusta a dosagem final e a dosagem planejada da radiação aplicada dentro de limites máximos e mínimos de protocolos médicos já pré-estabelecidos. A interface entre os dois níveis de controle também é feita através de regras fuzzy em que variações nos conceitos do FCM do nível inferior alteram os conceitos no FCM do nível superior e vice-versa. Uma extensão deste trabalho é apresentada em (Stylios, Georgopoulos e Chouliara, 2008).

O FCM apresentado em (Carvalho, 2001) também utiliza regras de inferência fuzzy entre as relações causais. Esta arquitetura é denominada RB-FCM (Rule based FCM). De acordo com o autor, somente as relações causais entre os conceitos restringem a aplicação de FCM em sistemas dinâmicos. O uso de regras de inferência (SE-ENTÃO) entre as relações permite a tomada de decisões, alterando conceitos para diferentes pontos de operação ou para conectar vários FCMs em diferentes níveis hierárquicos. Além disso, um autômato celular é utilizado para transição entre diferentes tipos de regras fuzzy em diferentes cenários de um sistema dinâmico.

Jones, Roy e Corbett (2004) apresentam uma variação da proposta original de Kosko, em que um FCM é acrescido de capacidade de inferência através da inclusão de um sistema ANFIS (Adaptive-Network-Based Fuzzy Inference System) na modelagem das relações causais. O FICM (Fuzzy Inference Cognitive Maps) emprega dois tipos de conceitos diferentes. Os conceitos e relações causais comumente utilizados na construção de FCMs e conceitos auxiliares para a tomada de decisão.

O trabalho de Aguilar (2004) apresenta uma nova arquitetura cognitiva denominada Dynamic Random Fuzzy Cognitive Map (DR-FCM) que propõe mudanças dinâmicas nas relações causais inspirados nas redes neurais aleatórias. Nessa arquitetura, funções densidades de probabilidade são inseridas no lugar de um simples valor numérico para determinar o valor das relações causais. Essas relações deverão ser atualizadas de acordo com condições específicas das variações no ambiente. O mecanismo dinâmico de atualização usa algoritmos de aprendizagem por reforço. Para validação, é proposta uma aplicação de realidade virtual (modelo de soldados em combate), que permite avaliar o desenvolvimento, a capacidade de inferência e a estabilidade da arquitetura DR-FCM.

Recentemente, Chun-Mei (2008) apresenta e discute a evolução de topologias FCMs para a construção de modelos qualitativos, desenvolvendo uma proposta de controle multivariado com uso de FCM.

Um FCM é utilizado em (Neves, Arruda e Mendonça, 2009) para gerar set-points no nível supervisório para o mesmo processo de fermentação utilizado neste artigo. Nesse trabalho, os autores utilizam um FCM para modelar o processo de fermentação e um algoritmo genético para alterar as relações causais entre os conceitos do mapa a fim de garantir o funcionamento adequado do processo nos diversos pontos de operação desejados. O desempenho da arquitetura proposta é comparado com duas outras arquiteturas, em que a tarefa de gerar set-points para o nível regulatório é implementada via controlador fuzzy ou via controle preditivo baseado em DMC (Dynamic Matrix Control).

Outra ferramenta baseada em mapas cognitivos encontrada na literatura é o Fuzzy-SDG (Signed Direct Graph) (Wang et al, 1995). Esta topologia utiliza o conhecimento de especialistas de forma estruturada gerando um mapa cognitivo. Os conceitos dão origem a variáveis fuzzy e as relações causais originam uma base de regras do tipo antecedente – consequente. Em (Ghazanfari et al, 2002), um sistema dinâmico de compras é desenvolvido para exemplificar o uso de Fuzzy-SDG. Esse sistema inteligente modela o tempo através do disparo de regras e inclui um fator de probabilidade para cada regra modelada. O uso de funções de probabilidade atenua os efeitos das incertezas, imprecisões, ambiguidade, entre outros, decorrentes do processo de aquisição de conhecimento indutivo.

Em (Huang e Wang, 1999) é apresentado outro tipo de mapa cognitivo, as redes fuzzy causais (FCN – Fuzzy Causal Network), em que o mecanismo de inferências se dá através da criação e ativação dinâmica de subconjuntos dos conceitos modelados. Esses conjuntos e subconjuntos são contidos em intervalos mínimos e máximos das variáveis modeladas (conceitos) e, de acordo com regras de funcionamento, são ativados considerando também sua evolução temporal. Os autores consideram as FCNs uma extensão dos grafos Fuzzy-SDG e argumentam que a ferramenta é eficiente na representação de sistemas dinâmicos. Em (Zhang, Liu e Zhou, 2006), um sistema de tomada de decisão baseada em políticas propostas por diferentes especialistas é modelado utilizando FCN e aplicado a um departamento universitário, exemplificando o uso da ferramenta proposta.

Como uma combinação de FCMs e FCNs surgem em seguida as redes cognitivas dinâmicas que pretendem combinar as propriedades dos FCMs aos sistemas de inferência causal das FCNs. A DCN descrita em (Miao et al, 2001) é uma das primeiras propostas de DCN e utilizam funções de transferência no domínio de Laplace para representar o comportamento dinâmico das relações causais de um mapa cognitivo. Assim cada arco de uma DCN tem seu valor calculado a partir de uma função de transferência ou de um modelo em espaço de estado. Estruturalmente uma DCNs é mais flexível que um FCM. De um modo geral, uma DCN pode ser tão simples quanto um mapa cognitivo (CM), um FCM, ou tão complexo como um sistema dinâmico não-linear. Em (Miao et al, 2001), para demonstrar o potencial da ferramenta, um sistema de estratégia e tomada de decisão financeira para gerenciamento de plantações é construído e resultados simulados são apresentados e comparados com um FCM.

O trabalho de Koulouriotis e colaboradores (2004) apresenta uma proposta de rede cognitiva dinâmica (DCN) para aproximação de séries temporais aplicada em sistemas financeiros. Segundo os autores, os FCMs têm limitações para modelagem de sistemas complexos principalmente devido a não-linearidades e fenômenos temporais. A arquitetura proposta desse trabalho é semelhante à proposta em (Miao et al, 2001) na medida em que uma DCN é obtida a partir de um FCM. No entanto, a DCN proposta guarda mais semelhança com as redes neurais que com os FCMs, uma vez que usa o algoritmo de Levenberg Marquadt para treinamento e/ou sintonia da rede cognitiva. Os autores validam e concluem a proposta através de comparativos entre DCN e RNA.

Uma nova proposta de mapa cognitivo dinâmico é apresentada em (Kottas, Boutallis e Christodoulou, 2007) e denominado rede cognitiva fuzzy (Fuzzy Cognitive Network - FCN). Essas FCNs são semelhantes às DCN e utilizam um mecanismo de atualização da matriz W baseado no algoritmo do gradiente (regra delta) a partir da realimentação do erro medido entre o estado atual e o estado desejado da rede. Os autores aplicam a FCN assim projetada no controle de nível de um modelo simplificado de hidroelétrica. Como as DCNs em (Koulouriotis et al., 2004), essas FCNs estão mais próximas de uma rede neural do que de um mapa cognitivo, propriamente dito.

Recentemente, Miao e seus colaboradores (2010) demonstram que as DCNs são uma família geral de mapa cognitivo e que em particular, os mapas de Axelrod (1976) e os FCMs de Kosko (1986) são modelos simplificados de DCNs. Além disso, esses autores também desenvolvem modelos de transformação fornecendo uma base teórica sólida para as aplicações de DCNs.

No presente trabalho, adota-se a abordagem proposta em (Miao et al, 2001) e (Miao et al., 2010), a qual define uma DCN como um grafo direcional, podendo ou não conter realimentação, e cujo valores (fuzzy ou não) de nós e arestas são variantes no tempo. A partir desta definição, uma DCN é construída para emular o comportamento de um operador, o qual é capaz de supervisionar um processo de fermentação em condições normais e críticas. O operador interage com o processo através da aplicação de diferentes valores de set-point para o nível regulatório, garantido condições ótimas para a reação. A DCN resultante é considerada um sistema supervisório inteligente.

3 PROCESSO DE FERMENTAÇÃO ALCOÓLICA

O processo de fermentação utilizado nas simulações deste artigo foi estudado inicialmente por Maher (1995) e tem servido como test-bed pelos autores deste artigo para validar arquiteturas de controle com diferentes enfoques (Melo-Jr. et al, 2002), (Fabro e Arruda, 2003) e (Neves-Jr., Arruda e Mendonça, 2009). Um diagrama representando o processo é apresentado na s. Existem duas válvulas, Fin e Fout, que controlam respectivamente o fluxo de substrato inserido no tanque e o fluxo de produto (fermentado) retirado. Estas válvulas são controladas por dois controladores independentes do tipo Proporcional – Integral - Derivativo (PID). O processo apresenta quatro variáveis de estado: as concentrações de substrato (S), de biomassa (C), de produto (P) e o volume (V) do tanque onde ocorre a fermentação. As concentrações são dadas em gramas/litro (g/l), e o volume em litros (l). As equações diferenciais descrevendo o comportamento dinâmico do processo são dadas em (4) a (7).


onde Sa é a concentração de substrato da alimentação, YP/S e YC/S são as constantes de conversão de biomassa e produto respectivamente. A variável µ representa a função de crescimento da biomassa durante o processo de fermentação e é dada por:

O valor inicial µ0 corresponde a máxima taxa de crescimento, Ks é a constante de Michaelis-Menton, e Pm é o coeficiente de inibição do produto durante a reação. Neste artigo as equações 4 a 8 são utilizadas para simular o processo de fermentação e são resolvidas através do método de Runge-Kutta de 4ª ordem.

Este processo é não-linear e apresenta um comportamento de fase não mínima e tempo de acomodação grande, como mostra a figura 3. Além disso, por medida de segurança quando o volume do reservatório excede 3,5 litros, a válvula Fin é completamente fechada e se ao contrário o volume cair abaixo do mínimo (1,5l), a válvula de saída Fout é completamente fechada. Estas duas ações são automáticas e funcionam como perturbação durante a evolução do processo.


4 CONTROLE SUPERVISÓRIO ATRAVÉS DE DCN

O crescente interesse pela aplicação de sistemas inteligentes no controle automático de processos industriais complexos é devido principalmente à presença de não-linearidades em regime dinâmico, e, em alguns casos baixa qualidade na aquisição de medidas, altos níveis de ruído e sensoriamento fortemente distribuído. Em geral, nesses sistemas, controlam-se apenas variáveis secundárias, as quais podem ser medidas e controladas (temperatura, pressão, fluxo, entre outros), deixando a cargo do operador a tomada de decisão que influencia a quantidade e a qualidade final e/ou parcial do processo. Com isto, o maior fator de paradas de produção é a falha humana, devido a erros inerentes à cognição humana, como por exemplo, erro de interpretação dos alarmes e respostas do sistema, sobrecarga de informação, que ocasionam erros em tomadas de decisão, entre outros.

Neste contexto, uso de sistemas inteligentes baseados em redes dinâmicas cognitivas apresentam vantagens na modelagem e simulação de sistemas complexos, devido à flexibilidade da representação do conhecimento através de grandezas fuzzy, agregada à facilidade de abstração do conhecimento presente nos mapas cognitivos e a possibilidade de construção de grandes mapas a partir da união de pequenos mapas que representam porções do conhecimento.

Por outro lado, a utilização de sistemas hierárquicos para o controle supervisório é amplamente aceita na literatura (Pasino e Yurkovitch, 1998). Uma arquitetura hierárquica baseada em FCM é proposta em Stylios e Groumpos (2004) para supervisão de processos complexos. Esta arquitetura, adaptada para DCN é mostrada na figura 4, e possui um supervisor no nível superior composto por várias DCNs interconectadas, cada uma delas realizando uma tarefa específica do controle supervisório tais que detecção de falhas, monitoramento, planejamento, tomada de decisão entre outros.


Este artigo propõe o desenvolvimento de uma DCN para implementar a tarefa de operação do processo de fermentação durante uma campanha com objetivos fixos, substituindo o operador do sistema por uma tarefa do supervisor. O objetivo é minimizar os efeitos de transição de set-points, determinado pelas mudanças de ponto de operação, sobre as variáveis do processo e dispositivos (válvulas), além de melhorar o desempenho da reação, ao mesmo tempo em que satisfaz restrições operacionais.

4.1 Construção da DCN para operação do fermentador.

A construção da DCN segue os passos do quadro apresentado na sessão 2.1. Entretanto, seguindo as recomendações de Miao e Liu (1999) e a arquitetura dada na figura 4, foram construídas duas DCNs distintas, uma para o modo de operação normal e outra para o modo de operação crítico. Estas redes foram desenvolvidas, testadas e validadas separadamente e em seguidas unidas para formar uma DCN maior que realiza a tarefa de supervisão do processo.

As DCNs foram construídas a partir da observação do comportamento do processo em diferentes situações e das relações entre as suas variáveis físicas (Substrato, Biomassa, Produto e o Volume) e os dispositivos de controle (Válvulas de entrada Fin e saída Fout), após ações de controle. Para isto, além de se analisar as equações diferenciais (4) -(8) que descrevem a reação química de fermentação, procedeu-se a uma análise de causa e efeito entre as variáveis físicas (biomassa, produto, substrato e volume) do processo para diferentes valores de set-points dos PIDs que acionam as válvulas Fin e Fout, caracterizando os diversos pontos de operação do fermentador.

Como resultado observou-se o seguinte comportamento para o processo:

1. A concentração de produto no reator, variável controlada do processo, é afetada por variações no set-point do PID que controla a válvula de entrada. Este comportamento é modelado através de uma relação causal representada por um arco na DCN. (W2)

2. A concentração de produto no reator, variável controlada, é afetada por variações no set-point do PID que controla a válvula de saída. (W3)

3. O valor do set-point desejado do processo, que caracteriza o ponto de operação da reação, determina o valor de set-point efetivamente aplicado ao PID que controla a válvula de entrada. (W4)

4. O valor do set-point desejado do processo, que caracteriza o ponto de operação da reação, determina o valor do set-point efetivamente aplicado ao PID da válvula de saída. (W5)

5. A variação de set-point desejado (mudança de ponto de operação) afeta o valor do set-point aplicado à válvula de entrada. (W6)

6. Variação do set-point desejado (mudança de ponto de operação) afeta o valor do set-point aplicado à válvula de saída. (W7)

7. Uma variação acentuada na concentração (superior a 3g/l) de substrato no reator determina uma variação no set-point do PID que controla a válvula de entrada, a fim de garantir o equilíbrio da reação de fermentação. (W1)

8. Esta variação da concentração de substrato não influencia o set-point do PID da válvula de saída, pois a inserção de substrato é feita por Fin, e válvula Fout está relacionada à retirada de produto.

9. O volume no tanque é afetado pelo valor do set-point da válvula Fin, no entanto esta relação é assimétrica e possui uma restrição quanto ao volume máximo, sendo modelada como uma relação do tipo fuzzy, como será explicado a seguir. (WF1)

10. O volume no tanque é afetado pelo valor do set-point da válvula Fout, no entanto esta relação também é assimétrica e possui uma restrição quanto ao volume mínimo, sendo modelada como uma relação do tipo fuzzy, como será explicado a seguir. (WF2)

A partir deste comportamento, é construída a primeira DCN para a operação do fermentador, mostrada na figura 5. Esta DCN corresponde à operação do processo em modo normal e será denominada DCNn. Como pode ser visto na figura 5, a DCNn corresponde a um grafo acíclico simples, representando o modo como um operador ajusta os set-points efetivamente aplicado aos PIDs do processo. O objetivo do supervisor é minimizar os efeitos de transição de set-points, determinado pelas mudanças de ponto de operação, e melhorar o desempenho da reação, ao mesmo tempo em que satisfaz as restrições de operação tal que manter o volume do produto dentro de seus limites.


A obtenção de um grafo acíclico ou mapa cognitivo trivial está de acordo com Miao e colaboradores (2001) que atestam que na construção por etapas de grandes mapas cognitivos, sempre aparecem mapas menores geralmente acíclicos, que correspondem a relações de causa-efeito unidirecional, bem definidas.

Na DCNn da figura 5, as variáveis físicas como o produto, volume e set-point desejado são conceitos de entrada do tipo nível e tem seus valores normalizados no intervalo [0, 1] a partir de medidas do processo. As variáveis variação de substrato e variação de set-point desejado são conceitos de entrada do tipo variação, e as variáveis set-point Fin e set-point Fout são variáveis de saída do tipo decisão, e assumem valores no intervalo [0, 1]. O valor de set-point efetivamente aplicado na entrada do PID corresponde ao valor desta decisão multiplicado pelo set-point desejado.

As relações W2 a W7 são relações causais cujos valores são obtidos a partir de dados simulados. Já a relação W1 é uma relação causal trivalente, determinada por restrições de equilíbrio da reação química, e dada por:

Onde: Δsubstrato corresponde à variação de substrato ocorrida entre dois instantes de tempo consecutivos. A matriz de conexão da DCNn obtida a partir de dados de simulação e da aplicação dos passos 2 a 4 do algoritmo do quadro 1 é dada na tabela 1.

A intensidade da relação modelada por W4 depende do ponto de operação do processo (valor de set–point) e está associado ao comportamento da reação química (Neves, Arruda e Mendonça, 2009). As relações WF1 e WF2 são relações fuzzy cujos valores são obtidos a partir de uma base de regras fuzzy. A criação de uma relação fuzzy torna-se necessária sempre que a natureza das variáveis observadas é não monotônica, isto é, as variáveis não são crescentes ou decrescentes ou estritamente crescentes e decrescentes. Esta situação ocorre com o volume em presença de variações negativas ou positivas de set-points, para ambas as válvulas. Para ilustrar tal comportamento, a figura 6 mostra o volume e sua variação quando ocorrem mudanças no set-point do PID associado à válvula Fin. Observa-se que as variações de volume são mais acentuadas quando ocorre transição positiva de set-point. De acordo com esse comportamento, foi criado um sistema fuzzy do tipo Mandami (Pasino e Yourkovich, 1999) que tem como entrada os valores de volume e variação de volume e como saída o valor da relação fuzzy WF1 que altera o conceito do set-point efetivamente aplicado na válvula Fin.


As seguintes regras são utilizadas para calcular a relação fuzzy WF1:

  • Sevolume é baixo e variação do volume é média então WF1 é alta.

  • Sevolume é baixo e variação do volume é alta então WF1 é alta.

  • Sevolume é baixo e variação do volume é baixo então WF1 é igual a 1.

  • Sevolume é alto e existe variação do volume então WF1 é baixa

  • Sevolume é médio e existe variação do volume então WF1 é média.

A figura 7 mostra a superfície fuzzy associada à base de regras desenvolvida que descreve o efeito não-linear (WF1) causado pelas variáveis de entrada volume e variação de volume sobre o set-point aplicado ao PID da válvula Fin.


De modo semelhante, uma relação fuzzy foi criada para relacionar os conceitos volume e set-point da válvula Fout através da relação dada por WF2.

No entanto foi constatado que em algumas campanhas de longa duração, a concentração de substrato e/ou de biomassa no interior do reator pode cair a níveis que não permitam a realização do processo de fermentação. Neste caso, a operação torna-se crítica e é necessário recuperar os componentes do processo através de uma variação de set-point, independente dos valores determinados para a campanha. Para isto foi desenvolvido um novo modelo que se interliga à DCN da figura 5 para a determinação dos set-points enviados a ambos PIDs. Este novo modelo corresponde a uma DCN para operação em modo crítico e será denominado DCNc.

Este novo modelo cognitivo tem por função monitorar condições críticas no processo e assim possui uma inferência orientada a eventos. A DCNc construída utiliza um outro tipo relação, denominada relação de seleção, que é modelada através de regras do tipo SE-ENTÃO (implicação linguística) que ativam um conceito cujo valor é retirado de um conjunto de valores discretizados (Papageorgiou, Stylios e Groumpos, 2007). Neste caso, as seguintes restrições devem ser modeladas:

1. A quantidade de biomassa não deve superar uma concentração máxima de 8 g/l.

2. Como explicado anteriormente, o volume no reator não pode exceder 3,5l, nem cair abaixo de 1,5l.

3. A quantidade de substrato não pode cair abaixo de uma concentração mínima de 0,5 g/l.

4. Os valores de set-point para concentração de produto correspondem a uma lista de valores de concentração discretizados no intervalo [10, 50] g/l descrevendo os pontos de operação do processo.

O modelo construído para operação crítica é mostrado na figura 8. Três novos conceitos associados às variáveis do processo: seleção substrato, seleção biomassa e seleção volume são inseridos para modelar o processo em operação crítica. Esses três conceitos são do tipo seleção e influenciam o valor do set-point a ser aplicado no processo (conceito Set Point Processo IN na figura 8). O número de regras associadas aos conceitos de seleção irá depender das condições modeladas. A relação de seleção de volume emprega duas regras que testam os limites máximos e mínimos para o volume, enquanto que as relações de seleção de substrato e biomassa empregam somente uma. Essas relações e conceitos são resultantes do conhecimento empírico sobre a operação do processo.


De um modo geral, o conceito de seleção representa a ação que executa uma mudança no conceito relacionado e a relação de seleção representa o mecanismo que dispara a ativação do conceito.

Para a DCNc da figura 8, as restrições 1 a 4 citadas acima são expressas através das seguintes regras:

  • Se o volume é maior que um limiar máximo, e o set-point da variável de entrada Set point processo IN é menor que o máximo então incrementa o valor atual do set-point desejado na campanha (Set Point processo IN). Isto é, seleciona-se como set-point de entrada o próximo valor da lista de pontos de operação do processo via conceito seleção volume (WS2).

  • Se o volume é menor que o mínimo e set-point da variável de entrada Set Point Processo IN é menor que o mínimo então decrementa valor atual de set-point via conceito seleção volume (WS2).

  • Se a concentração de substrato é menor do que mínimo e o set-point atual é menor que o máximo então incrementa o valor de set-point atual do conceito de seleção Set Point Processo IN, via conceito seleção substrato (WS1).

  • Se a concentração de biomassa é maior que o limite máximo e set-point atual é igual ao máximo então decrementar o valor de set-point atual do conceito de seleção Set Point Processo IN, via conceito seleção biomassa (WS3).

A conexão entre os dois modelos cognitivos se dá através das duas variáveis SPoint IN e SPoint OUT as quais se conectam as variáveis de interface (OUT1 e OUT2) que enviam valores para o fermentador. Também o conceito volume é o mesmo para ambas DCNs. O valor das variáveis OUT1 e OUT2 é resultado do produto entre os conceitos de saída dos dois modelos.

A figura 9 mostra a DCN resultante da união dos dois modelos cognitivos (DCNn + DCNc) para a supervisão do processo. Esta DCN final foi testada para diferentes valores de concentrações de produto, com variação de set-point no intervalo 10 a 50g/l e em todos eles estabilizou em um número finito de iterações.


A DCN assim construída é inserida na arquitetura de controle supervisório mostrada na figura 10. Nesta arquitetura coexistem dois tipos de decisões: as decisões resultantes da análise de relações causa-efeito (relações causais e fuzzy) e decisões orientadas a eventos, resultantes da análise de condições específicas de operação do processo, mode,ladas através de uma base de regras.


As DCNs apresentados nas figuras 5, 8 e 9 são utilizados na próxima sessão para controlar o processo de fermentação apresentado na sessão 2.

5 RESULTADOS DE SIMULAÇÃO.

Três conjuntos de testes foram executados para avaliação de desempenho e robustez dessa arquitetura. Em todos eles, é simulada uma campanha que tem por objetivo levar o fermentador de um estado inicial caracterizado por uma concentração de aproximadamente 25 g/l de produto até um estado final em que a concentração de produto é de 45g/l, passando por 3 pontos de operação intermediários caracterizados por valores de set-point de 30, 35 e 40g/l.

No primeiro experimento, o processo é considerado operando em modo normal e o desempenho do controle regulatório é comparado ao controle supervisório realizado através da DCNn da figura 5. Convém ressaltar que no controle regulatório, os dois PIDs atuam a partir de um set-point único e o incremento de controle calculado é somado ao valor atual da válvula Fin e decrementado do valor atual da válvula Fout. No controle supervisório, a operação das válvulas é independente, o incremento de controle é calculado a partir de dois conjuntos de set-points distintos, um para cada PID do nível regulatório, gerado pela DCN. Além disso, quando uma das válvulas é completamente fechada, a outra também será por medida de segurança.

No segundo experimento, a mesma campanha é realizada, e conforme será explicado a seguir, a reação atinge um estado crítico após um determinado instante de tempo, sendo necessária uma operação mais criteriosa do processo. Neste caso, avalia-se o desempenho do controle supervisório realizado através da DCN da figura 9, o qual incorpora os dois modos de funcionamento (em operação normal e crítica).

No último experimento, a mesma campanha é realizada, no entanto uma falha é simulada, forçando a válvula Fin a permanecer temporariamente fechada durante certo instante de tempo, o que leva a uma perturbação não controlada do processo. O desempenho do controle regulatório é novamente comparado com o controle supervisório com a DCN dada na figura 9, a fim de testar o modo de operação crítico quando uma causa externa (fechamento de válvulas) leva a um desequilíbrio da reação. Em todos os experimentos as condições iniciais são dadas na tabela 2.

No experimento 1, a fim de validar a arquitetura proposta, os seguintes critérios de desempenho são calculados para cada arquitetura: índice ITAE (Integral Time of Absolute Value Error) e as variâncias dos sinais de controle e saída do processo. O ITAE foi escolhido por ser um indicador de desempenho largamente aceito na comunidade de controle para avaliação de malhas PID. A variância observada no sinal de saída y(t) do processo mede a robustez do sistema em malha fechada na presença de perturbações e a variância do sinal de controle u(t) é um indicador da suavidade das ações de controle efetivamente utilizadas (Aström e Wittenmark, 1995). As figuras 11, 12 e 13 mostram os resultados das arquiteturas de controle obtidas com o primeiro conjunto de set-points. A figura 11 traz os resultados para o controle regulatório apenas com o PID, o set-point aplicado a ambos os controladores é o mesmo, no entanto, como explicado acima o incremento de controle calculado a partir do erro é adicionado à válvula Fin e decrementado da válvula Fout. As saídas dos PIDs estão mostradas bem como os valores das variáveis de estado concentração, substrato, biomassa e volume. Os resultados para o controle supervisório são dados nas figuras 12 e 13. A figura 12 traz os diferentes set-points aplicados aos PIDs e as respostas destes controladores. A figura 13 mostra a evolução das variáveis de estado do processo. Os índices de desempenho deste experimento são dados na tabela 3.




Para a análise desses resultados, convém ressaltar que todos os valores só foram calculados até o instante t = 285h. Isto porque a partir deste instante para ambas as arquiteturas de controle, a reação atinge um valor limite, com volume igual a 3,5l, determinando o fechamento da válvula de entrada e em consequência a válvula de saída também é fechada. De fato a partir deste instante a biomassa atinge sua concentração máxima de 7g/l, o substrato é inteiramente consumido e não acontece mais a reação química, ou seja, o processo é desligado. Esta situação pode ser comprovada através da análise do comportamento das variáveis citadas nas figuras 11 e 12.

Analisando os resultados mostrados na tabela 3, nota-se que a métrica ITAE indicou um desempenho de aproximadamente 5% menor para o controle supervisório (DCN+PID) em relação ao controle regulatório apenas, confirmado pelos valores de variância do erro. No que se refere ao sinal de saída associada à válvula Fout, os valores de variância (coluna ) são equivalentes. O controle efetivo do processo é feito sobre a válvula Fin que regula a entrada de substrato no reator e que é influenciado fortemente pelas variações de set-points. No instante t = 120h há uma transição de set-point de 45g/l para 35g/l. Neste caso, para o controle regulatório o erro é calculado e as válvulas são abertas o suficiente para corrigir esse erro. Já o controle supervisório, considera que além do erro há uma variação de substrato em instantes anteriores, em consequência o valor de W1 é invertido (relação trivalente dada pela equação 9), diminuindo mais ainda o valor do set-point desejado e determinando uma abertura completa da válvula Fin. Este fato é responsável pelas diferenças observadas nos valores de variância da válvula Fin (coluna) e da variável de saída, gerando uma variação do sinal de controle na válvula Fin 13,5% maior para o controle supervisório. No entanto o impacto disto na variância de saída do controle supervisório é de apenas 1,8% em relação ao controle regulatório. As variações positivas de set-point são tratadas igualmente por ambas as arquiteturas.

Em resumo, para o modo de operação normal com diferentes variações de set-point, o comportamento do controle supervisório é equivalente ao controle regulatório, indicando que quando não há ocorrência de eventos críticos, se a malha de controle regulatório está operando satisfatoriamente a inclusão de um nível supervisório não interfere nesta operação. O supervisor cumpre assim o seu papel.

Durante a simulação da campanha, como explicado anteriormente, uma situação crítica para o processo ocorre a partir do instante t = 285h, determinando o fechamento do reator (as válvulas Fin e Fout são completamente fechadas) e o término da reação (ver figura 11). Para analisar esta situação, um segundo experimento, exatamente igual ao primeiro é realizado, a diferença é que neste experimento o controle supervisório incorpora o modo de operação crítico, sendo assim implementado pelo modelo cognitivo dinâmico (DCN) da figura 9.

As figuras 14 e 15 mostram os resultados obtidos com controle supervisório realizado pela DCN. A partir de uma avaliação das variáveis do processo, um novo conjunto de set-points diferentes do experimento 1, é gerado pela heurística modelada pela base de regras. Por exemplo, um pouco antes do instante em que ocorre a transição de set-point de 45g/l para 35g/l (t = 115h até t = 120h), o supervisor agora comandado pela DCN da figura 9, gera um set-point intermediário de 40g/l, a fim de recuperar a quantidade de substrato que está caindo. Com isso, quando ocorre a transição de set-point em t = 120h, os erros considerados nos PIDs são menores e os sinais de controle calculados também são menores se comparados com os do experimento 1 (compare os gráficos das figuras 12 e 14 em t = 120h). A fim de comprovar, a atuação do supervisor DCN, os índices de desempenho são recalculados até o instante t = 250h, para as três arquiteturas de controle: regulatório (PID), supervisório com a DCNn (etapa 1) da figura 5 (DCNn+PID) e supervisório com a DCN da figura 9 (DCN+PID). Estes valores são dados na tabela 4 e mostram que o supervisor DCN+PID apresenta um desempenho ligeiramente superior às outras duas arquiteturas.



Do mesmo modo, analisando ainda as figuras 14 e 15, a situação crítica que no experimento 1 ocorre a partir de t = 285h, é antecipada (a concentração mínima de substrato considerada pela DCN não pode cair abaixo de 0,5 g/l), e o supervisor determina logo no instante t = 264h (ver figura 14) uma diminuição do set-point de 45 g/l para 40g/l e logo em seguida para 35g/l. Este set-point permanece até o instante t = 275h, quando o supervisor tenta recuperar o set-point determinado para a campanha e incrementa o set-point aplicado para 40 g/l e em seguida para 45 g/l. Esta situação se repetirá indefinidamente, a menos que o set-point da campanha seja expressamente diminuído a fim de retirar a reação de seu estado crítico, caracterizado por concentração de P = 45g/l, concentração de substrato S = 0.5g/l, concentração de biomassa C = 7g/l e volume V = 3,5l (valores aproximados).

Como conclusão do experimento 2, tem-se que a combinação dos dois modelos (DCNn e DCNc), uma para cada modo de operação normal e crítico, em um único supervisor melhora o comportamento do processo em ambas as situações (normal e crítica), validando a arquitetura proposta.

O terceiro experimento analisa o comportamento do supervisor DCN quando ocorre uma falha no processo. Neste caso, simulou-se um fechamento temporário (travamento) da válvula Fin durante os instantes t = 195h até t = 205h, cortando a entrada de substrato no reator. Novamente compara-se o desempenho do controle regulatório, mostrado na figura 16, com o desempenho do controle supervisório feito pelo modelo cognitivo da figura 9 (DCN) que é ilustrado nas figuras 17 e 18. Nestas figuras é mostrado apenas o comportamento das variáveis do processo a partir do instante t=150h. Analisando-se os gráficos na figura 16, observa-se uma parada na reação química logo após o fechamento da válvula Fin, com controle regulatório apenas. A válvula Fout também é fechada, a concentração de produto cai, mas é recuperada tão logo a válvula seja liberada. No entanto a retirada de produto do reator é mínima, as válvulas estão praticamente fechadas, (instantes t = 210h até t = 230h) até que ocorra a mudança de set-point em t = 230h. A partir deste ponto, o controle regulatório, tenta manter a concentração de produto, com uma retirada pequena (valores de sinal de controle Fin e Fout pequenos) até que novamente uma situação crítica é atingida (t = 280h) e as válvulas são fechadas, parando outra vez a reação.




Com o controle supervisório, o fechamento da válvula Fin, leva a uma diminuição do set-point de 40g/l para 35g/l enquanto durar o travamento da válvula, em seguida este set-point é restaurado, e a retirada de produto não é prejudicada (figuras 17 e 18). Quando ocorre a mudança de set-point em t = 230h os efeitos do fechamento da válvula Fin já não são mais sentidos, e como no experimento 2, o processo antecipa o estado crítico da reação e tenta recuperá-la como acontece no experimento 2.

Como resultado do experimento 3, conclui-se que apesar do supervisor não ter sido especificamente projetado para funcionar durante uma falha causada por agentes externos, este é capaz de amenizar a influência da falha sobre o desempenho do processo, validando mais uma vez a função da arquitetura proposta. Uma das vantagens do uso da arquitetura proposta está no fato de que novas funções tais que alarme de situação crítica para a reação e detecção de falhas como as que ocorrem nos experimentos mostrados podem ser facilmente incorporadas ao supervisor, através da criação de novos modelos cognitivos. Estes novos modelos cognitivos são conectados entre si, através de conceitos comuns, configurando-se num supervisor completo como o proposto na figura 9.

6 CONCLUSÃO

Este trabalho desenvolveu um sistema supervisório baseado em redes cognitivas dinâmicas, as quais são uma evolução dos mapas cognitivos, para o controle de um processo de fermentação. O supervisor representa uma abstração do conhecimento especialista sobre o comportamento do processo em operação normal e com restrições. A construção do mapa cognitivo foi obtida através de análise de resultados de simulação, utilizando exclusivamente conhecimento qualitativo, não sendo necessária a utilização de um modelo matemático do processo. O supervisor assim obtido é bastante simples, de fácil implementação e de fácil compreensão, e apresentou um bom desempenho nas situações simuladas.

Apesar de implementar apenas a ação de calcular set-points para o controle regulatório em modo de operação normal e crítico, o supervisor proposto pode ser facilmente expandido, para incorporar outras tarefas supervisórias tais que detecção de falhas, escalonamento de ganho, inferência, entre outras. Para isto basta que sejam construídos novos modelos baseados em mapas mentais do tipo DCN que sejam associados a estas tarefas e conectados entre si constituindo um supervisor completo como mostrado na figura 4. Atualmente, uma DCN para análise de tendência (inferência) de variáveis está em vias de desenvolvimento.

Uma das restrições à utilização de modelos baseados em mapas cognitivos, como por exemplo, os FCMs, na representação de sistemas dinâmicos mais frequentes na literatura é que os FCMs apesar de simples não são capazes de modelar os diversos tipos de relação existentes em sistemas dinâmicos, principalmente aqueles relacionados à realimentação e ao comportamento temporal das variáveis. De fato, um mapa cognitivo ou um FCM construído segundo a proposta original de Axerold (1976) e/ou Kosko (1986) somente representa relações causais monotônicas e simétricas. Para contornar este problema, foi proposto neste artigo o uso de diferentes tipos de conceito (nível, variação, decisão e seleção) e de relações (causal, fuzzy, implicação linguística) capazes de modelar todos os relacionamentos existentes entre as variáveis de um sistema dinâmico. Este novo tipo de mapa cognitivo, denominado rede cognitiva dinâmica, estende a abordagem proposta em (Miao et al, 2001) na medida em que utiliza novas formas de cálculo dinâmico dos arcos de um mapa cognitivo.

Esta nova ferramenta foi inserida em uma arquitetura em que partes do mapa cognitivo são acionadas continuamente e outras apenas a partir da ocorrência de eventos. Com isso foi possível emular as ações de um operador humano para a correta supervisão de uma malha de controle de processos. O sistema resultante supervisor + processo pode ser considerado um sistema híbrido em que é possível monitorar e calcular variáveis contínuas, ao mesmo tempo em que determinadas ações são realizadas a partir da ocorrência de eventos discretos.

Desta forma, a DCN apresentada é um sistema computacional inteligente com capacidade de inferência que abstrai e modela o conhecimento humano de forma estruturada por meio de relações de causa-efeito e/ou baseado em regras. Através dela, é possível modelar de forma similar comportamentos dinâmicos contínuos e/ou orientado a eventos. Além disso, apesar de não ter sido explorado neste artigo, é possível refinar a DCN (versão final modelo cognitivo), conferindo-lhe capacidade de generalização a partir de um conjunto de dados, através do uso técnicas de aprendizado baseado em metaheuríticas tais que algoritmos evolucionários, simulated annealing, enxames de partículas entre outras, ou ainda técnicas de aprendizado por reforço.

AGRADECIMENTOS

Os autores agradecem o apoio financeiro da Agência Nacional do Petróleo (ANP) através do CTPETRO/FINEP Financiadora de Estudos e Projetos: Programa de Recursos Humanos para o Setor de Petróleo e Gás Natural (PRH-ANP/MCT 10 UTFPR) e ao CNPq.

Artigo submetido em 24/03/2010 (Id.: 01119)

Revisado em 13/05/2010, 21/12/2010

Aceito sob recomendação da Editora Associada Profa. Emilia Villani

  • Aguilar J. (2004). Dynamic random fuzzy cognitive maps, Computación y Sistemas, Vol. 7, no. 4, pp. 260-270.
  • Ĺström, K.J. and B., Wittenmark (1995). Adaptive Control, 2nd ed., AddisonWesley, Reading, MA.
  • Axelrod, R. (1976). Structure of Decision: the Cognitive Maps of Political Elites. Princeton University Press, New Jersey.
  • Carvalho, J.P.B. (2001). Mapas cognitivos baseados em regras difusas: modelação e simulação da dinâmica de sistemas qualitativos. Dissertação de doutorado. Universidade Técnica de Lisboa, Lisboa, Portugal.
  • Chun-Mei, L. (2008). Using fuzzy cognitive map for system control. WSEAS Transactions on Systems, Vol. 7, no. 12, pp 1504-1515.
  • Dickerson, J.A. and B. Kosko (1994). Virtual worlds as fuzzy cognitive maps. Presence, Vol. 3, no. 2, pp. 173-189.
  • Fabro, J.A. and L.V.R. Arruda (2003). Fuzzy-neuro predictive control, tuned by genetic algorithms, applied to a fermentation process. Proceedings of the 2003 IEEE International Symposium on Intelligent Control, Houston, Texas.
  • Ghazanfari, M., Alizadeh, S. and Jafari, M., (2002). Using Fuzzy Expert System for solving fuzzy system dynamics. Proceeding of the first EuroAsia- Advances in Information and Communication Technology Conference, Shiraz, Iran.
  • Ghazanfari, M., S. Alizadeh, M. Fathian, and D.E. Koulouriotis (2007). Comparing simulated annealing and genetic algorithm in learning FCM. Applied Mathematics and Computation, Vol. 192, pp. 5668.
  • Haykin, S. (2000). Redes Neurais, Princípios e Prática Bookman C. Editora, São Paulo, 2Ş Edição.
  • Huang Y.C. and X.Z. Wang (1999). Application of fuzzy causal networks to waste water treatment plants, Chemical Engineering Science, Vol. 54, no. 13-14, pp. 2731-2738.
  • Jones, P.M., R. Roy and J. Corbett (2004). Modeling physical systems using fuzzy inference cognitive maps, IEEE Annual Meeting of Fuzzy Information Processing, NAFIPS '04., Vol. 2, pp. 533-538.
  • Kempowsky, T., A.Subias and J. Aguilar-Martin (2006). Process situation assessment: from a fuzzy partition to a finite state machine. Engineering Applications of Artificial Intelligence, Vol. 19, pp. 461 477.
  • Kosko, B., (1986). Fuzzy Cognitive Maps. Int. Journal of Man-Machine Studies, Vol. 24, pp. 65-75.
  • Kottas T.L., Y.S Boutalis and M.A. Christodoulou (2007). Fuzzy cognitive network: A general framework. Intelligent Decision Technologies, Vol. 1, pp. 183-196.
  • Koulouriotis, D.E., I.E. Diakoulakis and D.M. Emiris (2001). Learning fuzzy cognitive maps using evolution strategies: a novel schema for modeling and simulating high-level behavior. Proc. of IEEE Congress on Evolutionary Computation, pp. 364371.
  • Koulouriotis, D.E., I.E. Diakoulakis, D.M. Emiris and C.D. Zopounidis (2005). Development of dynamic cognitive networks as complex systems approximators: validation in financial time series. Applied Soft Computing, Vol. 5, no. 2, pp. 157-179.
  • Lee K.C. and S. Lee (2003). A cognitive map simulation approach to adjusting the design factors of the electronic commerce web sites. Expert Systems with Applications, Vol. 24, no. 1, pp. 1-11.
  • Maher, M.(1995). Modélisation et elaboration d'algorithms d'estimation et de commande: Application à um bioprocédé, Ph.D. dissertation, Université Paul Sabatier, LAAS/CNRS, Toulouse, France.
  • Melo Jr., W.S., M. A. Evangelista, L.V.R. Arruda, F. Neves Jr. and L.C.A. Rodrigues (2002). Controle preditivo multivariável baseado em modelo adaptativo aplicado a um fermentador alcoólico. Anais do XIV Congresso Brasileiro de Automática, Natal, RN, Brazil, pp. 28162821.
  • Miao, Y. and Z.Q. Liu (1999). On causal inference in Fuzzy Cognitive Maps. IEEE Transactions on Fuzzy Systems, Vol. 8, no. 1, pp. 107-119.
  • Miao, Y., Z.Q. Liu, C.K. Siew and C.Y. Miao (2001) Dynamical cognitive network an xxtension of fuzzy cognitive. IEEE Trans. on Fuzzy Systems, Vol. 9, no. 5, pp. 760-770.
  • Miao, Y., C.Y. Miao, X.H. Tao, Z.Q. Shen, and Z.Q. Liu (2010). Transformation of cognitive maps. IEEE Trans. on Fuzzy Systems, Vol. 18, no. 1, pp. 114-124.
  • Neves-Jr. F., L.V.R. Arruda and M. Mendonça (2009). A combined FCM-GA approach to supervise industrial process. IFAC-SAFEPROCESS - 3rd International Conference on Safety and Security Engineering, Barcelona, Spain.
  • Pajares, G. and J.M. de la Cruz (2006). Fuzzy cognitive maps for stereovision matching. Pattern Recognition, Vol. 39, no. 11, pp. 2101-2114.
  • Papageorgiou E., D.C. Stylios and P.P. Groumpos (2003). An Integrated two-level hierarchical system for decision making in radiation therapy based on fuzzy cognitive maps. IEEE Transactions on Biomedical Engineering, Vol 50, no. 12, pp. 1326-1339.
  • Papageorgiou, E.I., D.C. Stylios and P.P. Groumpos (2004). Active hebbian learning algorithm to train fuzzy cognitive maps. Int. Journal of Approximate Reasoning. Vol. 37, no. 3, pp. 219249.
  • Papageorgiou, E.I., D.C. Stylios and P.P. Groumpos (2007). Novel architecture for supporting medical decision making of different data types based on fuzzy cognitive map framework. Proc. of the 29th Annual Int. Conference of the IEEE EMBS, Lyon, France.
  • Passino, M.K. and S. Yourkovich (1999). Fuzzy Control, Addison - Wesley Pub. Co., USA.
  • Petalas, Y.G., K.E. Parsopoulos and M.N. Vrahatis (2009). Improving fuzzy cognitive maps learning through memetic particle swarm optimization, Soft Computing, Vol. 13, pp. 7794.
  • Perusich, K (1996) Fuzzy cognitive maps for policy analysis. In Proc. Int. Symp. Technol. Soc. Tech. Expertise Public Decisions, New York, pp. 369373.
  • Stach, W., L. Kurgan, W. Pedrycz, and R. Marek (2005) Genetic learning of fuzzy cognitive maps. Fuzzy Sets System, Vol. 153, pp. 371401.
  • Stylios, D.C. and P.P. Groumpos (2000). Fuzzy cognitive maps in modeling supervisory control systems. Journal of Intelligent & Fuzzy Systems, Vol. 8, no. 2, pp. 8398.
  • Stylios, D.C. and P.P. Groumpos (2004). Modeling complex systems using fuzzy cognitive maps. IEEE Trans. on SMC part A: Systems and Humans, Vol. 34, no. 1, pp. 115162.
  • Stylios D.C., V.C. Georgopoulos, G.A. Malandraki and S. Chouliara (2008). Fuzzy cognitive map architectures for medical decision support systems. Appl. Soft Computing, Vol. 8, no. 3, pp. 1243-1251.
  • Taber, R. (1991). Knowledge processing with fuzzy cognitive maps. Expert Systems with Applications, Vol. 21, pp. 8387.
  • Wang, X.Z., S.A. Yang, E. Veloso, M.L. Lu, and C. McGreavy (1995). Qualitative process modeling-a fuzzy signed directed graph method. Computer Chem. Engineering, Vol. 19, pp 735-740.
  • Zadeh L.A, (1992). An introduction to fuzzy logic applications in intelligent systems, 1st edn. Kluwer Academic Publisher, Boston.
  • Zhang J.Y., Z.Q. Liu and S. Zhou (2006). Dynamic domination in fuzzy causal network. IEEE Transactions on Fuzzy Systems, Vol. 14, no. 1, pp. 42 - 57.

Datas de Publicação

  • Publicação nesta coleção
    26 Set 2011
  • Data do Fascículo
    Ago 2011

Histórico

  • Recebido
    24 Mar 2010
  • Revisado
    21 Dez 2010
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br