Acessibilidade / Reportar erro

Estimativa do perfil da concentração de clorofila em águas naturais através de um perceptron de múltiplas camadas

Resumos

Estimativa do perfil de concentração de clorofila, em águas naturais, a partir da radiação emergente na superfície de um corpo d'agua, com o uso de rede neural artificial do tipo Perceptron de Múltiplas Camadas. A concentração de clorofila está relacionada com os coeficientes de absorção e espalhamento via modelos bio-ópticos. O treinamento da rede é formulado como um problema de otimização, no qual a atualização das variáveis livres da rede (pesos, viés e parâmetros de cada função de ativação) é feita através do método quasi-Newton.

Perceptron de múltiplas Camadas; método quasi-Newton; concentração de clorofila; equação de transferência radiativa


In this work the average profile of chlorophyll concentration is estimated from the emitted radiation at the surface of natural waters. This is performed through the use an Artificial Neural Network of Multilayer Perceptron type to act as the inverse operator. Bio-optical models are used to correlate the chlorophyll concentration with the absorption and scattering coefficients. The network training is formulated as an optimization problem, in which the update of the free variables of network (weights, viéses and each slope of the activation functions) is performed through the quasi-Newton method.

Multilayer perceptron; quasi-Newton method; chlorophyll concentration; radiative transfer equation


11 Agradeço a CAPES pelo auxilio financeiro durante a realização do doutorado.

F. Dall CortivoI; E. S. ChalhoubII; H. F. Campos VelhoII

IPrograma de Pós-Graduação em Computação Aplicada, CAP, Instituto Nacional de Pesquisas Espaciais, INPE, Av. dos Astronautas, 1758, 12227-010 São José do Campos, SP, Brasil. haroldoJ@lac.inpe.br

IILaboratório Associado de Computação e Matemática Aplicada, LAC, Instituto Nacional de Pesquisas Espaciais, INPE, Av. dos Astronautas, 1758, 12227-010 São José do Campos, SP, Brasil

RESUMO

Estimativa do perfil de concentração de clorofila, em águas naturais, a partir da radiação emergente na superfície de um corpo d'agua, com o uso de rede neural artificial do tipo Perceptron de Múltiplas Camadas. A concentração de clorofila está relacionada com os coeficientes de absorção e espalhamento via modelos bio-ópticos. O treinamento da rede é formulado como um problema de otimização, no qual a atualização das variáveis livres da rede (pesos, viés e parâmetros de cada função de ativação) é feita através do método quasi-Newton.

Palavras-chave: Perceptron de múltiplas Camadas, método quasi-Newton, concentração de clorofila, equação de transferência radiativa.

ABSTRACT

In this work the average profile of chlorophyll concentration is estimated from the emitted radiation at the surface of natural waters. This is performed through the use an Artificial Neural Network of Multilayer Perceptron type to act as the inverse operator. Bio-optical models are used to correlate the chlorophyll concentration with the absorption and scattering coefficients. The network training is formulated as an optimization problem, in which the update of the free variables of network (weights, viéses and each slope of the activation functions) is performed through the quasi-Newton method.

Keywords: Multilayer perceptron, quasi-Newton method, chlorophyll concentration, radiative transfer equation.

1. Introdução

Neste trabalho a interação de um feixe de fótons com um corpo d'agua é representada pela Equação de Transferência Radiativa (ETR). Dadas as condições de contorno, o termo fonte e as propriedades óticas inerentes, é possível resolver a ETR e, assim, determinar a quantidade de partículas (fótons) que estão emergindo na superfície da água após a interação com o meio. Ao abordar o problema dessa forma, caracteriza-se o que é chamado de problema direto. O correspondente problema inverso consiste em determinar uma ou mais propriedades físicas (fontes internas, condições de contorno, propriedades óticas) a partir das medidas radiométricas (radiâncias) emergentes e/ou do interior do corpo d'agua. A resolução numérica da ETR é realizada com o código PEESNA [3], o qual implementa o método SN analítico (ASN) [1].

O problema inverso pode ser formulado como um problema de otimização, buscando soluções regularizadas. Essa abordagem, chamada de implícita, foi utilizada para resolver problemas, nos quais se desejou estimar perfis verticais da concentração de clorofila [21]. Apesar dos bons resultados obtidos, a complexidade do problema inverso/direto fez necessário a utilização de processamento paralelo para a resolução [21, 23]. A resolução de ótica hidrológica inversa por esta estratégia requer enorme custo computacional. Gordon [9] faz uma revisão de técnicas de solução em vários problemas inversos em Ótica Hidrológica.

Uma estratégia para reduzir o tempo computacional na resolução deste tipo de problema inverso é a utilização de Redes Neurais Artificiais (RNAs) [7, 19, 5], devido a capacidade intrínseca desses sistemas em aproximar funções [12].

Estimativas da concentração de clorofila de superfície em águas naturais (além de outras propriedades), a partir da reflectância medida por satélites, já tem sido realizadas através de RN As [14, 13, 11]. Nesses trabalhos, os padrões de entrada da rede são formados pelas reflectâncias medidas nas bandas (comprimentos de onda) do visível, sendo que o valor médio de cada banda corresponde a uma entrada da rede. Em nosso estudo, os padrões de entrada necessários para treinar e validar a rede são formados pela radiação (radiância) emergente na superfície, sendo que cada direção (polar) discreta considerada corresponde a uma entrada da rede. O método de inversão baseado em RNA será testado com medidas de radiâncias sintéticas, em que radiâncias são calculadas a partir da solução da ETR (problema direto). Para os coeficientes de absorção e espalhamento, são empregados modelos bio-ópticos [16, 10], nos quais estes coeficientes são dados em função da concentração de clorofila. A solução inversa é obtida através de uma RNA do tipo Perceptron de Múltiplas Camadas (MLP). O treinamento da rede é feito através da minimização do funcional de diferença quadrática entre as respostas dadas pela rede os padrões de saída conhecidos. A busca mínima do funcional é feita através do método quasi-Newton [5, 6]. O conjunto de parâmetros estimados no processo de treinamento da rede inclui, além de pesos e viés, o parâmetro das funções de ativação.

2. Formulação do Problema Direto

A ETR é um modelo matemático utilizado para representar a interação de um feixe de luz (fótons) com um corpo d'agua. Em muitas aplicações, principalmente aquelas que envolvem o estudo da interação desse feixe de luz com águas oceânicas, é plausível considerar que o corpo d'agua apresente variações significativas, com relação aos seus constituintes, apenas com a profundidade. Neste caso, denomina-se o que é chamado de geometria plano-paralela. A ETR para este tipo de geometria, com dependência espectral, azimutal e polar, e espalhamento anisotrópico é dada por

em que I(τ, µ, φ, λ) representa a intensidade do feixe de radiação, τ є (0, ζ), a variável ótica, no qual ζ é a espessura ótica do meio, µ є [-1, 1], φ є [0, 2π] e, representam, respectivamente, o co-seno do ângulo polar medido a partir do eixo positivo τ e o ângulo azimutal, os quais especificam a direção de propagação Θ da radiação no meio e λ é o comprimento de rada do fóton. O termo 6(τ, λ) é o coeficiente de espalhamento, c(t, λ) = α(τ, λ) + 6(τ, λ) é ο coeficiente de atenuação do feixe em que α(τ, λ) é o coeficiente de absorção. Por fim, o termo p(cos Θ, λ) é chamado de função de fase, e representa o espalhamento de um feixe incidente na direção {µ', φ', λ} a ser espalhado na direção {µ, φ, λ}, e S0(τ, λ) é uma fonte interna de radiação. As condições de contorno, associadas ao problema abordado, são dadas por

em que e I0 é a radiância incidente na superfície, µ0 é o cosseno do ângulo polar de incidência, φ0 é o ângulo azimutal de inci dência e δ( ·) éa função delta de Dirac.

Para resolver o problema definido pela equação (2.1), sujeita às condições dadas pelas equações (2.2), efetua-se uma discretização espacial e espectral [2]. Há um desacoplamento para cada comprimento de onda e aqui a dependência do comprimento de onda será tomado um valor médio, isto é ,

A fim de simplificar a notação não será grifado a dependência do comprimento λ de radiação I(τ, µ, φ) [4] em componentes espalhada Is (τ, µ, φ) e não-espalhada !«(τ, µ, φ) e, dessa forma, a solução I(τ, µ, φ) passa a ser expressa como sendo a soma dessas componentes,

Para obter a solução para a componente não-espalhada, considera-se 6(τ, λ) = 0 na equação (2.1), sujeito às condições (2.2) e, então, resolve-se a equação diferencial parcial resultante. Já para a componente espalhada Ι8(τ, µ, φ), inicialmente aproxima-se a função de fase de Henyey-Greenstein [15] em uma série finita de funções de Legendre associadas, e em seguida utiliza-se a decomposição de Fourier em co-senos [4], sobre o ângulo azimutal, de modo a gerar L +1 equações integro-equação íntegro-diferencial é aproximado pelo método da colocação, o qual consiste em substituir a integral angular por um esquema de quadratura de Gauss-Legendre. Essa aproximação produz um conjunto de N equações diferenciais ordinárias de primeira ordem para cada ângulo azimutal. A solução analítica, um desses conjuntos, é obtida através do método ASN, que é baseado na decomposição espectral da matriz de espalhamento. Para a aproximação numérica é utilizado o código PEESNA [3], o qual implementa o método ASN.

A relação entre os coeficientes de absorção e espalhamento com a concentração de clorofila é feita através de modelos bio-ópticos. Segundo [16] e [10], as expressões que relacionam a concentração de clorofila com a absorção e o espalhamento são dadas, respectivamente, por

em que aλwe bλw são, respectivamente, o coeficiente de absorção e espalhamento da água pura, cujos valores podem ser encontrados em [17.λ representa o comprimentode onda, αλc é um coeficiente de absorção específico da concentração de clorofila, cujo valor pode ser encontrado em [20], e C(t) éa concentração de clorofila, a qual, para o presente trabalho, é considerada constante. Por fim, mais detalhes acerca da solução para o problema definido nessa seção podem ser encontrados em [2].

3. Perceptron de Múltiplas Camadas

Um MLP é obtido através da conexão de vários neurônios entre si, de modo a formarem uma rede. Essa rede é constituída de uma camada de entrada, uma ou mais camadas ocultas, e uma camada de saída. Nesse modelo de rede, a informação é passada adiante camada por camada até atingir a camada de saída. A informação que chega em cada uma das unidades de processamento e que deverá ser processada por essas unidades, é definida matematicamente por em que xyrepresenta as informações de entrada, as conexões entre os neurônios (sinapses), e 6j é chamado de nível de viés, e pode ser interpretado como um valor que é ajustado a fim de "complementar" alguma atividade presente no neurônio biológico, mas não presente no neurônio artificial. Essa informação é processada através de uma função de ativação φ, a qual tem por finalidade restringir a amplitude do sinal de saída. Assim, o sinal que segue para o próximo neurônio é definido como y = φ(ν). Comumente Seio empregcicicis como funções de ativação: a função sigmóide, a função tangente hiperbólica e a função linear, definidas, respectivamente, por

Redes do tipo MLPs requerem um treinamento do tipo supervisionado, ou seja, com a presença de um professor que tem o conhecimento do ambiente que a rede deverá aprender. Esse ambiente é representado por um conjunto de entradas e saídas conhecidas. Durante a fase de aprendizagem, o professor apresenta uma determinada entrada à rede, que por sua vez processa a informação apresentada e devolve uma saída. A saída calculada pela rede é comparada com a saída desejada, e com isso é gerado um sinal de erro, o qual é propagado para trás (retropropaga-ção) através do algoritmo de treinamento. Durante a retropropagação do erro, o algoritmo de treinamento, baseado em alguma regra, faz uma correção nas variáveis livres da rede de modo a corrigir os valores dos seus parâmetros livres, a fim de minimizar o erro cometido. Dessa forma, espera-se que a rede aprenda a fazer a correta associação entre os padrões de entrada e os padrões de saída.

4. Formulação do Problema Inverso

A formulação para o treinamento, descrita abaixo, segue a adotada em [6], e nessa formulação, o treinamento é supervisionado e do tipo batch [12].

Para o treinamento, foi definido um funcional J(·) que é dado pela soma das diferenças quadráticas entre os padrões de saída utilizados para o treinamento e as respostas obtidas pela rede para cada padrão de entrada, e para o qual buscou-se um valor mínimo, ou seja,

em que são matrizes que contem, respectivamente, os padrões de entrada para o treinamento, os pesos sinápticos, os biases e os parâmetros das M de saída, T representa o número total de padrões de treinamento, Otij e Onij representam, respectivamente, cada entrada das matrizes que contem os padrões de saída para o treinamento e as saídas calculadas pela rede. Outros detalhes em [6].

Note que é necessário incluir restrições às variáveis que estão sendo otimizadas, especialmente às relacionadas com o parâmetro das funções de ativação. Pela definição das funções sigmóide e tangente hiperbólica, estes parâmetros devem ser positivos e, portanto, os "valores ótimos" para esses parâmetros devem satisfazer

em que é amax um valor máximo prê-defmido, a fim de evitar que este parâmetro atinja uma ordem de grandeza elevada, tornando a contribuição do termo exponen-cial desprezível, ou então, gerar um underflow. Se for utilizada a função de ativação linear, a restrição dada pela equação (4.2) pode ser substituída por

em que e amax e amax são valores mínimos e máximos, respectivamente, pré-definidos a fim de evitar um overflow.

O treinamento da rede pode envolver uma função com múltiplos mínimos locais, o que torna difícil garantir que será encontrado um mínimo global. Diante disso, parece ser atraente a idéia de reduzir o espaço de busca e, então, buscar por um mínimo local dentro desse sub-espaço gerado, desde que esse produza bons resultados. A redução do espaço de busca é obtido colocando restrições nas demais variáveis a serem otimizadas, ou seja, nos pesos e nos viés. Portanto, durante o processo de treinamento são buscados valores para a matriz W e para matriz/vetor B de modo que estes satisfaçam as restrições

em que w*k está associado às restrições aos pesos, b*l está associado às restrições aos viés. Outra vantagem que surge com a inclusão dessas restrições nos pesos e viés, é o fato que é possível evitar que esses parâmetros assumam ordens de grandeza elevadas e, assim, evitar a saturação dos neurônios, fato esse não desejado pois prejudica o treinamento. Portanto, durante o treinamento da rede, o método utilizado busca um mínimo para o funcional definido na equação (4.1), sujeito às condições expressas pelas equações (4.2) e/ou (4.3) e/ou (4.4).

Neste trabalho, para a minimização do funcional definido na equação (4.1), é utilizado o método quasi-Newton implementado na sub-rotina E04UCF da biblioteca NAG, desenvolvida por Numerical Algorithms Group - NAG [18]. Optou-se pela utilização da biblioteca citada em função da robustez da mesma para solução de problemas de otimização não-lineares, e pela possibilidade da inclusão das restrições comentadas anteriormente, ver [5, 6].

Para o treinamento, as variáveis a serem otimizadas (pesos, viés e parâmetro das funções de ativação) são organizadas em um vetor X = [

]T. Durante esse processo, a biblioteca procura um valor X * par a X, de modo que

e ainda leva em consideração que X* satisfaz as condições expressas pelas equações (4.2) e/ou (4.3) e/ou (4.4). Agora, se X k+1 = X k + ΔX k aproxima o ρ onto X * na (k + 1)-êsima iteração, então, fazendo a aproximação de primeira ordem em série de Taylor para a equação (4.5) em torno do ponto Xk+1, obtém-se Xk+1 = Xk + H-1VJ (·, Xk), em que -1 é a matriz Hessiana inversa em X = Xk. Na prática, a inversa -1 não é calculada de forma exata, e sim de uma forma aproximada. Para isso, considere que Xk é um ponto inicial e -1 é uma aproximação da Hessiana inversa, e que respeita as condições definidas em [8]. Então, primeiramente, o

J Xk busca definida pela expressão dk = --1∇J(· ,Xk), posteriormente atualiza Xk

de modo que Xk+1 = Xk + akdk, em que ak éo tamanho do passo e, por fim, atualiza k-1 através da expressão

em que . Detalhes da biblioteca e do método quasi-Newton podem ser encontrados em [18] e [8], respectivamente.

5. Conjuntos de Treinamento, Validação e Treinamento da Rede

Nesta seção descreve-se como são gerados os conjuntos de treinamento e de validação. Como o formalismo matemático para a formulação do problema de treinamento foi descrito na seção anterior, aqui são abordados apenas os detalhes do procedimento de treinamento.

5.1. Conjuntos de Treinamento e Validação

Ambos conjuntos, de treinamento e de validação, utilizados neste trabalho, são obtidos a partir da resolução do problema exposto na Seção 2.

Para este trabalho, adotou-se uma única região espacial e nessa região (profundidade ótica) considerou-se que o perfil da concentração de clorofila C é constante, ou seja, um valor médio na região. A partir do parâmetro C, é possível resolver o problema definido naquela seção, determinando a radiação emergente na superfície após a interação dessa com o meio, em direções (co-seno do ângulo polar) escolhidas a priori São esses valores da radiação emergente que constituirão os padrões de entrada para o treinamento e validação/teste da rede. As direções discretas adotadas correspondem a um total de dez igualmente espaçadas e pertencentes ao intervalo θ ∈ [90°, 135°]. Para o ângulo azimutal adotou-se φ0 = 0º. Com relação à concentração de clorofila adotou-se C ∈ [0.01, 10.0].

Para gerar o conjunto de treinamento, esse intervalo foi discretizado como C = [0.01, 0.02, 0.03, ... , 0.1, 0.15, 0.2, 0.3, 0.4, ... , 9.8, 9.9, 10.0], gerando 110 valores discretos22) A diferença no tamanho do passo na discretização é devido a variação significativa da razão b( · )/c( · para valores baixos de C . Já para gerar o conjunto de validação, adotou-se uma discretização igualmente espaçada com um tamanho de passo de AC = 0.01, gerando 1000 valores discretos. Portanto, cada padrão de entrada (solução do problema para cada C C gerou o padrão de entrada. Note que o número total de padrões no conjunto de treinamento é 110, e no conjunto de validação é 1000.

Por fim, vale lembrar que cada valor de C orresponde a um dado de entrada, e a radiação emergente, calculada pelo modelo, corresponde a saída (problema direto). Já para a rede, a radiação emergente passa a ser a entrada e o valor de C radiação emergente, calculada pelo modelo, corresponde a saída (problema direto). Já C ser a saída (problema inverso).

5.2. Treinamento da Rede

Como se está utilizando dados sintéticos para treinar a rede, é necessário que os valores da radiação retornados pelo problema direto, sejam corrompidos com ruído, a fim de simular possíveis erros de medidas. Para isso, são considerados três níveis de ruído gaussiano: R1 = 5%, R2 = 10% e R3 = 20%. Em seguida, os padrões do conjunto de treinamento são colocados em ordem aleatória e, então, divididos em três grupos (G1; G2 e G3) com a mesma quantidade de padrões em cada grupo. Cada um desses grupos recebeu um dos níveis de ruído, sendo:R1 para o G1, R2 para G2 e R3 par a G3. Durante o treinamento esses grupos são apresentados à rede.

O critério de parada adotado é o da validação cruzada [12], sendo que a cada dez iterações da função objetivo o procedimento de treinamento é pausado, e todo o conjunto de validação é apresentado à rede quatro vezes. Na primeira vez, todos R1 à rede. O mesmo se deu na segunda, terceira e quarta vez, sendo que na última é utilizado um nível de ruído R4 = 13%. Este nível, não presente no treinamento, é utilizado a fim de agregar à rede uma maior generalização.

Cada vez que o processo de validação é realizado, o desempenho da rede é testado e são armazenadas as variáveis da rede, bem como o número de acertos e o valor total do erro relativo. Ao fim do processo, aquelas variáveis que produziram o maior número de acertos e o menor erro relativo são recuperadas e adotadas como sendo variáveis ótimas.

Para a contagem das respostas corretas da rede, adotou-se o critério de que o valor de C estimado pela rede deve estar no intervalo C - R · C ≤ Cr ≤ C + R · G, em que R é o nível de ruído nos dados de entrada e Cr é o valor da concentração de clorofila estimado pela rede. Além disso, a rede utilizada é constituída de uma camada de entrada com dez neurônios, uma camada oculta com 13 neurônios e uma camada de saída com apenas um neurônio. A função de ativação utilizada em todos os neurônios da camada oculta foi a função sigmóide Ф(vi) = 1/(1 + exp(-aiVj)) e na camada de saída foi utilizada a função linear Ф(vi) = aiVi.

Para as restrições defnidas na equação (4.4), adotou-se wkmin = blmin = wkmin =blmin = 45, para a restrição (4.2), adotou-se amax 20 e, por fim, para a restrição definida pela equação (4.3), adotou-se amax =amax = 20. Esses valores foram determinados durante o treinamento através de experimentos, e são capazes de representar uma região do espaço de busca no qual é possível obter boas respostas.

6. Resultados

Na resolução do problema, foram considerados cinco valores para λ = 500, 550, 600,650, 700 nm, no entanto, por conveniência, são apresentados apenas os resultados correspondentes à λ = 600 nm. Para λ = 500 nm, os resultados foram extremamente pobres e não expressaram nenhuma confiança, e para λ = 550 nm, os resultados melhoraram um pouco, no entanto, a taxa de acerto ficou abaixo de 71%. Apesar de comprimentos de onda λ > 600 nm apresentarem bons resultados, estes não são adequados, pois o índice de absorção da água aumenta consideravelmente [15], fazendo com que a radiação eletromagnética não penetre mais do que alguns poucos metros.

A dificuldade na obtenção de bons resultados para comprimentos de onda abaixo de λ = 600 nm pode ser analisado na Figura 1. A Figura 1(a) mostra que há uma "separação" entre cada curva de radiação até aproximadamente C = 3 e, após esse valor, as curvas de radiação praticamente se sobrepõe. Por outro lado, essa sobreposição não ocorre na Figura 1(b), na qual é possível observar que as curvas da radiação para cada valor de C onsiderado são distintas.


Uma análise quantitativa acerca da sensibilidade da radiação emergente com a variação da concentração de clorofila é apresentada na Tabela 2. Nessa tabela são apresentados os resultados obtidos através da expressão33 Os valores de radiância apresentados das Figuras 1(a) e 1(b) foram normalizados para ter a mesma ordem de grandeza, a fim de facilitar a comparação.

em que ςC = 1. Como é possível observar pelos resultados, a variação AI para λ = 600 é maior e mais significativa quando comparada a variação AI para λ = 500. A não sobreposição das curvas apresentadas na Figura 1(b), ou então, a maior sensibilidade da radiação emergente com a variação da concentração de clorofila é o fator fundamental que contribui melhora no desempenho da rede.

Na Tabela 3, são apresentados, para cada nível de ruído considerado e para osproblemas associados aos comprimentos de onda λ = 500, 550 e 600 nm, as taxas de acerto (TA) e os erros quadráticos médios (EQM),calculados pela expressão

onde Np é o número total de padrões no conjunto de validação, e chle e chln são, respectivamente, as concentrações de clorofila exatas e estimadas pela rede neural, sobre o conjunto de validação. Vale enfatizar que, como os níveis de ruído definem as faixas de acertos, para o intervalo com ruído de 10% considera-se como aceitáveis valores de inversão com desvio de até 10%, diferentemente da faixa de 5% de ruído -onde só se considera aceitável inversões com desvio máximo de 5%. Assim é possível encontrar mais acertos em experimentos com maior nível de ruído (ver Tabela 3).

O menor valor de EQM, mostrado nesta tabela, complementa a análise e ajuda a demonstrar que os melhores resultados são os gerados com λ = 600 nm. Esta melhora está associada à distância (separação) que existe entre cada curva da Fig. 1(b). Esta separação evita a confusão da rede durante a associação do padrão de entrada ao verdadeiro padrão de saída.

A Figura 2 mostra os perfis de clorofila obtidos pela rede para o conjunto de validação, para cada um dos níveis de ruído considerados. O eixo das ordenados representa as concentrações de clorofila e o eixo das abscissas representa cada um dos padrões do conjunto de validação. Nas figuras, as linhas tracejadas representam o limite de erro na estimativa de C pela rede. A linha cheia representa cada perfil recuperado. Optou-se pela divisão dos gráficos a fim de melhorar a visualização dosresultados, principalmente para baixas concentrações de C.


7. Conclusões

A utilização do parâmetro das funções de ativação ajustáveis é uma técnica pouco abordada na literatura, e sua utilização tem se mostrado eficiente, pois cada neurônio pode se especializar em uma determinada região do conjunto de treinamento. Isso melhora a capacidade de generalização da rede e a robustez a dados ruidosos.

Um treinamento eficiente (de baixo custo computacional), juntamente com os bons resultados obtidos, mostram que a RNA é uma técnica promissora na resolução de problemas inversos em ótica hidrológica.

Fótons com comprimento de onda acima de 650 nm tem baixa penetração no corpo de água (são absorvidos em até 5 m). A radiância para fótons abaixo de 550 nm, para diferentes concentrações de clorofila, colapsam em uma mesma curva (ver Figura 1(a)). A fim de garantir uma certa penetração da radiação, com distintas curvas de radiâncias para diferentes concentrações de clorofila adotou-se o intervalo [550 nm, 650 nm].

O parágrafo acima ilustra a dificuldade intrínseca da estimativa de propriedades óticas em águas naturais. A dificuldade apontada para o comprimento de onda λ = 500 nm está associado ao colapso, ou ainda, a baixa sensibilidade da radiação emergente com a concentração de clorofila. Esta é uma restrição associada à física do problema e não da metodologia de inversão. Para redes neurais, várias configurações e diferentes valores iniciais para as variáveis foram utilizadas, sendo que, em nenhuma dessas situações, foi possível melhorar os resultados apresentados na Tabela 3. Já, para o problema no qual foi considerado λ = 600 nm, o aprendizado da rede se deu de forma rápida, sendo pouco sensível ao número de neurônios na camada oculta e aos valores iniciais das variáveis da rede. Em trabalhos futuros, pretende-se retomar o problema utilizando um fator de correção para tentar atenuar o fator de decaimento exponencial da radiação (efeito da absorção) [22].

Referências

[1] E.S. Chalhoub, "O Método das Ordenadas Discretas na Solução da Equação de Transporte em Geometria Plana com Dependência Azimutal", Tese de Doutorado, IPEN, USP, São Paulo, SP, 1997.

[2] E.S. Chalhoub, Discrete-ordinates solution for uncoupled multi-wavelength radiative transfer problems, J. Quant. Spec. Rad. Trans., 92 (2005), 335 349.

[3] E.S. Chalhoub, H.F. Campos Velho, R.D.M. Garcia, M.T. Vilhena, A comparison of radiances generated by selected methods of solving the radiative-transfer equation, Trans. Theory Stat. Phys., 32, No. 5 7 (2003), 473 503.

[4] S. Chandrasekhar, "Radiative Transfer", Dover Publications, New York, 1950.

[5] F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, Comparison of two learning strategies for a supervised neural network, em "1st International Symposium on Uncertainty Quantification and Stochastic Modeling. Uncertainties 2012", 366 380, 2012.

[6] F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, A committee of MLP with adaptive slope parameter trained by the quasi-Newton method to solve problems in hydrologic optics, em "IEEE International Joint Conference on Neural Networks. IJCNN 2012. (IEEE World Congress on Computational In-teligence)", 2159 2166, 2012.

[7] F. Dall Cortivo, E.S. Chalhoub, J.D.S. Silva, H.F. Campos Velho, Estimativa do albedo de espalhamento simples usando uma rede neural de múltiplas camadas, em "Anais do XXXIII CNMAC", 111 !17. SBMAC, 2010.

[8] J.E. Dennis, J.J. More, Quasi-Newton methods, motivation and theory, SIAM Review, 19, No. 1 (1977), 46 89.

[9] H.R. Gordon, Inverse methods in hydrologic optics, Oceanology, 44, No. 1 (2002), 958.

[10] H.R. Gordon, A.Y. Morel, "Remote Assessment of Ocean Color for Interpretation of Satellite Visible Imagery, A Review", Springer-Verlag, New York, 1983.

[11] L. Gross, S. Thiria, R. Frouin, B.G. Mitchell, Artificial neural networks for modeling the transfer function between marine reflectance and phytoplankton pigment concentration, J. Geophys. Res., 105, No. C2 (2000), 3483 3495.

[12] S. Haykin, "Redes Neurais", Bookman, Porto Alegre, 2001.

[13] S. Helmut, R. Doerffer, Neural network for emulation of an inverse model -operational derivation of Case II water properties from MERIS data, Int. J. Rem. Sens., 20, No. 9 (1999), 1735 1746.

[14] L.E. Keiner, C.W. Brown, Estimating oceanic chlorophyll concentrations with neural networks, Int. J. Rem. Sens., 20, No. 1 (1999), 189 194.

[15] CD. Mobley, "Light and Water", Academic Press, California, 1994.

[16] A.Y. Morel, Light and marine photosynthesis: a spectral model with geochemi-cal and climatological implications, Prog. Oceanogr., 26, No. 3 (1991), 263 306.

[17] A.Y. Morel, L. Prieur, Analysis of variations in ocean color, Limnol. Oceanogr., 22, No. 4 (1977), 709 722.

[18] NAG, "Fortran Library Manual", Numerical Algorithms Group, Oxford, 1995.

[19] R.C. Oliveira, N.I.A. Acevedo, A.J. Silva Neto, L. Biondi Neto, Aplicação de um comitê de redes neurais artificiais para a solução de problemas inversos em Transferência Radiativa, TEMA - Tend. Mat. Apl. Comput, 11, No. 2 (2010), 171-182.

[20] L. Prieur, S. Sathyendranath, An optical classification of coastal and oceanic waters based on the specific spectral absorption curves of phytoplankton pigments, dissolved organic matter, and other particulate materials, Limnol. Oceanogr., 26, No. 4 (1981), 671 689.

[21] R.P. Souto, "Recuperação de Perfis Verticais de Propriedade Óticas Inerentes a partir da Radiação Emergente da Água", Tese de Doutorado, CAP, INPE, São José dos Campos, SP, 2006.

[22] R.P. Souto, H.F. Campos Velho, S. Stephany, Reconstruction of chlorophyll vertical profiles from in-situ radiances using the ant colony meta-heuristic, "Iberian Latinamerican Congress on Computational Methods", Anais do XXV CILAMCE, 2004. 1, Recife (PE), Brasil (2004).

[23] R.P. Souto, H.F. Campos Velho, S. Stephany, M. Kampel, Chlorophyll concentration profiles from in situ radiances by ant colony optimization, J. Phys.: Conf. Series, 124, No. 1 (2008).

Recebido em 31 Janeiro 2012;

Aceito em 30 Novembro 2012.

  • [1] E.S. Chalhoub, "O Método das Ordenadas Discretas na Solução da Equação de Transporte em Geometria Plana com Dependência Azimutal", Tese de Doutorado, IPEN, USP, São Paulo, SP, 1997.
  • [2] E.S. Chalhoub, Discrete-ordinates solution for uncoupled multi-wavelength radiative transfer problems, J. Quant. Spec. Rad. Trans., 92 (2005), 335 349.
  • [3] E.S. Chalhoub, H.F. Campos Velho, R.D.M. Garcia, M.T. Vilhena, A comparison of radiances generated by selected methods of solving the radiative-transfer equation, Trans. Theory Stat. Phys., 32, No. 5 7 (2003), 473 503.
  • [4] S. Chandrasekhar, "Radiative Transfer", Dover Publications, New York, 1950.
  • [5] F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, Comparison of two learning strategies for a supervised neural network, em "1st International Symposium on Uncertainty Quantification and Stochastic Modeling. Uncertainties 2012", 366 380, 2012.
  • [6] F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, A committee of MLP with adaptive slope parameter trained by the quasi-Newton method to solve problems in hydrologic optics, em "IEEE International Joint Conference on Neural Networks. IJCNN 2012. (IEEE World Congress on Computational In-teligence)", 2159 2166, 2012.
  • [7] F. Dall Cortivo, E.S. Chalhoub, J.D.S. Silva, H.F. Campos Velho, Estimativa do albedo de espalhamento simples usando uma rede neural de múltiplas camadas, em "Anais do XXXIII CNMAC", 111 !17. SBMAC, 2010.
  • [8] J.E. Dennis, J.J. More, Quasi-Newton methods, motivation and theory, SIAM Review, 19, No. 1 (1977), 46 89.
  • [9] H.R. Gordon, Inverse methods in hydrologic optics, Oceanology, 44, No. 1 (2002), 958.
  • [10] H.R. Gordon, A.Y. Morel, "Remote Assessment of Ocean Color for Interpretation of Satellite Visible Imagery, A Review", Springer-Verlag, New York, 1983.
  • [11] L. Gross, S. Thiria, R. Frouin, B.G. Mitchell, Artificial neural networks for modeling the transfer function between marine reflectance and phytoplankton pigment concentration, J. Geophys. Res., 105, No. C2 (2000), 3483 3495.
  • [12] S. Haykin, "Redes Neurais", Bookman, Porto Alegre, 2001.
  • [13] S. Helmut, R. Doerffer, Neural network for emulation of an inverse model -operational derivation of Case II water properties from MERIS data, Int. J. Rem. Sens., 20, No. 9 (1999), 1735 1746.
  • [14] L.E. Keiner, C.W. Brown, Estimating oceanic chlorophyll concentrations with neural networks, Int. J. Rem. Sens., 20, No. 1 (1999), 189 194.
  • [15] CD. Mobley, "Light and Water", Academic Press, California, 1994.
  • [16] A.Y. Morel, Light and marine photosynthesis: a spectral model with geochemi-cal and climatological implications, Prog. Oceanogr., 26, No. 3 (1991), 263 306.
  • [17] A.Y. Morel, L. Prieur, Analysis of variations in ocean color, Limnol. Oceanogr., 22, No. 4 (1977), 709 722.
  • [18] NAG, "Fortran Library Manual", Numerical Algorithms Group, Oxford, 1995.
  • [19] R.C. Oliveira, N.I.A. Acevedo, A.J. Silva Neto, L. Biondi Neto, Aplicação de um comitê de redes neurais artificiais para a solução de problemas inversos em Transferência Radiativa, TEMA - Tend. Mat. Apl. Comput, 11, No. 2 (2010), 171-182.
  • [20] L. Prieur, S. Sathyendranath, An optical classification of coastal and oceanic waters based on the specific spectral absorption curves of phytoplankton pigments, dissolved organic matter, and other particulate materials, Limnol. Oceanogr., 26, No. 4 (1981), 671 689.
  • [21] R.P. Souto, "Recuperação de Perfis Verticais de Propriedade Óticas Inerentes a partir da Radiação Emergente da Água", Tese de Doutorado, CAP, INPE, São José dos Campos, SP, 2006.
  • [22] R.P. Souto, H.F. Campos Velho, S. Stephany, Reconstruction of chlorophyll vertical profiles from in-situ radiances using the ant colony meta-heuristic, "Iberian Latinamerican Congress on Computational Methods", Anais do XXV CILAMCE, 2004. 1, Recife (PE), Brasil (2004).
  • [23] R.P. Souto, H.F. Campos Velho, S. Stephany, M. Kampel, Chlorophyll concentration profiles from in situ radiances by ant colony optimization, J. Phys.: Conf. Series, 124, No. 1 (2008).
  • 1
    Agradeço a CAPES pelo auxilio financeiro durante a realização do doutorado.
  • 2)
    A diferença no tamanho do passo na discretização é devido a variação significativa da razão b( · )/c( ·
    para valores baixos de C
  • 3
    Os valores de radiância apresentados das
    1(b) foram normalizados para ter a mesma ordem de grandeza, a fim de facilitar a comparação.
  • Datas de Publicação

    • Publicação nesta coleção
      16 Jan 2013
    • Data do Fascículo
      Dez 2012

    Histórico

    • Recebido
      31 Jan 2012
    • Aceito
      30 Nov 2012
    Sociedade Brasileira de Matemática Aplicada e Computacional Rua Maestro João Seppe, nº. 900, 16º. andar - Sala 163 , 13561-120 São Carlos - SP, Tel. / Fax: (55 16) 3412-9752 - São Carlos - SP - Brazil
    E-mail: sbmac@sbmac.org.br