Resumo
A expansão de centros de distribuição logística (CDs) exige ferramentas confiáveis de previsão de consumo de água para subsidiar decisões de investimento e gestão hídrica eficiente. Este estudo desenvolve e valida um modelo mensal de previsão em CDs utilizando regressão linear múltipla com dados em painel. O fluxo metodológico, replicável, envolveu a seleção das variáveis, a formação de um painel com dados de nove CDs no Brasil, a especificação do modelo, a estimação com inferência robusta e a avaliação da capacidade explicativa, da significância dos coeficientes, da multicolinearidade e de diagnósticos de resíduos. O desempenho foi comparado ao método baseado no consumo per capita. Os resultados indicam efeitos positivos e significativos da população mensal atendida, temperatura máxima média, pressão hidrostática mínima e quantidades de bacias sanitárias e chuveiros. A variável “torneiras” apresentou efeito positivo, porém reduzido, e o volume mensal de cargas distribuídas não foi relevante. Com alta capacidade explicativa, o modelo produziu previsões mais próximas dos valores observados e superou a abordagem per capita, oferecendo ganhos práticos ao planejamento e à gestão hídrica em CDs.
Palavras-chave
Consumo de água; Centros de distribuição logística; Regressão linear múltipla; Previsão de consumo; Modelagem estatística
Abstract
The expansion of logistics distribution centers (DCs) demands reliable tools for forecasting water consumption to support investment and efficient management. This study develops and validates a monthly forecasting model for DCs using multiple linear regression with panel data. The replicable methodological flow included variable selection, panel construction with data from nine Brazilian DCs, model specification, estimation with robust inference (clustered standard errors), and evaluation of explanatory power, coefficient significance, multicollinearity, and residuals. Predictive performance was compared with the per-capita method. Results indicate positive and significant effects of service population, mean maximum temperature, minimum hydrostatic pressure, and numbers of flush toilets and showers. The number of faucets had a minor positive effect, while distributed cargo volume was not significant. The model showed strong explanatory and predictive performance, producing estimates closer to observed values and outperforming the per-capita approach, offering practical benefits for planning and water management in DCs.
Keywords
Water consumption; Logistics distribution centers; Multiple linear regression; Consumption forecasting; Statistical modeling
Introdução
Um centro de distribuição logística (CD) é uma instalação estrategicamente localizada e projetada para receber, armazenar, organizar e expedir mercadorias de forma ágil para atender às demandas de diversos pontos de entrega. Sua principal finalidade é otimizar o fluxo de produtos dentro da cadeia de suprimentos, reduzindo prazos de entrega, custos operacionais e aumentando a disponibilidade de itens para os consumidores finais (Ballou; Srivastava, 2007).
Nos últimos anos, tem-se observado um crescimento expressivo na construção e expansão de CDs, impulsionado pelo avanço do comércio eletrônico e pela necessidade de maior capilaridade nas entregas. Esse cenário tem motivado empresas a realizarem investimentos significativos tanto em infraestrutura física, visando ampliar a capacidade logística e acomodar um número maior de colaboradores, quanto em tecnologias voltadas à automação, à gestão da informação e à escolha estratégica de localizações. Tais medidas buscam atender, com maior eficiência, às demandas dos mercados regionais e nacionais (Freitas, 2025).
De acordo com Vianna e Depexe (2013), bons investimentos em infraestrutura necessitam de indicadores e métodos de previsão de demanda eficazes, a fim de evitar que os projetos sejam subdimensionados ou superdimensionados. Logo, a previsão de demanda de consumo de água é fundamental para o planejamento e a gestão eficiente dos recursos hídricos, especialmente em instalações urbanas e industriais, como é o caso dos centros de distribuição logística.
Estimando as necessidades de consumo de água, torna-se possível otimizar a operação dos sistemas de reservação e abastecimento, identificar e reduzir perdas, prevenir situações de escassez e orientar adequadamente os investimentos em infraestrutura (Avni; Fishbain; Shamir, 2015). Além disso, a previsão contribui para a formulação de políticas públicas e privadas mais eficazes e sustentáveis, promovendo o uso racional da água frente aos cenários de crescimento populacional e mudanças climáticas (Corrêa et al., 2022).
No contexto brasileiro, o dimensionamento de Sistemas de Abastecimento de Água (SAA) frequentemente adota o consumo per capita como parâmetro de referência para a previsão de demanda. Essa prática é prevista em normas técnicas nacionais, como a NBR 12218 (ABNT, 2017) – Projeto de redes de distribuição de água para abastecimento público, e em manuais institucionais, como o Manual de Saneamento da FUNASA (2015). Embora a quantidade de pessoas seja um fator de grande influência na demanda hídrica, esse critério isolado não abrange toda a complexidade do consumo de água (Tomaz, 2000). Outros fatores podem exercer influência significativa sobre o consumo e devem ser considerados em seu processo de previsão. Entre eles, merecem destaque os aspectos climáticos, socioeconômicos e demográficos (Veiga; Kalbusch; Henning, 2022).
Os aspectos climáticos e socioeconômicos podem alterar padrões de consumo de água ao longo do tempo, refletindo variações sazonais, mudanças de comportamento e cenários de escassez. Características construtivas e operacionais das instalações também desempenham um papel importante no consumo, como o tipo de uso da edificação e a pressão disponível nos aparelhos hidráulicos (Feil; Haetinger, 2014). Além disso, o tipo e a quantidade dos equipamentos instalados influenciam diretamente no consumo de água, podendo ampliar ou reduzir significativamente o volume consumido (Abd-Elaal, 2021).
Neste sentido, a modelagem estatística apresenta-se como uma poderosa ferramenta para gestão hídrica, pois viabiliza a obtenção de indicadores e ferramentas de dimensionamento que fundamentam a expansão e a regulação do fornecimento de água (Avni; Fishbain; Shamir, 2015). Segundo Trautwein Junior (2004), trabalhos que envolvem a utilização de modelos estatísticos para o estudo do consumo de água na maioria dos casos possuem dois objetivos: determinar os melhores métodos de previsão e as variáveis que melhor explicam a variabilidade do consumo de água.
Uma grande parcela dos estudos sobre modelagem estatística dedicados à previsão de consumo de água concentra-se em grandes consumidores, como cidades (Trautwein Junior, 2004; Domene; Saurí, 2006; Vianna; Depexe, 2013; Feil; Haetinger, 2014; Silva; Campos; Santos, 2016; Dias; Kalbusch; Henning, 2018) ou países (Zhou et al., 2000; Schleich; Hillenbrand, 2009; Yasar; Bilgili; Simsek, 2012; Slavíková et al., 2013; Romano; Salvati; Guerrini, 2016). No Brasil, tem-se observado, nos últimos anos, um crescimento no número de estudos que utilizam modelos estatísticos para analisar os fatores que influenciam o consumo de água em diferentes tipologias de edificações e usos específicos. Esse avanço tem permitido o desenvolvimento de ferramentas de previsão mais ajustadas às particularidades de cada categoria de uso, contribuindo para práticas mais eficientes de gestão hídrica. Sob essa perspectiva, destacam-se alguns trabalhos que aplicaram essa abordagem em diferentes tipos de edificações.
Carvalho (2013) avaliou a influência de variáveis de movimentação aeroportuária sobre o consumo de água em aeroportos brasileiros, desenvolvendo modelos de regressão linear múltipla (RLM) que obtiveram bons desempenhos de previsão de consumo de água para aeroportos de diferentes portes. Alexandre; Kalbusch; Henning (2017) avaliaram o impacto da substituição de equipamentos hidrossanitários convencionais por modelos economizadores de água em uma instituição de ensino superior por meio de um modelo de RLM, adotando o consumo diário como variável dependente e variáveis independentes como o tipo de aparelho sanitário, o número de alunos e a temperatura média diária. Veiga, Kalbusch e Henning (2022) avaliaram a influência de fatores climáticos, geográficos, demográficos, sociais, econômicos, e de infraestrutura de abastecimento sobre o consumo per capita de água em 1.746 municípios brasileiros, desenvolvendo modelos de RLM com dados transformados em logaritmo.
Recentemente, Schultt, Kalbusch e Henning (2024) realizaram a modelagem estatística do consumo de água per capita em 26 escolas públicas de Joinville (SC), aplicando RLM simples, RLM Bayesiana e RLM geograficamente ponderada. Hackbarth et al. (2023) avaliaram os fatores que influenciam o consumo de água em edifícios de escritórios no sul do Brasil, por meio de modelos de RLM aplicados a dados de 53 unidades, incluindo ainda a análise do impacto da pandemia de COVID-19 sobre essa tipologia de edificação. Por fim, Mergener et al. (2025) estimaram o consumo de água em 19 canteiros de obra em Joinville (SC) e analisaram sua relação com características construtivas, utilizando análises estatísticas para variáveis quantitativas e categóricas.
O ponto em comum entre os trabalhos mencionados é o uso de modelos de RLM para a previsão do consumo de água. A RLM constitui uma das ferramentas estatísticas mais utilizadas em estudos aplicados, devido à sua capacidade de modelar e prever relações entre uma variável dependente e um conjunto de variáveis independentes (Gujarati, 2006). De acordo com Montgomery, Peck e Vining (2021), essa técnica permite compreender como a variável dependente (ou variável reposta) se comporta em função de diferentes variáveis explicativas, possibilitando a estimativa de valores médios de um fenômeno a partir de padrões observados nos dados.
O fundamento teórico da RLM está baseado no método dos mínimos quadrados ordinários (MQO), que busca minimizar a soma dos erros ao ajustar uma equação linear que represente, da forma mais acurada possível, as interações entre as variáveis. Essa abordagem confere robustez ao modelo, desde que pressupostos sejam atendidos, tais como: linearidade da relação entre variáveis, ausência de multicolinearidade significativa e normalidade dos resíduos (Montgomery; Peck; Vining, 2021). Além disso, a RLM dispõe de um arcabouço consolidado de métricas de avaliação de desempenho, capaz de aferir a adequação e a robustez dos modelos (Greene, 2018). Tais métricas são abordadas e aplicadas na sequência deste trabalho.
Outro aspecto relevante dos modelos de RLM é a praticidade de aplicação, especialmente com o suporte de softwares amplamente acessíveis, como o Microsoft Excel, que permite aplicar a RLM simples. Para análises mais complexas ou avançadas, também podem ser utilizados softwares estatísticos especializados, como R, Python, SPSS e Stata, que oferecem maior flexibilidade, ferramentas para verificação dos pressupostos do modelo, diagnóstico de resíduos e avaliação detalhada do desempenho das estimativas (Croissant; Millo, 2008).
Diante do exposto, este trabalho tem como objetivo desenvolver um modelo preditivo baseado em Regressão Linear Múltipla (RLM) em painel, com a finalidade de estimar, com bom desempenho, o consumo mensal de água em centros de distribuição logística. Ao incorporar múltiplas variáveis explicativas, a abordagem proposta busca superar as limitações das estimativas baseadas exclusivamente no consumo per capita, fornecendo uma ferramenta de previsão capaz de subsidiar a gestão eficiente dos recursos hídricos e apoiar decisões estratégicas de planejamento, operação e investimento em um setor de importância crescente.
Materiais e método
A metodologia proposta foi organizada em etapas, destinadas a garantir a consistência dos dados, a adequada escolha do modelo estatístico e a robustez dos resultados. Iniciou-se com a proposição teórica das variáveis explicativas e a construção da base de dados em formato de painel, em seguida, identificou-se o modelo mais apropriado (pooled, efeitos fixos ou efeitos aleatórios) por meio de testes de especificação. Na sequência, procedeu-se à estimação do modelo e à avaliação de seu desempenho, considerando tanto a significância das variáveis explicativas quanto a capacidade preditiva do modelo proposto. Por fim, para evidenciar os ganhos de precisão obtidos, realizou-se a comparação entre os valores de consumo mensal de água estimados pelo modelo de previsão e aqueles calculados a partir dos índices de consumo per capita recomendados por três concessionárias brasileiras de água e esgoto. A Figura 1 exibe o fluxograma metodológico utilizado, e cada etapa é descrita com maior detalhe na sequência.
Este trabalho partiu da hipótese de que o consumo de água em CDs não é determinado apenas pelo número de pessoas que frequentam o local. Pressupôs-se que outras variáveis explicativas também exerçam influência significativa sobre esse consumo. Essas variáveis foram agrupadas em dois tipos: sazonais e de infraestrutura. As sazonais abrangeram a temperatura máxima média mensal, a população média mensal e o volume mensal de cargas distribuídas, pois tais variáveis podem refletir oscilações periódicas capazes de impactar diretamente o consumo mensal de água nos CDs.
É bem estabelecido que o tamanho da população atendida exerce influência direta no volume de água consumido (Veiga; Kalbusch; Henning, 2022). Em um centro de distribuição logística, a quantidade de pessoas atendidas está sujeita a variações ao longo do ano em razão de sazonalidades operacionais e de mercado, o que pode alterar a intensidade de uso dos aparelhos hidráulicos. Da mesma forma, a temperatura pode atuar como fator determinante, sobretudo em meses mais quentes, quando há maior frequência de atividades que consomem água, como higiene pessoal, conforto térmico e irrigação (Slavíková et al., 2013). Tais variações sazonais podem aumentar significativamente o volume de água consumido (Romano; Salvati; Gerrini, 2016). Além disso, almejou-se testar a hipótese de que o volume mensal de cargas distribuídas atua como indicador direto da atividade logística, e que pode intensificar o uso das instalações hidráulicas em períodos de maior movimentação de mercadorias. Assim, a inclusão dessas variáveis visou capturar padrões sazonais que não seriam explicados apenas pelas variáveis de infraestrutura.
A proposição de variáveis de infraestrutura teve como intuito verificar a relação entre características construtivas e o consumo de água em centros de distribuição logística. Elementos como o número e o tipo de aparelhos hidráulicos instalados podem influenciar, em maior ou menor grau, a intensidade do consumo de água (Alexandre; Kalbusch; Henning, 2017). Ademais, quando um aparelho hidráulico não possui volume por uso previamente controlado, a vazão tende a variar em função da pressão disponível na rede. Nessa condição, quanto maior a pressão de abastecimento, maior será a quantidade de água liberada em um mesmo ciclo de uso e com a mesma frequência de acionamento (Rucka et al., 2018). Neste sentido, o Quadro 1 apresenta a variável dependente (resposta) e as variáveis independentes (explicativas) propostas.
A construção de um modelo de regressão linear múltipla com dados em painel possui vantagens significativas, como a possibilidade de explorar simultaneamente a variabilidade temporal e as diferenças entre indivíduos de análise. Esse tipo de modelagem combina dados de corte transversal (indivíduos) e séries temporais (períodos), o que permite maior controle da heterogeneidade não observada e a redução de problemas de multicolinearidade (Gujarati, 2006; Wooldridge, 2010). No presente estudo, o levantamento de dados foi realizado em múltiplos CDs, localizados em diferentes regiões do Brasil e, com características operacionais e de infraestrutura distintas. Essa diversidade de contextos visou captar com maior precisão a heterogeneidade do fenômeno estudado, reduzindo potenciais vieses decorrentes de análises restritas a um único local (Hsiao, 2014). Além disso, buscou-se ampliar a capacidade de generalização do modelo proposto e a aplicabilidade prática dos resultados, permitindo que o modelo seja utilizado como ferramenta preditiva em diferentes CDs.
Inicialmente, buscou-se identificar empresas responsáveis pelo gerenciamento de CDs que estivessem dispostas a disponibilizar, por um período mínimo 12 meses, o histórico de consumo de água (Y), o número de colaboradores (X1) e o volume de carga distribuída (X3). O objetivo foi desenvolver o modelo preditivo tendo como variável dependente (Y) o consumo de água mensal extraído das faturas de serviços de água e esgoto, fornecidas pelas concessionárias de locais e, a partir disso, avaliar a qualidade das estimativas (Ŷ). A Figura 2 apresenta a localização dos 9 CDs que atenderam os requisitos supracitados.
Com a definição das localidades, procurou-se uma base confiável que disponibilizasse séries de temperatura para cada uma delas ao longo dos 12 meses do ano. Optou-se por adotar a temperatura máxima média mensal (X2), calculada a partir da média das temperaturas máximas registradas diariamente em cada mês. Esses dados foram obtidos a partir das “Normais Climatológicas do Brasil”, publicadas pelo Instituto Nacional de Meteorologia (INMET, 2025). Essa base é considerada robusta por ser resultado de um longo período de observações sistemáticas (1991–2020), o que confere maior confiabilidade estatística e reduz a influência de variações climáticas pontuais.
O levantamento dos dados de infraestrutura foi realizado presencialmente nos CDs. A pressão hidrostática mínima (X4), é definida como a pressão disponível na rede sob condição de menor carga hidráulica, correspondente à menor pressão estática garantida apenas pela ação da gravidade, sem considerar perdas de carga ou efeitos dinâmicos (Tomaz, 2000). Neste estudo, tal variável foi estimada pela diferença de cota entre o ponto de saída do reservatório elevado e o ponto de consumo situado na posição mais alta de cada CD. A quantificação e caracterização dos aparelhos hidráulicos em uso, como bacias sanitárias (X5), chuveiros / duchas (X6), e torneiras (X7), foram registradas por meio de uma tabela quantitativa preenchida pelos autores.
Os dados oriundos da etapa de levantamento foram organizados em formato de painel. Neste estudo, considerou-se nove unidades de observação (CDs), cada uma com 12 registros mensais de consumo de água referentes ao ano de 2024, totalizando 108 cenários de entrada para o modelo de regressão linear múltipla. O painel de dados foi classificado como balanceado, porque todas as unidades possuem o mesmo número de observações no tempo, garantindo uniformidade na estru tura dos dados e robustez estatística (Baltagi, 2008). A Equação 1, descrita por Wooldridge (2010), exibe a formulação usual de um modelo de RLM em painel.
Sendo:
𝑌𝑖𝑡 é a variável dependente para a unidade i no período t;
𝛼 é o intercepto comum a todas as unidades e períodos (quando não há efeitos fixos);
𝛽𝑘 são os coeficientes de regressão que medem o impacto das variáveis independentes sobre 𝑌𝑖𝑡;
𝑋𝑘𝑖𝑡 são as variáveis independentes;
𝜇𝑖 é o efeito específico de cada unidade (características não observadas de cada CD, constantes no tempo);
𝜆𝑡 é o efeito específico de cada período (controle de variações temporais comuns as unidades, não observadas nas covariáveis); e
𝜀𝑖𝑡 é o termo de erro idiossincrático, que varia entre unidades e no tempo.
A escolha adequada entre os tipos de modelo em painel, pooled, de efeitos fixos ou de efeitos aleatórios, é fundamental para garantir a consistência e a validade das previsões. O modelo pooled desconsidera as heterogeneidades individuais e temporais, tratando os dados como uma regressão agrupada simples, o que pode introduzir viés caso existam características não observadas relevantes (Wooldridge, 2010). O modelo de efeitos fixos, por sua vez, controla a heterogeneidade não observada associada às unidades de análise, admitindo que tais efeitos estejam correlacionados com as variáveis explicativas. Em contraste, o modelo de efeitos aleatórios parte do pressuposto de que a heterogeneidade não observada é não correlacionada com as variáveis regressoras, o que lhe confere maior eficiência estatística quando a suposição é válida (Baltagi, 2008).
Neste estudo, a seleção do modelo adequado seguiu a sequência de testes de especificação estatísticos recomendada pela literatura (Hsiao, 2014; Greene, 2018). Primeiramente, aplica-se o teste de Chow (F-teste), que compara o modelo pooled ao de efeitos fixos, e o teste LM de Breusch-Pagan, que avalia a pertinência do modelo de efeitos aleatórios em relação ao pooled. Caso ambos os testes indiquem a presença de efeitos fixos e aleatórios, respectivamente, procede-se ao teste de Hausman, cuja finalidade é verificar a existência de correlação entre os efeitos não observados e as variáveis explicativas, permitindo decidir entre a adoção de um modelo de efeitos fixos ou de efeitos aleatórios. Se tanto o teste de Chow, quanto o LM não rejeitarem a hipótese nula, conclui-se que não existem efeitos específicos relevantes e, portanto, o modelo pooled é suficiente. Nessa situação, a interpretação dos resultados assume que a heterogeneidade entre as unidades e ao longo do tempo não exerce influência sistemática sobre a variável dependente (Gujarati, 2006).
A especificação e estimação do modelo de regressão linear múltipla em painel foram realizadas por meio do software R, um ambiente de programação de código aberto amplamente utilizado em pesquisas acadêmicas por disponibilizar recursos avançados para análise estatística (Croissant; Millo, 2008). Os cálculos foram realizados com auxílio dos pacotes “plm”, “lmtest” e “car”. Além disso, a estimação do modelo incorporou o cálculo de erros-padrão robustos, recurso que ajusta a variância dos coeficientes estimados para corrigir possíveis problemas de heterocedasticidade e autocorrelação. Este procedimento garante maior confiabilidade aos testes de significância aplicados (Wooldridge, 2010).
A avaliação de desempenho do modelo foi realizada por meio da verificação das métricas R, R², R² ajustado, F, REQM (Raiz do Erro Quadrático Médio), EPAM (Erro Percentual Absoluto Médio) e da significância individual das variáveis explicativas pelo teste t de Student. Foi aplicado o teste de multicolinearidade através do Fator de Inflação da Variância (Variance Inflation Factor - VIF), a fim de identificar possíveis correlações elevadas entre variáveis independentes. Adicionalmente, foram aplicados testes usuais para dados em painel: Breusch–Pagan/Koenker para heterocedasticidade e Wooldridge (pwartest) para autocorrelação serial intraunidade. A inferência foi reportada com erros-padrão robustos (HC1) com agrupamento por unidade. As métricas e os testes aplicados encontram-se resumidas no Quadro 2.
A qualidade das previsões também foi validada a partir da comparação com os dados de consumo mensal efetivamente medidos entre janeiro e março de 2025 em todos os CDs analisados. Esse procedimento possibilitou avaliar, na prática, o grau de aderência entre os valores estimados pelo modelo e os valores observados, em consonância com recomendações metodológicas para validação de modelos estatísticos (Montgomery; Peck; Vining, 2021).
Por fim, realizou-se a comparação entre as previsões de consumo mensal geradas pelo modelo e o valor de consumo per capita recomendado por três concessionárias de água e esgoto. Essas concessionárias indicam 50 litros pessoa/dia para usuários dos setores industrial e comercial (SANEPAR, 2010; SAAE, 2017; SABESP, 2025), o que possibilitou confrontar os resultados do modelo com parâmetros amplamente utilizados no Brasil.
Resultados e discussões
A Figura 3 exibe o consumo mensal registrado dos nove CDs investigados ao longo dos 12 meses do ano de 2024, enquanto as Figuras 4 a 6 apresentam os valores referentes às variáveis sazonais no mesmo período. A Figura 7, reúne as variáveis de infraestrutura quantificadas durante as visitas técnicas.
O Quadro 3 apresenta o ranking médio das variáveis por CD, calculado a partir das médias mensais e classificado de 1º ao 9º (sendo 1º o maior valor). Essa organização permite visualizar o desempenho relativo dos CDs em relação ao consumo, variáveis sazonais e de infraestrutura hidráulica para facilitar a interpretação visual dos resultados.
Os testes de especificação aplicados ao painel de dados indicaram a pertinência do uso do modelo pooled. O teste de Chow (F-test) apresentou p-valor de 0,1549, de modo que não se rejeita a hipótese nula de ausência de efeitos fixos, sugerindo que o modelo pooled é suficiente nesse caso. De forma semelhante, o teste LM de Breusch–Pagan resultou em p-valor de 0,1222, portanto não se rejeita a hipótese nula de ausência de efeitos aleatórios, reforçando a adequação do modelo pooled. A Tabela 1 apresenta os resultados dos testes de especificação.
Dessa forma, o teste de Hausman não foi necessário, pois não houve evidência estatística que sustentasse a escolha de modelos com efeitos não observados. Assim, seguiu-se com a utilização do modelo pooled MQO (Mínimos Quadrados Ordinários), o qual, segundo Baltagi (2008), é apropriado quando não há evidência robusta de heterogeneidade não observada entre as unidades do painel. A Tabela 2 apresenta os resultados referentes a avaliação global de desempenho modelo de RLM pooled MQO executado.
O coeficiente de correlação (R = 0,886) indica forte associação linear entre as variáveis independentes e o consumo mensal de água. O coeficiente de determinação (R² = 0,785) revela que aproximadamente 78,5% da variabilidade do consumo é explicada pelas variáveis inseridas no modelo, valor considerado elevado para estudos aplicados em engenharia e gestão de recursos hídricos (Helsel; Hirsch, 1993). O R² ajustado (0,765), por sua vez, penaliza a inclusão de variáveis estatisticamente insignificativas, e sua proximidade em relação ao R² simples confirma a robustez do modelo (Hsiao, 2014).
As métricas de previsão indicaram um erro quadrático médio (RQEM) de 23,83 m³/mês e um erro percentual absoluto médio (EPAM) de 22,39%. Considerando que o consumo médio mensal de água da amostra de dados investigada foi de 105,64 m³, o RQEM obtido representa aproximadamente 22,6% desse valor, proporção coerente com o EPAM estimado. Além disso, o teste F global (F = 39,798; gl = 9; 98) apresentou p-valor extremamente baixo (p < 0,01), rejeitando de forma contundente a hipótese nula de que todos os coeficientes seriam iguais a zero. Esse resultado confirma que o conjunto das variáveis explicativas exerce influência estatisticamente significativa sobre o consumo de água mensal, reforçando a relevância preditiva do modelo.
Os diagnósticos dos resíduos não apontaram violações relevantes das suposições do modelo: Breusch–Pagan/Koenker não indicou heterocedasticidade (BP = 10,763; p = 0,149) e Wooldridge não evidenciou autocorrelação serial intra-unidade (F = 0,403; p = 0,527). A Tabela 3 exibe os resultados da RLM estimada por MQO pooled, incluindo coeficientes (β), erros-padrão robustos (HC1), estatísticas t e p-valores, que permitem avaliar a significância de cada variável sobre o consumo mensal de água.
A pressão hidrostática mínima apresentou coeficiente β = 5,09 indicando que o acréscimo de uma unidade nessa variável resulta em um aumento de aproximadamente 5,10 m³ no consumo mensal de água. Esse resultado mostra-se coerente com as observações de campo, uma vez que o CD de Camaçari-BA, que apresenta a maior pressão hidrostática mínima (16 mca), também registrou os maiores valores de consumo médio mensal, conforme evidenciado na Tabela 3. Além disso, corrobora a afirmação de Rucka et al. (2018) de que o consumo de água é significativamente influenciado pela pressão disponível na rede.
A maior parte dos equipamentos hidráulicos exerceu influência significativa sobre o consumo. A quantidade de bacias sanitárias (β = 3,95) mostrou que cada unidade a mais está associada a acréscimos de aproximadamente 4 m³ no consumo médio mensal de água. Da mesma forma, a quantidade de chuveiros/duchas apresentou β = 3,27, indicando que cada unidade adicional contribui para um aumento de cerca de 3,30 m³. Já o número de torneiras apresentou coeficiente positivo (β = 1,04), o que sugere incremento médio de 1 m³/mês por unidade, embora com significância reduzida (p = 7,00×10⁻²), revelando uma evidência menos robusta em comparação aos demais aparelhos analisados.
De acordo com Veiga, Kalbusch e Henning (2022), tanto a população quanto a temperatura constituem fatores determinantes para o consumo urbano de água no Brasil. Os resultados obtidos neste estudo corroboram essa evidência: a temperatura máxima média mensal (β = 3,94) mostrou-se estatisticamente significativa, apresentando efeito superior ao da maioria dos aparelhos hidráulicos, sendo superada apenas pela quantidade de bacias sanitárias. Da mesma forma, a população média mensal (β = 0,65) também se mostrou significativa, indicando que cada pessoa adicional está associada a um acréscimo aproximado de 0,65 m³/mês no consumo. Esses resultados reforçam que tanto as condições climáticas, quanto o crescimento populacional, exercem influência direta e relevante sobre o consumo de água.
No caso do volume mensal de cargas distribuídas (β = –0,0029; p > 0,40), o modelo não apresentou significância estatística, indicando que essa variável não exerce influência direta sobre o consumo de água nos CDs analisados. Esse resultado sugere que a intensidade das operações logísticas não está necessariamente vinculada ao aumento da demanda hídrica, o qual se mostra mais associado ao número de usuários, às condições climáticas e à presença de aparelhos sanitários. Ainda assim, antes de descartar sua utilização no modelo, aplicou-se o teste de Fator de Inflação da Variância (VIF), que mede o grau de multicolinearidade entre as variáveis independentes e permite verificar se a insignificância decorre de redundância estatística. Os resultados são apresentados na sequência na Tabela 4.
A análise de multicolinearidade mostrou que a maioria das variáveis apresentou valores de VIF em níveis aceitáveis, não comprometendo a estabilidade do modelo. Apenas a variável população ultrapassou ligeiramente o limiar de 5, sugerindo correlação moderada com outras regressoras, mas sem configurar multicolinearidade severa, em consonância com os critérios discutidos por Gujarati (2006). Além disso, verificou-se que o volume mensal de cargas distribuídas não apresentava colinearidade problemática com as demais variáveis, reforçando que sua insignificância decorre da baixa capacidade explicativa em relação ao consumo, e não de redundância estatística. Deste modo, a variável volume mensal de cargas distribuídas (X3), foi retirada do modelo, que então foi reestimado e submetido novamente aos testes de avaliação global, significância e multicolinearidade.
A retirada da variável (X3) não comprometeu a qualidade global do modelo. O coeficiente de determinação apresentou pequena variação, passando de R² = 0,785 para R² = 0,783, e o R² ajustado manteve-se praticamente estável (0,765 para 0,770), evidenciando que o poder explicativo permaneceu inalterado. Da mesma forma, as métricas preditivas mantiveram-se consistentes, com RQEM variando de 23,83 para 23,97 m³/mês e EPAM de 22,39% para 22,05%. Já o teste F global indicou melhora na significância do conjunto de regressoras, aumentando de 39,80 (gl = 9;98) para 60,66 (gl = 6;101), ambos com p < 0,01. Esses resultados demonstram que a exclusão da variável (X3) não apenas simplificou o modelo, como também reforçou sua robustez estatística ao eliminar um regressor irrelevante. Os demais resultados do modelo reestimado são exibidos nas Tabelas 5 e 6.
A exclusão do volume de cargas distribuídas, variável não significativa, resultou em ajustes pontuais nas estimativas dos coeficientes sem alterar a direção dos efeitos. As variáveis população média, temperatura máxima média, pressão hidrostática mínima, quantidade de bacias sanitárias e quantidade de chuveiros/duchas mantiveram-se estatisticamente significativas, com coeficientes próximos aos do modelo anterior, confirmando sua relevância no consumo de água. Já a quantidade de torneiras permaneceu com efeito positivo, mas em nível de significância reduzida, reforçando sua influência menos robusta. Dessa forma, a simplificação do modelo não alterou as conclusões principais, apenas aprimorou sua consistência estatística. A Tabela 9 apresenta os resultados do teste de multicolinearidade VIF para o modelo reestimando.
Os novos resultados do teste de VIF evidenciaram uma melhora na qualidade estatística do ajuste. Enquanto na primeira especificação a variável população média apresentava valor ligeiramente acima de 5, indicando correlação moderada com outros regressores, na nova estimativa todos os VIFs ficaram abaixo desse limiar. Essa redução confirma a ausência de multicolinearidade relevante e reforça a robustez do modelo, permitindo interpretações mais consistentes dos coeficientes estimados (Wooldridge, 2010). Neste sentido, a Equação 2 apresenta a formulação final do modelo de previsão do consumo mensal de água para centros de distribuição logística, construída a partir das variáveis estatisticamente significativas identificadas na análise de regressão.
Recomenda-se que a equação final de previsão do consumo mensal de água em centros de distribuição logística seja aplicada apenas dentro da faixa observada para cada variável no painel de dados utilizado, a fim de garantir a validade estatística das previsões. No caso deste estudo, as variáveis apresentaram os seguintes intervalos: população média mensal entre 29 e 140 pessoas, temperatura máxima média mensal entre 19,7 °C e 31,7 °C, pressão hidrostática mínima entre 5 e 16 mca, quantidade de bacias sanitárias entre 7 e 20 unidades, chuveiros entre 3 e 12 unidades e torneiras entre 12 e 33 unidades. Caso a equação seja aplicada para valores fora dessas faixas, ocorre o que se denomina extrapolação do modelo, situação em que as estimativas deixam de ter respaldo empírico, podendo gerar previsões distorcidas ou inconsistentes, uma vez que não há observações disponíveis para sustentar a validade estatística desses resultados (Helsel; Hirsch, 1993).
Adicionalmente, para testar a qualidade das previsões foi realizada a comparação entre os dados de consumo mensal efetivamente medidos entre janeiro e março de 2025 em todos os CDs analisados e as previsões geradas pelo modelo. Para isso, foi elaborada a Tabela 7 que apresenta os parâmetros necessários para aplicação da Equação 2, o consumo previsto e o consumo medido. Esse procedimento possibilitou avaliar, na prática, o grau de aderência entre os valores estimados pelo modelo e os valores observados, em consonância com recomendações metodológicas para validação de modelos estatísticos (Montgomery; Peck; Vining, 2021). Para isso, foram calculados os valores de REQM e EPAM com base nos erros encontrados.
A comparação entre consumo medido e previsto evidência a boa aderência do modelo, ainda que com variações relevantes em alguns cenários. Observa-se que os maiores erros absolutos tendem a ocorrer em situações de consumo elevado, como em Camaçari (288 m³ medido contra 205 m³ previsto) e Salvador (176 m³ medido contra 132 m³ previsto), o que indica uma dificuldade maior do modelo em captar extremos de consumo. Por outro lado, em faixas intermediárias de consumo, como nos registros de Belo Horizonte e Porto Alegre, os erros foram menores, reforçando a consistência das estimativas nesses intervalos. Os indicadores confirmam essa análise: o RQEM de 28,35 m³/mês e o EPAM de 23,80% obtidos para o período de validação se mostraram próximos aos valores anteriormente calculados para o modelo ajustado (RQEM = 23,83 m³/mês; EPAM = 22,39%). Essa proximidade indica que o desempenho do modelo se manteve consistente mesmo quando aplicado a novos dados.
Por fim, a Tabela 8 reapresenta os valores de consumo medidos e os confronta com a previsão mensal obtida a partir do consumo per capita recomendado pelas concessionárias de água e esgoto (50 litros/pessoa/dia). Para facilitar a visualização e permitir a comparação direta com a previsão gerada pelo modelo, o consumo previsto via parâmetro per capita foi convertido e apresentado em metros cúbicos por mês.
Os erros encontrados ao estimar o consumo mensal nos CDs apenas pelo parâmetro per capita foram expressivos. Observou-se erros individuais elevados em diversos cenários, e no agregado, REQM = 69,28 m³/mês e EPAM = 41,69%. Isso indica que, para este tipo de edificação e uso, basear a previsão de consumo de água apenas no número de pessoas é insuficiente, pois a variável “população atendida” não captura toda a complexidade do fenômeno. Em comparação ao método per capita, o modelo de previsão foi superior: REQM = 28,35 m³/mês e EPAM = 23,80%, ganhos de 40,93 m³/mês (REQM) e 17,89% (EPAM).
Os resultados comprovam a qualidade preditiva do modelo de previsão proposto, pois a abordagem multivariada, que incorpora um conjunto mais amplo de variáveis explicativas, apresentou desempenho superior nos testes estatísticos, com menores erros e melhor ajuste, além de confirmar a significância dos coeficientes. Assim, a ferramenta proposta representa um avanço na previsão do consumo de água em centros de distribuição logística, já que supera a prática ainda mais comum no Brasil, de estimar a demanda apenas pelo consumo per capita e fornece estimativas mais precisas e estáveis para esse tipo de edificação e uso.
Conclusões
Com a rápida expansão dos centros de distribuição, impulsionada pelo e-commerce e pela maior necessidade de capilaridade logística, instalações amplas com ocupação variável e muitos aparelhos hidráulicos exigem previsões de consumo de água confiáveis para decisões de reservação, adução, gestão de pressões, reformas e ampliações de infraestrutura. Neste sentido, este estudo teve como objetivo desenvolver e validar um modelo de previsão do consumo mensal de água para centros de distribuição logística por meio de regressão linear múltipla em dados em painel, identificando variáveis sazonais e de infraestrutura relevantes e de fácil obtenção. Oferecendo uma ferramenta robusta e eficiente para orientar investimentos em infraestrutura, gestão hídrica e previsibilidade de demanda.
Em termos metodológicos, o estudo seguiu uma sequência simples e replicável. Primeiramente, foram definidas as variáveis com base teórica e foi consolidada a base em formato de painel. Em seguida, os testes de especificação indicaram a adoção do modelo pooled. Posteriormente, o modelo pooled foi estimado com erros padrão robustos HC1 com agrupamento por unidade e foram verificadas a multicolinearidade e os resíduos. Por fim, avaliou-se o desempenho preditivo e compararam-se as previsões com o procedimento convencional baseado em consumo per capita das concessionárias.
Os resultados evidenciaram efeitos positivos e estatisticamente significativos das seguintes variáveis explicativas: população mensal atendida, temperatura máxima média mensal, pressão hidrostática mínima e quantidades de bacias sanitárias e de chuveiros/duchas. A variável quantidade de torneiras apresentou significância reduzida, enquanto o volume mensal de cargas distribuídas não se mostrou relevante, indicando que o consumo de água nos CDs está mais associado a determinantes de uso e infraestrutura do que à intensidade da movimentação logística.
Em relação a qualidade preditiva do modelo, na reestimação sobre o painel (ajuste) foi obtido REQM = 23,97 m³/mês e EPAM = 22,39%. Ao comparar as previsões do modelo com os dados medidos durante os três primeiros meses de 2025, o desempenho permaneceu sólido (REQM = 28,35 m³/mês; EPAM = 23,80%), indicando estabilidade e boa aderência. Em contraste, a abordagem de consumo per capita apresentou REQM = 69,28 m³/mês e EPAM = 41,69%, de modo que a utilização do modelo proposto reduz o erro médio em 40,93 m³/mês e o erro percentual absoluto médio em 17,89%. Assim, as previsões do modelo ficaram mais próximas dos valores medidos e superam de forma consistente o método per capita, cumprindo o objetivo de oferecer estimativas mais precisas. Ademais, a adequação do modelo proposto foi corroborada por diagnósticos de resíduos para painel (Breusch–Pagan/Koenker e Wooldridge), sem violações relevantes; a inferência utilizou erros-padrão robustos (HC1) com agrupamento por unidade, e o teste VIF não indicou multicolinearidade severa.
Do ponto de vista prático, o modelo de previsão de consumo de água em CDs serve como ferramenta de apoio para o dimensionamento de reservatórios, conjuntos de bombeamento e redes de distribuição a partir de cenários de ocupação, clima e características de infraestrutura. Além disso, fornece previsões mais estáveis para a negociação de contratos e metas de uso racional, reduzindo riscos operacionais, custos e suportando a adoção de medidas sustentáveis.
Como limitações deste trabalho, destacam-se o escopo amostral, o horizonte temporal reduzido e a possibilidade de não linearidades e interações não modeladas. Pesquisas futuras podem ampliar a série histórica e o número de CDs, incorporar variáveis comportamentais, avaliar a robustez por reamostragem e explorar especificações alternativas (transformações logarítmicas e termos quadráticos). Além disso, recomenda-se comparar o desempenho com modelos hierárquicos com efeitos aleatórios por unidade e com a RLM geograficamente ponderada (GWR) para captar variações espaciais.
Em síntese, este estudo atesta a aplicabilidade da regressão linear múltipla para a previsão do consumo de água em centros de distribuição logística, identificando variáveis explicativas determinantes desse consumo e evidenciando desempenho preditivo superior ao método baseado exclusivamente no consumo per capita.
-
TOGNATO, A. H.; GIRELI, T. Z.; GARCIA, P. D.; PINHEIRO, V. de C. N.; VINHA, V. C.; SILVEIRA, G. G. Previsão do consumo de água em centros de distribuição logística utilizando regressão linear múltipla. Ambiente Construído, Porto Alegre, v. 25, e150181, jan./dez. 2025. ISSN 1678-8621 Associação Nacional de Tecnologia do Ambiente Construído. http://dx.doi.org/10.1590/s1678-86212025000100931
Declaração de Disponibilidade de Dados
Os dados de pesquisa estão disponíveis no corpo do artigo.
Referências
- ABD-ELAAL, A. M. The influence of simultaneous operation of plumbing appliances on water consumption and conservation inside residential buildings. Ain Shams Engineering Journal, v. 12, n. 3, p. 2443-2452, 2021.
- ALEXANDRE, A. C; KALBUSCH, A; HENNING, E. Avaliação do impacto da substituição de equipamentos hidrossanitários convencionais por equipamentos economizadores no consumo de água. Engenharia Sanitaria e Ambiental, v. 22, n. 05, p. 1005-1015, 2017.
- ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 12218: projeto de redes de distribuição de água para abastecimento público. Rio de Janeiro, 2017.
- AVNI, N.; FISHBAIN, B.; SHAMIR, U. Water consumption patterns as a basis for water demand modeling. Water Resources Research, v. 51, n. 10, p. 8165–8181, 2015.
- BALLOU, R. H.; SRIVASTAVA, S. K. Business logistics/supply chain management: planning, organizing, and controlling the supply chain. Delhi: Pearson Education India, 2007.
- BALTAGI, B. H. Econometric analysis of panel data. 4th ed. Chichester: John Wiley & Sons, 2008.
- CARVALHO, I. C. Proposição de modelos de previsão de consumo de água para ambientes aeroportuários Viçosa, 2013. 124 f. Dissertação (Mestrado em Engenharia Civil) – Universidade Federal de Viçosa, Viçosa, 2013.
-
COMPANHIA DE SANEAMENTO BÁSICO DO ESTADO DE SÃO PAULO. Uso racional da água Disponível em: https://www.sabesp.com.br/o-que-fazemos/obras-programas/uso-racional-agua Acesso em: 13 ago. 2025.
» https://www.sabesp.com.br/o-que-fazemos/obras-programas/uso-racional-agua -
COMPANHIA DE SANEAMENTO DO PARANÁ. Tabela de consumos potenciais: projeto hidrossanitário. Curitiba: Sanepar, 2010. Disponível em: https://www.sanepar.com.br/sites/default/files/import/files/informacoes-tecnicas/projeto-hidrossanitario/tabela_consumos_potenciais_2010.pdf Acesso em: 13 ago. 2025.
» https://www.sanepar.com.br/sites/default/files/import/files/informacoes-tecnicas/projeto-hidrossanitario/tabela_consumos_potenciais_2010.pdf - CORRÊA, I. A. et al Mapeamento bibliográfico de referências sobre a conservação racional de água em edificações: estado da arte atual e lacunas de pesquisa sobre o tema. In: ENCONTRO NACIONAL DE TECNOLOGIA DO AMBIENTE CONSTRUÍDO, 19., Canela, 2022. Anais [...] Porto Alegre: ANTAC, 2022.
- CROISSANT, Y.; MILLO, G. Panel data econometrics in R: the plm package. Journal of Statistical Software, v. 27, n. 2, p. 1-43, 2008.
- DIAS, T. F.; KALBUSCH, A.; HENNING, E. Factors influencing water consumption in buildings in southern Brazil. Journal of Cleaner Production, v. 184, p. 160-167, 2018.
- DOMENE, E.; SAURÍ, D. Urbanisation and water consumption: influencing factors in the metropolitan region of Barcelona. Urban studies, v. 43, n. 9, p. 1605-1623, 2006.
- FEIL, A. A.; HAETINGER, C. Previsão de consumo de água via modelagem matemática de sistema de abastecimento de água. Revista DAE, v. 195, n. 1, p. 32–46, 2014.
- FREITAS, T. F. O Crescimento do e-commerce e o impacto da logística inteligente. Lumen et Virtus, v. 16, n. 44, 2025.
- FUNDAÇÃO NACIONAL DE SAÚDE. Manual de saneamento 4. ed. Brasília: FUNASA, 2015.
- GREENE, W. H. Econometric analysis 8th ed. Harlow: Pearson Education Limited, 2018.
- GUJARATI, D. N. Econometria básica São Paulo: Elsevier, 2006.
- HACKBARTH, F. B. et al Water consumption modeling in office buildings: a case study in Southern Brazil. Journal of Water Resources Planning and Management, v. 149, n. 9, p. 05023009, 2023.
- HELSEL, D. R.; HIRSCH, R. M. Statistical methods in water resources São Paulo: Elsevier, 1993.
- HSIAO, C. Analysis of panel data Cambridge: Cambridge University Press, 2014.
-
INSTITUTO NACIONAL DE METEOROLOGIA. Normais climatológicas do Brasil: 1991–2020. Brasília: INMET, 2025. Disponível em: https://bdmep.inmet.gov.br/ Acesso em: 4 jul. 2025.
» https://bdmep.inmet.gov.br/ - MERGENER, B. C. et al Análise do consumo de água em canteiros de obra na cidade de Joinville, SC. Ambiente Construído, Porto Alegre, v. 25, p. e144403, jan./dez. 2025.
- MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to linear regression analysis London: John Wiley & Sons, 2021.
- ROMANO, G.; SALVATI, N.; GUERRINI, A. An empirical analysis of the determinants of water demand in Italy. Journal of Cleaner Production, v. 130, p. 74-81, 2016.
- RUCKA, J. et al An experimental water consumption regression model for typical administrative buildings in the Czech Republic. Water, v. 10, n. 4, p. 424, 2018.
- SCHLEICH, J.; HILLENBRAND, T. Determinants of residential water demand in Germany. Ecological Economics, v. 68, n. 6, p. 1756–1769, 2009.
- SCHULTT, J. D. C.; KALBUSCH, A.; HENNING, E. Modelagem do consumo de água em escolas públicas da cidade de Joinville, SC. Ambiente Construído, v. 24, p. e131093, jan./dez. 2024.
- SERVIÇO AUTÔNOMO DE ÁGUA E ESGOTO DE SETE LAGOAS. Norma Técnica NT-SAAE nº 003/2017: diretrizes para elaboração e apresentação de projetos de instalações prediais de água fria, esgoto sanitário e águas pluviais. Sete Lagoas: SAAE, 2017.
- SILVA, W. T. P.; CAMPOS, M. M.; SANTOS, A. A. Previsão consumo diário de água: um estudo de caso de Nobres (Brasil). Ingeniería del Agua, v. 20, n. 2, p. 73, abr. 2016.
- SLAVÍKOVÁ, L. et al Impacts of climate variables on residential water consumption in the Czech Republic. Water Resources Management, v. 27, p. 365–379, 2013.
- TOMAZ, P. Previsão de consumo de água São Paulo: Navegar, 2000.
- TRAUTWEIN JUNIOR, B. Avaliação de métodos para previsão de consumo de água para curtíssimo prazo: um estudo de caso em empresa de saneamento. Curitiba, 2004. Dissertação (Mestrado em Engenharia de Produção e Sistemas) – Pontifícia Universidade Católica do Paraná, Curitiba, 2004.
- VEIGA, F.; KALBUSCH, A.; HENNING, E. Drivers of urban water consumption in Brazil: a countrywide, cross-sectional study. Urban Water Journal, v. 20, n. 10, p. 1462-1470, 2022.
- VIANNA, V.; DEPEXE, M. D. Modelagem de dados por regressão múltipla para previsão do consumo de água em Umuarama. Exacta, v. 11, n. 1, p. 33–46, maio 2013.
- WOOLDRIDGE, J. M. Econometric analysis of cross section and panel data Boston: MIT press, 2010.
- YASAR, A; BILGILI, M; SIMSEK, E. Water demand forecasting based on stepwise multiple nonlinear regression analysis. Arabian Journal for Science and Engineering, v. 37, p. 2333–2341, 2012.
- ZHOU, S. L. et al Forecasting daily urban water demand: a case study of Melbourne. Journal of hydrology, v. 236, n. 3-4, p. 153-164, 2000.
Editado por
-
Editor-chefe:
Enedir Ghisi
Datas de Publicação
-
Publicação nesta coleção
10 Nov 2025 -
Data do Fascículo
2025
Histórico
-
Recebido
12 Set 2025 -
Aceito
08 Out 2025














