Acessibilidade / Reportar erro

Métodos estatísticos multivariados aplicados à engenharia de avaliações

Multivariate statistical methods applied to evaluation engineering

Resumos

O presente artigo tem por finalidade apresentar uma metodologia, composta por técnicas de Análise Multivariada, para a construção de um modelo estatístico de regressão linear múltipla para avaliação de imóveis em função de suas características (variáveis, atributos). É aplicada, inicialmente, a análise de agrupamento aos dados de cada classe de imóvel urbano (apartamentos, residências e terrenos) para obtenção de grupos homogêneos dentro de cada classe e, em correspondência, são determinados discriminantes para alocar futuros itens nesses grupos, pelo método do escore discriminante quadrático. Em seguida, aplica-se a técnica da análise de componentes principais (ACP) para resolver o problema da multicolinearidade que pode existir entre as variáveis do modelo. Os escores das componentes principais são, então, as novas variáveis independentes, e com elas é ajustado um modelo de regressão linear múltipla para cada grupo de imóveis homogêneos dentro de cada classe. a metodologia foi aplicada a um conjunto de 119 imóveis, referentes a 44 apartamentos, 51 casas e 24 terrenos, da cidade de Campo Mourão, PR. O modelo para cada grupo homogêneo, dentro de cada classe de imóveis avaliados, apresentou um ajuste adequado aos dados e uma capacidade preditiva bastante satisfatória.

Engenharia de avaliações; Análise de agrupamentos; Análise de componentes principais; Regressão linear múltipla


The purpose of this paper is to present a methodology composed by Multivariate Statistical Analysis techniques in order to build a Statistical Multiple Linear Regression Model to evaluate some estates according to their characteristics (variables, attributes). First, a Clustering Analysis was applied to the data of each urban estate class (apartments, houses or lots) to categorize similar groups and, correspondingly, the discriminant was defined in order to assign future items to these groups, by means of the Quadratic Score Discriminant Method. Next, the Principal Components Analysis (P.C.A.) was applied to solve the multicolinearity problem that may exist among the variables in the model. The scores of the principal components become then the new independent variables and with them a Multiple Linear Regression model was adjusted to each group of similar estate within each class. This methodology was applied to a set of 119 estates including 44 apartments, 51 houses and 24 lots in the city of Campo Mourão, PR. The model for each similar group in each class of the evaluated estates presented an adequate adjustment to the data and a satisfactory predictive capacity.

Evaluation engineering; Clustering analysis; Principal components analysis; Multiple linear regression


Métodos estatísticos multivariados aplicados à engenharia de avaliações

Multivariate statistical methods applied to evaluation engineering

Maria Teresinha Arns Steiner; Anselmo Chaves Neto; Sílvia Neide Braulio; Valdir Alves

Universidade Federal do Paraná, Programa de Pós-Graduação em Métodos Numéricos em Engenharia, Departamentos de Estatística e Matemática, CP 19081, CEP 81531-990, Curitiba, PR, Brasil, e-mails: anselmo@ufpr.br; tere@ufpr.br

RESUMO

O presente artigo tem por finalidade apresentar uma metodologia, composta por técnicas de Análise Multivariada, para a construção de um modelo estatístico de regressão linear múltipla para avaliação de imóveis em função de suas características (variáveis, atributos). É aplicada, inicialmente, a análise de agrupamento aos dados de cada classe de imóvel urbano (apartamentos, residências e terrenos) para obtenção de grupos homogêneos dentro de cada classe e, em correspondência, são determinados discriminantes para alocar futuros itens nesses grupos, pelo método do escore discriminante quadrático. Em seguida, aplica-se a técnica da análise de componentes principais (ACP) para resolver o problema da multicolinearidade que pode existir entre as variáveis do modelo. Os escores das componentes principais são, então, as novas variáveis independentes, e com elas é ajustado um modelo de regressão linear múltipla para cada grupo de imóveis homogêneos dentro de cada classe. a metodologia foi aplicada a um conjunto de 119 imóveis, referentes a 44 apartamentos, 51 casas e 24 terrenos, da cidade de Campo Mourão, PR. O modelo para cada grupo homogêneo, dentro de cada classe de imóveis avaliados, apresentou um ajuste adequado aos dados e uma capacidade preditiva bastante satisfatória.

Palavras-chave: Engenharia de avaliações. Análise de agrupamentos. Análise de componentes principais. Regressão linear múltipla.

ABSTRACT

The purpose of this paper is to present a methodology composed by Multivariate Statistical Analysis techniques in order to build a Statistical Multiple Linear Regression Model to evaluate some estates according to their characteristics (variables, attributes). First, a Clustering Analysis was applied to the data of each urban estate class (apartments, houses or lots) to categorize similar groups and, correspondingly, the discriminant was defined in order to assign future items to these groups, by means of the Quadratic Score Discriminant Method. Next, the Principal Components Analysis (P.C.A.) was applied to solve the multicolinearity problem that may exist among the variables in the model. The scores of the principal components become then the new independent variables and with them a Multiple Linear Regression model was adjusted to each group of similar estate within each class. This methodology was applied to a set of 119 estates including 44 apartments, 51 houses and 24 lots in the city of Campo Mourão, PR. The model for each similar group in each class of the evaluated estates presented an adequate adjustment to the data and a satisfactory predictive capacity.

Keywords: Evaluation engineering. Clustering analysis. Principal components analysis. Multiple linear regression.

1 Introdução

O mercado imobiliário é uma das áreas mais dinâmicas do setor econômico terciário, e as principais dificuldades para a avaliação dos bens advêm das características (atributos, variáveis) dos imóveis que são bastante heterogêneas e podem guardar relacionamentos entre si. A avaliação de imóveis, seja para a cobrança de impostos, venda, garantia em financiamentos ou outros, é feita, em geral, de forma subjetiva com base na experiência pessoal dos gerentes imobiliários e de outros profissionais, que comparam os dados do imóvel da transação com os de imóveis já negociados. Na maioria das vezes não é utilizado qualquer procedimento científico, de forma sistemática, para esta finalidade.

O objetivo do presente artigo é propor uma metodologia baseada em técnicas estatísticas, que seja capaz de fazer previsão do valor de um imóvel levando em consideração os registros históricos de imóveis semelhantes. Esses registros de valores são os definidos em negócios concretizados anteriormente. Para isso, considerou-se como estudo de caso, o mercado imobiliário da cidade de Campo Mourão, PR, nas classes de apartamentos, casas e terrenos. Deste modo, obtido um modelo estatístico que melhor represente o mercado analisado, em um determinado período de tempo, poder-se-á predizer o valor (preço) de mercado de um imóvel qualquer com a máxima precisão possível.

Este artigo está estruturado da seguinte forma: na seção 2 tem-se o enquadramento do problema na área de engenharia de avaliações, com a apresentação das principais normas e conceitos relacionados ao tema; na seção 3 estão alguns trabalhos correlatos ao assunto aqui abordado, e também são descritos os dados para o problema prático em pauta. Na seção 4 são descritas, de forma sucinta, as técnicas estatísticas utilizadas neste trabalho, e também é apresentada a metodologia proposta; na seção 5 tem-se a obtenção e análise dos resultados da aplicação da metodologia proposta aos dados do problema. Finalmente, na seção 6 são apresentadas as conclusões do trabalho.

2 Engenharia de Avaliações

Dantas (2003) define a engenharia de avaliações como uma parte da engenharia que reúne um conjunto de conhecimentos dessa área, da arquitetura e de outras (ciências sociais, exatas e da natureza), com o propósito de determinar, de uma forma técnica, o valor de um bem, de seus direitos, frutos e custos de reprodução, subsidiando tomadas de decisões a respeito de valores envolvendo bens de qualquer natureza. Pode ser praticada por engenheiros, arquitetos e agrônomos; cada um dentro de sua habilitação profissional conforme as leis do Conselho Federal de Engenharia e Arquitetura (CONFEA).

Os primeiros trabalhos publicados no Brasil na área de engenharia de avaliações, que se tem conhecimento, datam do início do século XX. Em 1923, foram introduzidos métodos para avaliação de terrenos que, a partir de 1929, começaram a ter uso sistematizado (FIKER, 1997).

A Associação Brasileira de Normas Técnicas (ABNT) é o Fórum Nacional de Normalização. Em meados de 1950, surgiram as primeiras normas de avaliação de imóveis organizadas por entidades públicas e institutos. O primeiro anteprojeto de normas da ABNT na engenharia de avaliações data de 1957, sendo que a primeira norma brasileira para a avaliação de imóveis urbanos data de 1977, a NB-502/77 (DANTAS, 2003). Esta norma foi revista em 1989, originando a NBR 5676 (ou NB-502/89) registrada no INMETRO.

De acordo com a NB-502/89, os imóveis podem ser classificados quanto ao uso (residencial, comercial, industrial, institucional e misto); quanto à classe de imóvel (terreno, apartamento, casa, escritório, loja, galpão, vaga de garagem, misto, hotéis, hospitais, cinemas e teatros, clubes e recreativos); e quanto ao agrupamento (loteamento, condomínio de casas, prédio de apartamentos, conjunto habitacional, conjunto de salas comerciais, prédio comercial, conjunto de prédios comerciais, conjunto de unidades comerciais, shopping-centers e complexo industrial). Vale salientar que o presente trabalho utilizou dados correspondentes apenas aos imóveis das classes apartamentos, casas residenciais e terrenos.

É interessante verificar, que por existirem inúmeras influências para a definição do valor de um imóvel, uma parte do mesmo pode ser considerada aleatória, ou seja, pode-se pensar no valor final com base em um valor mais provável, aumentado ou diminuído de uma parcela imprevisível, de acordo com certas influências pontuais. Deste modo, o valor de um imóvel segue o modelo estatístico: Y = m + e, no qual Y é o valor (preço) negociado; m é o valor provável e e é o termo de perturbação estocástica; assim, a esperança de Y é E(Y) = m. Para um melhor detalhamento, pode-se consultar, dentre outros, Braulio (2005).

De acordo com González e Formoso (2000), o mercado imobiliário possui um comportamento diferenciado dos mercados de outros bens, devido às características especiais dos imóveis possuírem inúmeras fontes de divergências e desigualdades entre os mesmos, impossibilitando assim a comparação direta. Dentre os fatores que diferenciam os imóveis entre si, pode-se citar, dentre outros: a grande vida útil, a fixação espacial, a singularidade, o elevado prazo de maturação e o alto custo das unidades.

A ABNT (NBR5676/90) divide os métodos de avaliação em dois grandes grupos: métodos diretos e indiretos. Um método é considerado direto quando o valor do resultado da avaliação independe de outros (DANTAS, 2003). Os métodos diretos subdividem-se em método comparativo de dados de mercado (define o valor através da observação comparativa de valores com outros itens semelhantes no mercado) e método comparativo de custo de reprodução de benfeitorias (apropria o valor das benfeitorias). Segundo Dantas (2003), há preferência pelo emprego dos métodos diretos, e sempre que existem dados de mercado suficientes para a sua utilização, são os escolhidos.

Já um método é considerado indireto quando necessita de resultados de algum método direto. Os métodos indiretos subdividem-se em método da renda (define o valor em função de um rendimento já existente ou previsto pelo bem no mercado, ou seja, pelo valor econômico do bem); método involutivo (o valor é estimado por estudos de viabilidade técnica-econômica do seu aproveitamento) e método residual (calcula a diferença entre o valor total do imóvel e o valor das benfeitorias, levando-se em conta o fator de comercialização).

Quanto aos níveis de precisão, os trabalhos de avaliação podem ser classificados da seguinte forma: de nível de rigor expedito (o valor é obtido sem a utilização de qualquer instrumento matemático); normal (utilizam-se métodos estatísticos e existem exigências com relação à coleta e ao tratamento dos dados); rigoroso (o valor, resultado do tratamento estatístico adotado, deverá ter um nível de confiança máximo de 80%, com as hipóteses nulas testadas a um nível de significância máximo de 5%); e rigoroso especial, que se caracteriza pelo encontro de um modelo estatístico o mais abrangente possível, ou seja, que incorpore o maior número de características que contribuem para a formação do valor.

A função estimada para a formação do valor deve ser eficiente e não tendenciosa. A hipótese nula sobre o modelo de regressão deve ser rejeitada somente com nível de significância máximo de 1% (ANOVA). Já as hipóteses nulas sobre os parâmetros do modelo de regressão devem ser testadas com nível de significância máximo de 10% para o teste unilateral (teste t) ou 5% em cada ramo no teste bilateral. Devem ser analisadas as seguintes condições básicas referentes aos resíduos do modelo ajustado aos dados: Gaussianidade, homogeneidade da variância e independência. Desta forma os resíduos devem ser Gaussianos, independentes e identicamente distribuídos, ou seja, ei ~ N (0, s2).

3 Trabalhos correlatos e descrição do problema

Existem alguns trabalhos na literatura que tratam da Engenharia de Avaliações. Pode-se citar, por exemplo, o trabalho de Nguyen e Cripps (2001), em que comparam o desempenho preditivo de Redes Neurais Artificiais com a Análise de Regressão Múltipla para a venda de casas de família. Diversas comparações foram feitas entre os dois modelos, nas quais foram variados: o tamanho da amostra de dados, a especificação funcional e a predição temporal. Já no trabalho de Bond et al. (2002), os autores examinam o efeito que a vista de um lago (Lago Erie, E.U.A.) tem sobre o valor de uma casa. No estudo, foram levados em consideração os preços baseados na transação das casas (preço de mercado). Os resultados indicam que além da variável vista, a qual se apresenta significativamente mais importante que as demais, também a área construída e o tamanho do lote são importantes.

Cechin et al. (1999) compararam a técnica de regressão linear e redes neurais artificiais para realizar a estimativa do custo de venda e de aluguel de imóveis em Porto Alegre, RS. Foram avaliados dois bancos de dados: 1.600 imóveis ofertados para venda com 20 atributos cada e 500 imóveis ofertados para aluguel com 85 atributos cada. Do total destes atributos, apenas seis foram selecionados para treinamento dos modelos. Guedes (2001) apresenta duas ferramentas ao engenheiro de avaliações: modelos lineares generalizados e Redes Neurais aplicadas a 50 lotes urbanos de três bairros da cidade de Recife, PE.

Pelli Neto e Zárate (2003) também fizeram um estudo comparativo do uso de redes neurais e análise de regressão múltipla para estimação do valor de venda de imóveis, referente à oferta de 172 apartamentos de média e baixa renda do mercado imobiliário de Belo Horizonte, MG. Brondino (1999) apresentou um trabalho utilizando redes neurais na determinação da influência da variável acessibilidade no valor de lotes urbanos, comparando-as com o modelo de regressão múltipla, em duas cidades do interior de São Paulo (São Carlos e Araçariguama). A referida variável apresentou um peso superior a 34% no preço final do imóvel.

A aplicação da metodologia aqui proposta foi aplicada aos imóveis urbanos nas classes de apartamentos, residências e terrenos da cidade de Campo Mourão, PR. A amostra foi constituída por 119 imóveis (classes), sendo 44 da classe de apartamentos, 51 da classe de residências e 24 da classe de terrenos. Todos estão localizados na área urbana da cidade; destes, 80 estão localizados na área central da cidade.

Os atributos são dos tipos qualitativo e quantitativo; os de apartamentos estão listados no Apêndice 1 Apêndice 1 que, como se pode observar, são 21 ao todo, já divididos em grupos (seções posteriores), sendo 17 do grupo A, 19 do grupo B e 19 do grupo C.

4 Metodologia aplicada

A metodologia para a obtenção do objetivo consta da aplicação das seguintes técnicas estatísticas da área de análise multivariada:

Análise de agrupamento: através desta técnica procura-se determinar para cada classe de imóveis, os grupos de itens homogêneos. Nesta análise utilizou-se a Distância Euclidiana, e o método de ligação foi o método de Ward.

Após a formação dos grupos homogêneos, foram construídas funções discriminantes com duas finalidades: avaliar a consistência dos grupos obtidos; e alocar futuros itens em cada um dos grupos que formam cada classe.

Em seguida, aplicou-se a análise de componentes principais para cada um dos grupos, de cada uma das classes, com o objetivo de substituir os valores das variáveis originais pelos escores das componentes principais e contornar o possível problema da multicolinearidade.

Finalmente, foi ajustado um modelo de regressão linear múltipla para cada um dos grupos de cada classe de imóvel. O preço à vista, denominado valor, foi considerado como variável resposta ao modelo.

4.1 Descrição das técnicas estatísticas utilizadas

A Análise Multivariada é um conjunto de técnicas usadas para resolver problemas relacionados a: 1) Estrutura de covariância do vetor aleatório X (resumida na matriz de covariância ou de correlação) através da análise de componentes principais; análise fatorial e análise de correlação canônica; 2) Agrupamento de itens (cluster analysis); 3) Reconhecimento e Classificação de Padrões (JOHNSON; WICHERN, 1998). Nesta seção são descritas, de forma sucinta, as técnicas estatísticas multivariadas utilizadas.

4.1.1 Análise de agrupamentos

A Análise de Agrupamento consiste em uma técnica que tem o objetivo de formar grupos homogêneos de objetos (imóveis). Os grupos são formados com base nas suas distâncias (Euclidiana, Mahalanobis, dentre outras) ou similaridades e em um método de ligação entre os grupos parciais. A distância usualmente utilizada é a Distância Euclidiana: . O método de ligação mais utilizado é o de Ward, que minimiza a "perda das informações" ao "juntar" dois grupos, utilizando o critério de minimizar a soma dos quadrados dos erros (sum quadratic error, SQE),

4.1.2 Escore de discriminação quadrático para reconhecimento e classificação

Neste estudo usou-se a regra de reconhecimento e classificação com base na probabilidade total mínima de erro definida pelo escore de discriminação quadrático para a população (grupo) i dado por:

em que pi é a probabilidade, a priori, do item pertencer à população Pi, já mi e Si são, respectivamente: o vetor médio e a matriz de covariância da população i. Estes parâmetros são geralmente desconhecidos e, assim sendo, trabalha-se com as suas estimativas amostrais e Si. Quanto as pi, pode-se tomá-las como as proporções dos tamanhos dos grupos amostrais. Reconhece-se x0 como sendo de Pk se: i = 1, 2,..., g, com k ¹ i.

4.1.3 Análise de componentes principais

Seja o vetor aleatório x com p componentes correlacionadas. A estrutura desse relacionamento pode ser resumida na matriz de covariância S ou na matriz de correlação r. Sabe-se do Teorema da Decomposição Espectral, que S = PLP' ou r = PLP', em que P é a matriz ortogonal dos autovetores e L a matriz diagonal dos autovalores. Assim, existem p componentes principais não correlacionadas representadas pelas combinações lineares Yi = ei'X, que recompõem essa estrutura de covariância, em que ei e li, i = 1, 2,..., p são, respectivamente, os autovetores e autovalores de S ou r.

Além disso, é bem conhecido que V(Yi) = li exprime a importância de cada componente principal. Um número m < p de componentes principais pode representar uma parcela significativa da variação total e é possível usá-las no lugar das p variáveis originais. Um critério para a determinação do número de componentes principais a serem consideradas foi sugerido por Kaiser, em 1960 (JOHNSON; WICHERN, 1998). Consiste em se tomar um número m de componentes principais igual ao número de autovalores li> 1. Ainda, é interessante considerar a parcela da variação explicada pelas m componentes principais acima de (cerca de) 90%, ou seja, estendendo o referido critério, podem ser considerados autovalores menores que 1, desde que próximos a 1.

Ao aplicar-se a análise de componentes principais, obtêm-se os escores de suas m principais componentes. Desta forma, transforma-se a matriz X do modelo da ordem n x p na matriz E de ordem n x m, m < p, correspondente aos escores das m componentes principais.

4.1.4 Regressão linear múltipla para previsão

Para se obter o valor de uma variável Y em função de outras variáveis Xi independentes entre si, usa-se um modelo de Regressão Linear Múltipla, dado por: Y = Xb + e; em que Y é o vetor das respostas observadas das n observações (imóveis); X é a matriz do modelo de ordem n x p; e é o vetor dos erros de dimensão n e b (a ser estimado) é o vetor de parâmetros de dimensão p.

Uma vez definido o grupo k da classe l do item (imóvel) com base no agrupamento e no reconhecimento e classificação, usa-se o modelo de regressão linear múltipla ajustado para estimar o valor do imóvel j por:

em que escj é o vetor dos escores das componentes e é o vetor de parâmetros estimado.

5 Obtenção dos resultados

Os grupos da classe de apartamentos foram formados pela Análise de Agrupamentos descrita no item a da seção 4.1 anterior. O resultado indicou que três grupos compõem a classe dos apartamentos, como mostra a Figura 1. O grupo 1 contém 38,64% dos apartamentos analisados, o grupo 2, 22,73% e o grupo 3, 38,64%.


Após a análise de agrupamento, realizou-se a análise discriminante usando-se os escores quadráticos, sendo que os resultados encontram-se na Tabela 1.

Na Tabela 1 tem-se que, dos 17 apartamentos pertencentes à classe 1, todos foram classificados corretamente; dos 10 pertencentes à classe 2, todos também foram classificados corretamente; e dos 17 pertencentes à classe 3, apenas um foi classificado incorretamente. Deste modo, tem-se a precisão de 43/44. 100 = 97,73%. Assim, os resultados apresentaram-se consistentes: dentre as 44 observações que ajustam o modelo, 97,73% foram classificadas corretamente. A interpretação dos grupos obtidos foi realizada de acordo com os atributos de cada classe, sendo 17 do grupo A, 19 do grupo B e 19 do grupo C, conforme já mencionado.

A seguir, são apresentados os aspectos mais determinantes de cada um dos três grupos:

a) Grupo 1: todos os apartamentos estão localizados no centro; estão em prédios com pelo menos sete pavimentos; todos têm pelo menos uma vaga na garagem; o revestimento dos prédios é pastilhado; possuem área mínima de 160 m2; possuem pelo menos um elevador; têm mais de dois dormitórios; todos possuem suíte; todos possuem dependência de empregada completa; e o seu preço é superior a R$115.000,00.

b) Grupo 2: todos localizados no centro; estão em prédios com pelo menos 13 pavimentos; o revestimento dos prédios é de pastilha, mármore ou granito; todos têm mais de uma vaga na garagem; possuem área mínima de 220 m2; são prédios com menos de 15 anos; possuem mais de dois dormitórios; todos possuem suíte; todos possuem mais de um elevador; todos têm dependência de empregada completa; e o seu preço é superior a R$175.000,00.

c) Grupo 3: todos os apartamentos possuem apenas uma vaga na garagem; têm área privativa menor que 132 m2; são prédios baixos; e seus valores estão entre R$30.000,00 e R$110.000,00.

Em seguida, foi aplicada a Análise de Componentes Principais aos dados das variáveis explicativas originais, obtendo-se m = 6 componentes e os seus escores, conforme mostra a Tabela 2.

Através dos resultados contidos na Tabela 3 a seguir, pode-se observar que a primeira componente possui pesos mais altos nas variáveis originais: distância à escola; distância ao supermercado; distância ao hospital; nível de conservação; e número de banheiros. A segunda componente possui pesos mais altos nas variáveis: número de elevadores; número de dormitórios; e idade aparente do imóvel. A terceira componente possui pesos maiores nas variáveis: número de peças do imóvel; número de salas; número de banheiros; e padrão de acabamento. A quarta componente possui pesos mais altos nas variáveis: vaga de carro na garagem; área útil; número de pavimentos; número de salas; padrão de acabamento; e idade real. A quinta componente possui pesos mais altos: posição do apartamento no prédio; número de elevadores; número de vagas na garagem; e número de pavimentos no prédio. Finalmente, a sexta componente possui pesos mais elevados nas variáveis: posição do apartamento no prédio; número de vagas na garagem; e nível de conservação.

Os escores fornecidos pelas seis componentes para os 17 apartamentos compõem a Tabela 4, adiante. Esses são os valores das variáveis explicativas considerados para o ajuste do modelo de regressão linear.

No ajuste do modelo de regressão linear múltipla Y = X b + e verificou-se que a quinta e a sexta componente não são significativamente importantes devido aos seus valores-p serem maiores do que 0,05, sendo assim foram descartadas, e consideraram-se apenas as quatro primeiras, como mostra a Tabela 5.

O coeficiente de correlação múltipla ao quadrado R2, que mede a qualidade do ajuste é dado por:

e fornece o valor de R2 = 0,956557, ou seja, o modelo ajustado explica cerca de 96% da variabilidade do preço de mercado. Assim, a equação de regressão linear múltipla para os apartamentos pertencentes à classe 1, que descreve a relação entre o preço e as quatro componentes independentes é dada pela Equação 4 a seguir.

Já a análise de variância, contida na Tabela 6, mostra que se deve rejeitar a hipótese de não haver regressão, ou seja, o modelo acima é de fato significativo.

As premissas necessárias ao uso do modelo linear e aos testes aplicados foram todas verificadas e satisfeitas pelos resíduos, ou seja, ei ~ N(0, s2). Assim, no modelo para os apartamentos, comprovou-se a Gaussianidade dos resíduos pelo teste de Kolmogorov-Smirnov, que forneceu um valor-p de p = 0,987074 e a homogeneidade da variância dos resíduos foi verificada e aceita por método gráfico (resíduos x valores preditos).

Os valores preditos pela Equação 4 ajustada e os valores observados, bem como as percentagens de erros da predição são apresentados na Tabela 7.

A análise conduzida para os 10 apartamentos pertencentes à classe 2, resultou em seis componentes principais que explicam 92,44% da variabilidade dos dados originais. E aos escores que compõem a matriz do modelo de ordem (10 x 6) foi ajustado o modelo de regressão linear múltipla Y = X b + e, resultando em:

O coeficiente de determinação do ajuste foi de R2 = 0,998942, ou seja, o modelo ajustado explica quase 100% da variabilidade do preço de mercado. A hipótese da existência do modelo foi testada e aceita pela análise da variância, que forneceu valor-p, no teste F, de p = 0,0002. Da mesma forma que no grupo 1, as premissas para validação do modelo linear e dos testes aplicados foram todas verificadas e satisfeitas pelos resíduos, ou seja, ei ~ N(0, s2). Assim, comprovou-se a Gaussianidade dos resíduos pelo teste de Kolmogorov-Smirnov com p = 0,889229 e a homogeneidade da variância dos resíduos também foi aceita por método gráfico (resíduos x valores preditos).

Já para os 17 apartamentos pertencentes ao grupo 3, a Análise de Componentes Principais apontou que as sete primeiras componentes explicam 88,949% da variabilidade dos dados originais. O ajuste do modelo Y = X b + e à matriz dos escores de ordem (17 x 7) resultou em:

O coeficiente de determinação obtido foi de R2 = 0,893306 e, conseqüentemente, o modelo ajustado explica cerca de 89% da variabilidade do preço de mercado. A existência do modelo foi testada e aceita no teste F da análise de variância, que forneceu p = 0,0010. As premissas para validação do modelo linear e dos testes aplicados foram todas verificadas e satisfeitas pelos resíduos, ou seja, ei ~ N(0, s2). Comprovou-se a Gaussianidade pelo teste de Kolmogorov-Smirnov com p = 0,110277 e a homogeneidade da variância foi aceita por método gráfico (resíduos x valores preditos).

6 Conclusões

Neste artigo é proposta uma metodologia baseada em técnicas estatísticas multivariadas para a previsão de preços de imóveis urbanos. A referida metodologia é composta das seguintes técnicas: Análise de Agrupamento, na qual os imóveis "semelhantes" em termos de atributos são agrupados; Escores Discriminantes Quadráticos, em que é verificada a consistência dos grupos formados e tem-se um critério para alocação de um novo item. Em seguida, é aplicada a Análise de Componentes Principais para conseguir m < p componentes e os seus escores independentes para substituir as p variáveis originais, contornando-se assim o problema da multicolinearidade. Finalmente, faz-se o ajustamento do modelo de Regressão Linear Múltipla do vetor de valores Y contra as variáveis explicativas resumidas na matriz E de ordem (n x m), ou seja, Y = Eb + e, que fornece uma estimativa do valor do imóvel x0 através da Equação 7:

em que e0 é o vetor de escores correspondentes.

A metodologia foi aplicada às outras duas classes de imóveis (51 residências e 24 terrenos) com resultados considerados bastante satisfatórios. A qualidade do ajuste às variáveis, agora de fato independentes, forneceu os coeficientes de determinação apresentados na Tabela 8.

Assim, dado um novo imóvel (apartamento, residência ou terreno) da cidade de Campo Mourão, PR, do qual se deseja ter uma estimativa do seu valor, deve-se inicialmente verificar a que grupo o mesmo pertence, aplicando os escores quadráticos. Identificado o grupo, pode-se utilizar o modelo de Regressão Linear Múltipla correspondente àquele grupo. Para a classe dos apartamentos, grupo 1, o modelo definido é apresentado na Equação 4, seção 5. Da mesma forma, têm-se os modelos para as demais situações. A metodologia é genérica, podendo ser utilizada a qualquer cidade, obtendo-se a definição dos modelos para as diversas situações em cada uma delas.

A metodologia multivariada apresentada para predições dos preços de imóveis se mostrou viável e altamente apropriada, atingindo-se resultados com níveis de precisão bastante satisfatórios. Desta forma, a mesma poderá servir de apoio tanto a gerentes imobiliários na definição de preços de imóveis, como para pessoas físicas e/ou jurídicas que desejam conhecer mais realisticamente o seu patrimônio. Deve-se atentar para o fato de que os modelos de Regressão Linear Múltipla definidos deverão sofrer reajustes periódicos, devido à alta dinamicidade de crescimento e da economia do país.

Recebido em 27/11/2006

Aceito em 19/10/2007

Apêndice 1

Apêndice 1

Apêndice 1 - Clique para ampliar Apêndice 1

  • ABNT (Associação Brasileira de Normas Técnicas). Avaliação de Imóveis Urbanos (NBR 5676 e NBR 502). Rio de Janeiro: ABNT, 2004.
  • BOND, M. T.; SEILER, V. L.; SEILER, M. J. Residential Real Estate Prices: a Room with a View. The Journal of Real Estate Research, California State University, Fullerton, California, v. 23, n. 1, p. 129-137, 2002.
  • BRAÚLIO, S. N. Proposta de uma Metodologia para a Avaliação de Imóveis Urbanos baseada em Métodos Estatísticos Multivariados Curitiba PR, 2005, 158 p. Dissertação (Mestrado em Métodos Numéricos em Engenharia). Programação Matemática. UFPR.
  • BRONDINO, N. C. M. Estudo da Influência da Acessibilidade no Valor de Lotes Urbanos através do uso de Redes Neurais São Carlos SP, 1999, 158 p. Tese (Doutorado em Engenharia Civil). Transportes USP.
  • CECHIN, A. L.; SOUTO, A.; GONZÁLEZ, M. A. Análise de Imóveis através de Redes Neurais Artificiais na Cidade de Porto Alegre. Scientia, São Leopoldo, RS, v.10, n. 2, p. 5-32, 1999.
  • DANTAS, R. A. Engenharia de Avaliações: uma Introdução à Metodologia Científica. São Paulo: Pini, 2003. 262 p.
  • FIKER, J. Avaliação de Imóveis Urbanos São Paulo: Pini, 1997. 104 p.
  • GONZÁLEZ, M. A. S.; FORMOSO, C. T. Análise conceitual das dificuldades na determinação de modelos de formação de preços através de análise de regressão. Engenharia Civil UM (Universidade do Milho), Portugal, n. 8, p. 65-75, 2000.
  • GUEDES, J. C. Duas Ferramentas Poderosas a Disposição do Engenheiro de Avaliações: Modelos Lineares Generalizados e Redes Neurais. In: Anais do XI COBREAP, 2001, Guarapari, ES. Anais Guarapari, 2001, 18 p.
  • JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis New Jersey: Prentice Hall, 1998. 816 p.
  • NGUYEN, N.; CRIPPS, A. Predicting Housing Value: A Comparison of Multiple Regression Analysis and Artificial Neural Networks. The Journal of Real Estate Research, Fullerton, California, v. 22, n. 3, p. 313-336, 2001.
  • PELLI NETO, A.; ZÁRATE, L. E. Avaliação de Imóveis Urbanos com a utilização de Redes Neurais Artificiais. In: Anais do IBAPE XII COBREAP, 2003, Belo Horizonte, MG. AnaisBelo Horizonte, MG, 2003. 14 p.

Apêndice 1

Datas de Publicação

  • Publicação nesta coleção
    02 Jun 2008
  • Data do Fascículo
    Abr 2008

Histórico

  • Aceito
    19 Out 2007
  • Recebido
    27 Nov 2006
Universidade Federal de São Carlos Departamento de Engenharia de Produção , Caixa Postal 676 , 13.565-905 São Carlos SP Brazil, Tel.: +55 16 3351 8471 - São Carlos - SP - Brazil
E-mail: gp@dep.ufscar.br