Acessibilidade / Reportar erro

Significância de efeitos técnicos na eficiência de produção da pesquisa agropecuária

Resumos

Neste artigo utilizam-se modelos estatísticos censurados e truncados na avaliação de efeitos técnicos que potencialmente afetam a fronteira de produção dos centros de pesquisa da Embrapa (Empresa Brasileira de Pesquisa Agropecuária). Especificamente estuda-se a significância dos fatores nível da geração fundos para pesquisa externamente ao Tesouro Nacional, ações de parceria, qualidade técnica dos projetos de pesquisa, satisfação dos clientes, mudança administrativa, tipo e tamanho, na eficiência técnica de produção dos centros de pesquisa. As medidas de eficiência técnica são calculadas com base na Análise de Envelopamento de Dados (DEA) e na Análise de Fronteiras Estocásticas de Produção. Conclui-se que as medidas de eficiência DEA são mais informativas para a avaliação dos efeitos técnicos e que a geração de renda, as ações de parceria, a qualidade técnica dos projetos e o tamanho são fatores significantes. A análise estatística que conduz a esses resultados ajusta, às medidas de eficiência DEA, um modelo do tipo Tobit definido por uma distribuição na família gama. A análise Tobit é consistente com o ajuste de uma distribuição normal truncada aos resíduos obtidos de uma função de produção DEA.

fronteira estocástica; modelos Tobit; DEA; eficiência da pesquisa agropecuária


This article uses censored and truncated statistical models to assess technical effects potentially affecting the production frontier of Embrapa's (Empresa Brasileira de Pesquisa Agropecuária) research centers. Specifically the article assesses the significance of the factors level of research funds generated externally to the National Treasury, actions of partnership, technical quality of research projects, client satisfaction, change in administration, type and size on the measurement of technical efficiency of the research centers. Efficiency measures are computed both using Data Envelopment Analysis (DEA) and Stochastic Frontier methods. It is concluded that the DEA efficiency measurements provide more information regarding the assessment of technical effects and that revenue generation, actions of partnership, technical quality of projects, and size are significant factors. The statistical analysis leading to these results fits a Tobit model, defined by a distribution in the gamma family, to DEA technical efficiency measurements. This analysis is consistent with the fit of a truncated normal distribution to residuals obtained from the fit of a DEA production function.


Significância de efeitos técnicos na eficiência de produção da pesquisa agropecuária* * O autor agradece ao Conselho Nacional de Desenvolvimento Científico e Tecnológico suporte financeiro.

Geraldo da Silva e Souza

Empresa Brasileira de Pesquisa Agropecuária - SGE. Universidade de Brasília - Departamento de Estatística. geraldo.souza@embrapa.br

RESUMO

Neste artigo utilizam-se modelos estatísticos censurados e truncados na avaliação de efeitos técnicos que potencialmente afetam a fronteira de produção dos centros de pesquisa da Embrapa (Empresa Brasileira de Pesquisa Agropecuária). Especificamente estuda-se a significância dos fatores nível da geração fundos para pesquisa externamente ao Tesouro Nacional, ações de parceria, qualidade técnica dos projetos de pesquisa, satisfação dos clientes, mudança administrativa, tipo e tamanho, na eficiência técnica de produção dos centros de pesquisa. As medidas de eficiência técnica são calculadas com base na Análise de Envelopamento de Dados (DEA) e na Análise de Fronteiras Estocásticas de Produção. Conclui-se que as medidas de eficiência DEA são mais informativas para a avaliação dos efeitos técnicos e que a geração de renda, as ações de parceria, a qualidade técnica dos projetos e o tamanho são fatores significantes. A análise estatística que conduz a esses resultados ajusta, às medidas de eficiência DEA, um modelo do tipo Tobit definido por uma distribuição na família gama. A análise Tobit é consistente com o ajuste de uma distribuição normal truncada aos resíduos obtidos de uma função de produção DEA.

Palavras-chave: fronteira estocástica; modelos Tobit; DEA; eficiência da pesquisa agropecuária.

Códigos JEL: C1; C2; C5; C6.

ABSTRACT

This article uses censored and truncated statistical models to assess technical effects potentially affecting the production frontier of Embrapa's (Empresa Brasileira de Pesquisa Agropecuária) research centers. Specifically the article assesses the significance of the factors level of research funds generated externally to the National Treasury, actions of partnership, technical quality of research projects, client satisfaction, change in administration, type and size on the measurement of technical efficiency of the research centers. Efficiency measures are computed both using Data Envelopment Analysis (DEA) and Stochastic Frontier methods. It is concluded that the DEA efficiency measurements provide more information regarding the assessment of technical effects and that revenue generation, actions of partnership, technical quality of projects, and size are significant factors. The statistical analysis leading to these results fits a Tobit model, defined by a distribution in the gamma family, to DEA technical efficiency measurements. This analysis is consistent with the fit of a truncated normal distribution to residuals obtained from the fit of a DEA production function.

1. INTRODUÇÃO

Neste artigo exploram-se as propriedades estatísticas dos métodos de estimação de fronteiras de produção. Utilizam-se modelos de fronteiras de produção determinísticos e estocásticos na avaliação da importância de efeitos técnicos de interesse. Os dois objetivos principais do artigo são a apresentação das classes de modelos estatísticos que podem ser usados em geral na análise de dados de fronteira de produção e a avaliação, numa situação particular, da significância de certas covariáveis de interesse administrativo (efeitos técnicos) na especificação de componentes de eficiência técnica. No contexto desta aplicação, a população de medidas de eficiência de interesse é definida em associação ao processo de produção dos centros de pesquisa da Embrapa.

Para a aplicação em apreço as medidas de eficiência técnica geradas pelos modelos de fronteiras de produção determinístico e estocástico são comparadas, quanto ao seu conteúdo informativo, relativamente a significância dos fatores técnicos, seguindo-se a abordagem de Eseinbeis et alii (1999). A discussão sobre modelagem DEA representa uma generalização dos métodos de análise propostos por Banker (1993), Mccarthy e Yaisawarng (1993), Coelli et alii (1997) e Souza (2001, 2003).

O modelo de fronteira estocástica utilizado neste artigo é o mesmo considerado em Battese e Coelli (1993). Esse modelo ajusta uma superfície resposta do tipo Translog a dados de produção para os quais a ineficiência técnica é especificada com o uso de uma distribuição normal truncada cuja média e variância são funções dos efeitos técnicos.

A consideração de modelos censurados no ambiente DEA tem por objetivo tornar viável uma análise estatística de efeitos técnicos semelhante a que se utiliza na análise de fronteiras estocásticas. A técnica consiste em calcular, em um primeiro estágio, uma medida de eficiência e, ulteriormente, postular um modelo estatístico flexível, dependente dos efeitos técnicos de interesse, para aproximar a distribuição da medida de eficiência.

Embora os procedimentos de avaliação em dois estágios tenham sido criticados recentemente na literatura de produtividade, com os modelos DEA, veja-se Simar e Wilson (2002) e Wilson (2003), a abordagem é válida quando o modelo de produção é do tipo determinístico e tem respostas univariadas, i.e, possui um único produto como resposta, como demonstrado em Banker (1993) e Souza (2001, 2003). A aplicação levada a efeito neste artigo é desse tipo.

A discussão apresentada no artigo prossegue como segue. Na Seção 2 introduz-se o modelo de produção de pesquisa da Embrapa compreendendo as variáveis de produção (insumos e produtos) e os efeitos técnicos considerados de importância gerencial. A Seção 3 introduz o modelo de fronteira de produção estocástico tal como desenvolvido em Battese e Coelli (1993). A Seção 4 trata dos problemas associados a abordagem DEA e de como generalizar os modelos estatísticos sugeridos em Banker (1993) e em Souza (2001, 2003) para modelos do tipo Tobit não normais. Na Seção 5 discutem-se aspectos descritivos das medidas de eficiência calculadas para os centros de pesquisa da Embrapa. As fronteiras estocástica e determinística (DEA) são apresentadas nas Subseções 5.1 e 5.2 respectivamente. Finalmente compila-se um resumo e apresentam-se conclusões na Seção 6.

2. O MODELO EMBRAPA DE PRODUÇÃO DE PESQUISA

O sistema Embrapa de pesquisa compõe-se de 37 centros de pesquisa. Estes centros estão distribuídos pelo país e são classificados segundo suas missões e objetivos de pesquisa como centros ecorregionais (13), centros de produto (15) e centros temáticos (9). A empresa monitora 28 variáveis de produção e 3 variáveis de insumo em seu sistema de produção de pesquisa. Não se pretende descrever em detalhes a natureza destas variáveis aqui. Apenas um breve resumo será apresentado. Uma descrição completa é encontrada em Souza et alii (1999). As variáveis de produção podem ser classificadas em quatro categorias. Produção Científica (3), Produção de Publicações Técnicas (6), Desenvolvimento de Tecnologias, Produtos e Processos (8) e Difusão de Tecnologias e Imagem (11). A categoria de Produção Científica inclui a publicação de capítulos de livro, de artigos em periódicos com referato e de artigos e resumos em proceedings de congressos e reuniões técnicas. A categoria de Produção de Publicações Técnicas agrupa as publicações produzidas nos centros de pesquisa visando principalmente o negócio e a produção agrícola. Típicos desta categoria são as instruções e recomendações técnicas que são publicações escritas em linguagem simplificada e dirigidas a extensionists e fazendeiros. Tais publicações contêm recomendações técnicas com respeito a sistemas de produção agropecuária. Na categoria de Desenvolvimento de Tecnologias, Produtos, e Processos se agrupam variáveis relacionadas ao esforço feito por uma unidade de pesquisa para tornar sua produção disponível para a sociedade na forma de um produto final. Típico desta categoria é a produção de novos cultivares (variedades) de planta. Finalmente, a categoria de Difusão de Tecnologias e Imagem inclui variáveis relacionadas ao esforço de uma unidade em tornar seus produtos conhecidos pelo público e ao marketing de sua imagem. Típicos nesta categoria são a organização de dias de campo e de unidades de demonstração. O objetivo da primeira é a difusão de conhecimento, tecnologias, e inovações aos fazendeios e extensionists e da última é o de demonstrar resultados de pesquisa já na forma de um produto acabado.

Os 3 insumos considerados são x1-custos de pessoal, x2-custos operacionais e x3-custos de capital.

As variáveis de produção (produto e insumos) da Embrapa constam da tabela 1. Uma única medida de produto (y) é ali apresentada como resultado de uma média ponderada dos 28 índices de produção definidos pelo conjunto de variáveis consideradas como produtos. Cada componente dessa média é um índice que mede desempenho relativamente a um ponto de referência. Dessa forma a produção combinada dá informação sobre quanto cada centro de pesquisa desvia-se, em média, de um padrão básico especificado para todo o conjunto de variáveis de produto. Os insumos também estão medidos como índices relativos a um ponto de referência. Para os dados (y, x1, x2 e x3) da tabela 1 o ponto de referência para cada variável, quer se trate de insumo (xi) ou produto (y), foi escolhido como a média da empresa no ano de 2000.

O uso de uma medida agregada de produto é motivada como segue. O ajuste de uma fronteira de produção quer no contexto determinístico, quer no estocástico, pressupõe homogeneidade das unidades de produção envolvidas quanto a natureza do processo de produção subjacente. Esta hipótese não se verifica estritamente na Embrapa. Embora todas as unidades produzam alguma quantidade de todas as variáveis de produção consideradas, e se utilizem dos mesmos tipos de insumo, têm percepções distintas sobre a importância relativa de cada categoria de produção. Um centro de biotecnologia, por exemplo, considera como categoria mais importante a produção científica enquanto um centro de produto, tipicamente, considera como mais importante a categoria de Desenvolvimento de Tecnologias, Produtos e Processos. A Embrapa procurou resolver este problema agregando o produto com o uso de um sistema de pesos variável por unidade de pesquisa. Tal sistema de pesos não pode ser determinado de modo automático por uma técnica como DEA, por exemplo, devido a falta de homogeneidade das unidades envolvidas na avaliação. Outro problema técnico pertinente ao método DEA é que o uso excessivo de variáveis de produção, sem algum tipo de agregação a priori, torna todos os centros de pesquisa eficientes.

A definição de um sistema de pesos a priori que sirva ao propósito da obtenção de uma medida univariada representativa do ouptut e que permita comparações entre unidades é uma tarefa complexa. No caso da Embrapa os pesos foram definidos como resultado de um estudo que envolveu cerca de 500 pesquisadores e todos os administradores da empresa. A cada participante da pesquisa associada ao estudo pediu-se que manifestasse na escala 1 (menos importante) a 5 (mais importante), sua percepção sobre a importância de cada categoria de produção e de cada variável de produção em sua categoria respectiva. O modelo postulado para a análise desses dados é conhecido como Lei dos Julgamentos Categóricos e é derivado da Lei dos Julgamentos Comparativos proposta por Thurstone (1927). Esta lei teve seu uso popularizado em economia por McFadden (1974) que a utiliza para modelar preferências. A Lei dos Julgamentos Categóricos tem por objetivo transformar a escala de percepção ordinal e individual dos avaliadores numa escala intervalar representativa da população da qual a amostra de avaliadores foi extraída. A importância relativa de cada variável pode então ser determinada tendo por base as diferenças estimáveis na escala contínua. Para mais detalhes sobre este processo veja Souza et alii (2000) e Souza (2002). Os pesos resultantes da técnica de Thurstone tem estrutura semelhante aos gerados pelo método AHP de Saaty (1994).

No contexto acima descrito a Embrapa tem-se utilizado de um modelo DEA para avaliar a eficiência e a produtividade de seus centros de pesquisa. Algumas questões de interesse gerencial surgiram como conseqüência do processo de avaliação. Todas associadas a fatores exógenos afetando o processo de avaliação. Argumenta-se, por exemplo, que o processo de avaliação aumenta a competição interna entre os centros e inibe parcerias úteis para a pesquisa. Outras variáveis contextuais, medidas para cada centro de pesquisa, que potencialmente podem estar associadas ao nível de eficiência técnica de um centro de pesquisa, tem a ver com a ocorrência de mudanças administrativas, com o nível de satisfação dos clientes, com a qualidade técnica de projetos, com a capacidade das lideranças das unidades em obter recursos orçamentários para a pesquisa externos ao Tesouro e com o tipo e o tamanho de uma unidade.

Com o intuito de avaliar a importância das variáveis contextuais na medida de eficiência técnica este artigo propõe modelos estatísticos que incorporam efeitos técnicos associados a essas variáveis na especificação da distribuição da componente de ineficiência do modelo de fronteira. A especificação desses efeitos para a aplicação particular da Embrapa consta da Seção 5.

3. O MODELO DE FRONTEIRA DE PRODUÇÃO ESTOCÁSTICA

Seguindo Battese e Coelli (1993) e Kumbhakar e Lovell (2000), considere para um conjunto de firmas, o modelo de fronteira de produção estocástica definido por

onde yj representa a produção da firma j, xj é um vetor de dimensão k de funções conhecidas dos insumos, b é um vetor de parâmetros desconhecidos de dimensão k, os vj são erros não correlacionados, normalmente distribuídos, com média zero e variância constante e os uj são variáveis aleatórias independentes, não negativas, relacionadas a ineficiência técnica. Supõem-se adicionalmente que uj e vj e são independentes.

Battese e Coelli (1993) sugerem o uso da família de distribuições normais truncadas (em zero) N(µj,) para modelar a distribuição das componentes uj. A inclusão de efeitos técnicos zj no modelo é feita postulando que µj = zjd sendo d um parâmetro desconhecido.

A média e a variância da distribuição N+(µj,) são dadas por µj+sulj e

respectivamente, com

.

As funções f(.) e F(.) representam as funções densidade de probabilidades e de distribuição da normal padrão, respectivamente. Como a média e a variância da normal truncada são funções monotônicas de µj, segue que o modelo de fronteira de produção estocástica incorpora heteroscedasticidade monotônica. Pode-se modelar também as variâncias de modo a se permitir heteroscedasticidade não monotônica. Por exemplo, pode-se postular que . Esta abordagem aparece em Wang (2002) e não será utilizada aqui.

Coelli et alii (1997) sugerem que a distribuição normal truncada é suficientemente flexível na maioria das aplicações. Competitiva da formulação normal-normal truncada é a especificação do tipo normal-gama. Neste caso pode-se supor que µj tem distribuição G(p, zj), onde o parâmetro de forma p é fixo e zj = exp{ -µj}. Este modelo também assume heteroscedasticidade monotônica e generaliza o caso exponencial (p = 1). Contudo a formulação normal-gama não é analíticamente tratável, particularmente para a caracterização da função de verossimilhança e da distribuição condicional de dado uj dado j. Veja-se Greene (2003).

A especificação adequada das funções dos insumos dotam de flexibilidade o modelo de fronteira estocástica. O uso de logs, por exemplo, conduz às funções de Cobb-Douglas e ao Translog. Com normalização adicional dos dados e acrescentando-se termos em senos e cosenos ao Tranlog, obtém-se a forma flexível de Fourier (Gallant (1982). Neste artigo consideraremos a superfície resposta do modelo de fronteira estocástica na família Translog com a especificação de erros normal-normal truncada.

A eficiência técnica no modelo de fronteira de produção estocástica é orientada para produto e é definida para a j-ésima firma sob estudo por

Esta quantidade é precisamente exp{-uj } e é estimada pela esperança condicional

onde

j = vj-uj.

Battese e Coelli (1993) mostram que para a especificação de erros normal-normal truncada

onde

e

A função log verossimilhança a ser maximizada como função dos parâmetros b, d, e , vem dada por

onde l = su/sv e s2 = +. Usando a reparametrização g = su/sv obtém-se

O ajuste do modelo de fronteira de produção estocástica pode ser levado a efeito com o uso do procedimento PROC NLMIXED do SAS ou com o uso do programa Frontier (Coelli et alii (1997). Este último faz uso da função log verossimilhança reparametrizada na forma dependente do parâmetro g.

Coelli et alii (1997) descrevem em detalhes como escolher valores iniciais para os parâmetros no processo de maximização da função de verossimilhança. Primeiramente toma-se d = 0. O estimador de mínimos quadrados ordinários para o modelo resultante fornece estimadores consistentes com exceção do intercepto b0 e de s2. Num segundo passo a função log verossimilhança é calculada para um grid de valores de g no intervalo (0,1). Nesses cálculos, os estimadores de mínimos quadrados e são ajustados por

sendo

Os melhores valores do grid são utilizados para inicializar o algorítimo de maximização da função log verossimilhança.

O teste estatístico da hipótese H: g = 0 contra a alternativa unicaudal A: 0 < g < 1 pode ser levado a efeito com uso da razão de verossimilhança. A hipótese H é equivalente a especificação do modelo de produção sem a componente de ineficiência uj. A estatística teste é obtida calculando-se LR=-2ln(L(H))-ln(L(A)) onde L é a função de verossimilhança. Para o teste com nível de significância a tal que 2a Î (0,1), utiliza-se o valor crítico a para o qual P( > a) = 2a.

Coelli et alii (1997) sugerem que valores de g próximos a um são indicativos de que as observações suportam um modelo de fronteira determinística, i.e, um modelo sem o termo uj. No meu nível de conhecimento um teste formal desta hipótese não está disponível na literatura no momento.

Uma medida de bondade de ajuste (goodness of fit) para o modelo de fronteira estocástica se obtém calculando um coeficiente de correlação entre valores observados e preditos. Para o modelo em forma logarítmica o valor predito do log de uma observação é dado por onde ln(x) é o vetor com logs dos insumos.

4. ANÁLISE DEA

Considere um processo de produção com n firmas. Cada firma se utiliza de quantidades variáveis de s insumos na produção do produto r dimensional y. Denote por Y = (y1,...,yn) a matriz de produção r × n e por X = (x1,...,xn) a matriz s × n de utilização de insumos. Note-se que o elemento yj é o vetor produzido pela firma j e que xj é o vetor de insumos utilizados pela firma j na produção de yj. Supõe-se que pelo menos uma componente de cada vetor de insumos e de cada vetor de produtos seja estritamente positiva. Tipicamente, nas discussões de modelos DEA, supõe-se também que as variáveis de insumo e de produto sejam medidas em quantidades físicas. Isto não é estritamente necessário e proxies podem ser utilizadas refletindo a intensidade de uso de insumos e da produção.

É possível definir medidas DEA de eficiência técnica em vários contextos. Veja Färe et alii (1994), Coelli et alii (1997), Cooper et alii (2000) e Thanassoulis (2001). Aqui lidar-se-á com o modelo mais próximo da discussão levada a efeito sobre fronteiras estocásticas na seção precedente.

Definição 4.1. A medida de eficiência técnica (DEA), da firma j, sob a hipótese de retornos variáveis à escala e orientada para a produção, é dada pela solução do problema de programação linear maxf, vf sujeito as restrições

1. v = (v1,...,vn)' > 0 e vn = 1.

2. Yv > fyj.

3. Xv < xj.

A solução ótima f*> 1, do problema da Definição 4.1, é a eficiência técnica de produção da firma j. As firmas para as quais os valores correspondentes das ineficiências técnicas são unitários são eficientes. Um valor f* > 1 significa que a firma é ineficiente e que, no contexto do modelo de produção DEA, deve aumentar radialmente sua produção por este fator para tornar-se eficiente.

Quando r = 1 é possível delinear um modelo estatístico de produção relativamente ao qual as medidas de eficiência DEA têm propriedades não paramétricas ótimas. De fato, neste caso, suponha que os pares (x'j, yj) satisfaçam o modelo de fronteira determinística yj = g(xj)-j, onde g(x) é uma função de produção não conhecida. Supõe-se que o espaço de insumos K é compacto e convexo em s. A função g(x) é monotônica, côncava e para todo j, g(x) > yj. As variáveis j são não negativas e independentemente distribuídas.

A técnica DEA pode ser utilizada para estimar g(x) quando x for um elemento do conjunto

Para cada x Î K* o estimador DEA de g(x) é dado por

Pode-se demonstrar que para cada j, (x) = yj, onde é a eficiência técnica calculada como na Definição 4.1.

A função (x) é uma função de produção definida no conjunto compacto e convexo, K*, i.e, é monótona, côncava e satisfaz (xj) > yj . Tem também a propriedade da extrapolação máxima, i.e, para qualquer função de produção f(x), f(x) > para x Î K*. Mostra-se em Banker (1993) e em Souza (2001), que é um estimador de máxima verossimilhança não paramétrico de g(x). Souza (2001) mostra também que (x) é fortemente consistente e que os resíduos = (-1)yj, quando n é grande, têm o mesmo comportamento distribucional dos resíduos ej.

Extendendo resultados devidos a Banker (1993), Souza (2001) discute duas famílias de distribuições para os

j consistentes com os resultados descritos acima. As famílias exponencial e normal truncada com parâmetros variáveis. A consideração dessas distribuições, na especificação do modelo estatístico de fronteira determinística, permite o uso, no ambiente DEA, de métodos de análise típicos de fronteiras estocásticas de produção. Especificamente, pode-se postular heteroscedasticidade monotônica e, simultâneamente, modelar a presença de efeitos técnicos, através do estabelecimento de uma dependência dos parâmetros de localização e escala dessas duas famílias de distribuições, em construtos lineares das covariáveis de interesse.

Os resultados obtidos em Souza (2001) sugerem que os modelos censurados como o de Tobit possam ser também utilizados no ajuste das ineficiências

j. Modelos deste tipo são particularmente convenientes pois, em qualquer aplicação, alguns dos serão nulos.

Uma vantagem adicional dos modelos censurados é que estes modelos podem ser utilizados no ajuste das próprias medidas de eficiência em qualquer contexto em que estas estão definidas, desde que se tenham razões para acreditar que as firmas tomem suas decisões de produção independentemente. Nestas condições, acredita-se que as correlações observadas entre as medidas de eficiência não serão fortes o suficiente para invalidar a análise. Os resultados de Banker (1993), Souza (2001), faz-se mister observar aqui, confirmam esta conjectura no caso univariado, para amostras grandes. Os modelos de Tobit tem sido usados neste contexto na literatura. Veja-se Mccarthy e Yaisawarng (1993).

Neste artigo, além das distribuições sugeridas em Souza (2001), propõe-se, para o caso de produção unidimensional, extensões do tipo Tobit supondo heteroscedasticidade e não normalidade. Com este propósito exploram-se duas extensões para o modelo Tobit. O Tobit-gama e o Tobit-normal truncada.

Para os modelos Tobit começa-se a discussão com o Tobit clássico (normal) prosseguindo-se com as generalizações para o Tobit-normal heteroscedástico, Tobit-normal truncada e Tobit-gama. A notação utilizada para os construtos lineares dos efeitos técnicos é a mesma da seção anterior.

Considere o modelo de Tobit clássico com ponto de censura a onde a resposta wj (o resíduo do modelo de fronteira determinística, ou qualquer medida de eficiência técnica DEA) é definida por

com = µj+oj. Os erros aleatórios oj têm distribuição N(0,s2). Nas aplicações de interesse para este artigo a = 1 ou a = 0. Os parâmetros dn dos efeitos técnicos presentes em µj podem ser estimados pelo método de máxima verossimilhança. Esta abordagem exige a maximização da função de verossimilhança

relativamente a d e s.

A versão heteroscedástica do modelo de Tobit que será considerada aqui supõe que , sendo lj um vetor de observações em variáveis que afetam a variância e x o vetor de parâmetros correspondente. Com modificações óbvias na função de verossimilhança procura-se agora pelo máximo relativamente a d e x.

Apresentam-se agora outras versões do modelo de Tobit que permitem censura num valor a > 0. Primeiramente suponha que a distribuição de seja a distribuição normal truncada com média µj e variância s2. A função de verossimilhança para este modelo vem dada por

Finalmente suponha que a distribuição de seja gama com parâmetro de forma p > 0 e parâmetro de escala zj = exp{-µj}, onde, como anteriormente, µj = z'jd. A distribuição exponencial é um caso particular com p = 1. Denote por G(.) a função gama e por Gp(.) a função de distribuição da distribuição gama com parâmetro de forma p e parâmetro de escala unitário. A função de verossimilhança para a versão Tobit-gama vem dada por

No contexto de modelos estatísticos do tipo Tobit, para avaliar o ajuste, bem como a direção de influência dos efeitos marginais na variável resposta, é necessário calcular o valor esperado da variável resposta, dada as observações nos efeitos técnicos e valores para os parâmetros. Para o modelo Tobit clássico tem-se

com modificações óbvias para acomodar o caso heteroscedástico. Para o modelo Tobit-normal truncada, tem-se

Finalmente, para a especificação Tobit-gama,

As três esperanças matemáticas mostradas acima são funções monotônicas do construto µj.

5. ANÁLISE DE RESULTADOS

A Tabela 2 mostra valores das variáveis contextuais e das eficiências obtidas com as abordagens DEA (Rvs) e de fronteira estocástica (Sf) para o ano 2000. As fronteiras são tratadas em detalhes em 5.1 e 5.2. Note-se que, com a notação da Seção 4, Rvs = 1/f*. A variável Sf é calculada com o uso da especificação completa do Translog, incluindo os efeitos técnicos na componente de ineficiência.

As variáveis contextuais de interesse são a intensidade da geração de fundos para a pesquisa (Rp), ações de parceria (Ap), satisfação de clientes (Sc), qualidade técnica dos projetos de pesquisa (Qt), tipo, tamanho e mudança administrativa (Vd) ocorrida durante os seis primeiros meses do período de avaliação ou durante os seis meses precedentes a este período. As variáveis tipo, tamanho e Vd são categóricas. Tipo tem níveis E (ecorregional), T (temático) e P (produto). Tamanho tem níveis G (grande), M (Médio) e P (pequeno). A variável Vd assume o valor 1 se houve mudança administrativa na unidade e o valor 0 de outro modo. A classificação em tamanho foi levada a efeito com a utilização de análise de conglomerados, com o método de Ward, aplicada aos insumos. Rp, Ap, Sc e Qt são escores quantitativos normalizados para variarem entre 0 e 1. A escala, em qualquer caso, é monotônica com o valor 1 representando o maior valor. Rp e Ap são índices relativos. A variável Rp é o quociente dos fundos obtidos pelo total dos recursos liberados pelo Tesouro para a unidade, excetuando-se despesas com pessoal. Ap é definida como o número médio de parcerias por pesquisador. Sc e Qt derivam de escores de avaliação calculados para a empresa por consultores externos.

A correlação de postos entre Rvs e Sf é de 32% indicando uma associação de fraca intensidade entre as abordagens DEA e de fronteira estocástica. Isto sugere que as classificações das firmas segundo os dois critérios diferem. Os valores medianos (Tabela 3) das medidas de eficiência técnica Rvs e Sf apontam na mesma direção quanto a tipo. Os centros temáticos tem performance superior aos centros ecoregionais e de produto. Para Rvs os centros maiores tem melhor performance e não se nota diferença apreciável entre os centros médios e pequenos. Para Sf os centros médios tem a melhor performance seguido dos grandes e pequenos. Para ambas as variáveis os centros pequenos são os que mostram a pior performance. A mudança administrativa conduziu a valores maiores de Rvs e Sf. As análises de covariância (Ancova) nos postos de Rvs e Sf (Tabelas 4 e 5), como esperado, diferem. A Ancova é marginalmente significante para Rvs e altamente significante para Sf. Para a variável Rvs, Rp e Qt são significantes com tipo, tamanho e Ap seguindo em importância. Não se nota significância das variáveis Vd e Sc. Para a análise com a resposta Sf , tipo, tamanho e Vd são altamente significantes e Ap é significante. As variáveis Rp, Sc e Qt não são significantes. Sabe-se que as análises de covariância, com sabor não-paramétrico, como consideradas aqui, são robustas relativamente a presença de correlação moderada nas observações da variável resposta, atipicidades, heteroscedasticidade e não normalidade. A consistência dessas Ancovas com as abordagens paramétricas é um dos critérios utilizados na avaliação dos modelos paramétricos.

5.1. Análise da Fronteira Estocástica

Para os dados da Embrapa, a especificação na forma Translog leva ao modelo estatístico

com

sendo M e G variáveis indicadoras para os centros médios e grandes e T e P variáveis indicadoras de centros temáticos e de produto, respectivamente. As variáveis xi representam os insumos, y a medida de produto e Rp, Ap, Sc, Qt e Vd as demais variáveis contextuais.

Na análise preliminar de fronteira estocástica comparam-se as especificações Translog (modelo completo) e Cobb-Douglas (modelo reduzido). O modelo ajustado em cada caso superpõe à estrutura de erros normais N(0,), ineficiências N+(µj,), onde µj é o construto linear definido pelos efeitos técnicos. O processo de estimação, via máxima verossimilhança, foi levado a efeito com o software Frontier. Os critérios de informação de Akaike e de Shwarz1 1 O critério de informação de Akaike é definido por -2ll+2k onde ll é a função log verossimilhança e k o número de parâmetros ajustados. O critério bayesiano de Shwarz é definido por -2ll+klog(n) onde n é o número de firmas. O melhor modelo deve possuir o menor valor para ambos os critérios. (tabela 6) não apontam para o mesmo melhor modelo. O critério de Akaike indica a formulação Translog e o de Shwarz a formulação Cobb-Douglas. A estatística do teste da razão de verossimilhança é significante no nível de 5% e aponta na direção do Translog.

No contexto do ajuste do Translog (Tabela 7) a estatística do teste da razão de verossimilhança, para a presença de efeitos técnicos, tem por valor 13,4 com 9 graus de liberdade. O valor p correspondente é 0,145 e não é significante. Este resultado difere marcantemente da análise de covariância da medida de eficiência técnica gerada por este modelo.

O valor obtido para o teste da razão de verossimilhança da hipótese é LR = 13,41 e este valor excede o nível crítico de 2,71 para um teste no nível de significância 5%, favorecendo o modelo estocástico. Para o Translog a correlação de posições entre valores observados e preditos é 0,578.

5.2. Análise das Respostas DEA

O modelo DEA ajustado para a Embrapa aos dados da Tabela 1 assume retornos variáveis à escala. É o mesmo da Definição 4.1. Os insumos são x1, x2 e x3 e o produto y.

Muitas publicações na área de análise DEA fazem uso das medidas de eficiência correspondentes como variáveis dependentes em problemas de regressão. Exemplos típicos de tal abordagem aparecem em McCarty e Yaisawarng (1993), Arnold, Bardan e Cooper (1994), Eisenbeis, Ferrier e Kwan (1999) e Sathie (2001). Estas aplicações implicitamente assumem que as medidas de eficiência DEA são não correlacionadas. Esta hipótese se justifica para o modelo de produção determinístico, com respostas univariadas, como demonstrado em Banker (1993) e Souza (2001). Em casos mais gerais (produto multidimensional) Banker e Natarajan (2004) sugerem que os mesmos resultados se verifiquem. É possível também que se possa extender os resultados de Souza (2001) para funções custo, mas esses resultados ainda não estão disponíveis na literatura. Como suporte adicional, para a aplicação presente, aos resultados assintóticos de Banker (1993) e Souza (2001), procuramos por evidência de correlações significantes entre as medidas de eficiência DEA (f*) dos centros de pesquisa da Embrapa, através da realização do teste de corridas (runs test). Veja Spiegel e Stephens (1999). Sob a hipótese de independência o número de corridas R = 20 (calculado depois de arranjar os dados dos centros de pesquisa em ordem alfabética pelo nome do centro) tem distribuição normal com média e variância

respectivamente. Nestas expressões N1 = 18 é o número de observações abaixo da mediana (1,74825) e N2 = 18 é o número de observações acima da mediana. Segue que o teste estatístico da hipótese de independência vem dado por z = (20-19)/2,9568 = 0,338 e não é significante.

Para o ajuste dos resíduos consideram-se quatro modelos probabilísticos consoantes com a discussão levada a efeito na Seção 4. Estes são o Tobit-clássico, o Tobit heteroscedástico (com função de ligação exponencial para a variância dependente do tamanho de cada centro de pesquisa), a distribuição normal truncada e a distribuição exponencial. O ajuste estatístico desses modelos foi levado a efeito com o PROC NLMIXED do SAS (Tabelas 8 e 9). O melhor modelo segundo os critérios de informação é o obtido da distribuição normal truncada. A correlação de posições entre valores observados e preditos para esse modelo é 0,587. Rp, Ap, Qt, tamanho e tipo são fatores significantes. Aumentos em Ap e Qt, tudo o mais constante, implicam em aumento do escore de efeito técnico e portanto conduzem a um nível maior de eficiência pois os resíduos, na média, decrescem. A variável Rp aponta na direção contrária de Ap e Qt. A habilidade de um centro em gerar recursos de fomento à pesquisa não afeta a eficiência técnica positivamente.

Os modelos tendo como resposta (f*) foram ajustados, com o uso do PROC QLIM e do PROC NLMIXED do SAS (Tabelas 10 e 11). Estes são o Tobit, o Tobit heteroscedástico, o Tobit-normal truncada, o Tobit-exponencial e o Tobit-gama. Os critérios de informação e a função de verossimilhança dão indicação de que a melhor alternativa é o modelo Tobit-gama. Para este modelo a correlação de posições entre valores observados e preditos é 0,557. Vê-se aqui que os resultados estatísticos concordam em geral com a análise dos resíduos do modelo de produção determinístico. As variáveis importantes na explicação do nível de f* são Rp, Ap, Qt, tamanho e, marginalmente, tipo. Como no caso dos resíduos , Rp aponta em direção oposta a Ap e Qt. Esses resultados mostram muito mais concordâncias com a Ancova (não paramétrica) do que os obtidos com Sf.

6. CONCLUSÕES

Investigou-se o conteúdo informativo das medidas de eficiência de produção estocástica e determinística da produção de pesquisa dos centros da Embrapa, em termos de associações com fatores técnicos de importância gerencial. A abordagem no cálculo das medidas de eficiência é voltada para a produção e assume retornos variáveis à escala. No caso estocástico a especificação da fronteira é feita com o uso da forma flexível Translog. No caso não-paramétrico (determinístico) utilizou-se um modelo DEA com retornos variáveis. Esta abordagem considera, como pares, na avaliação de cada unidade, apenas unidades aproximadamente de mesmo tamanho que a unidade sendo avaliada.

Do ponto de vista do ajuste estatístico de modelos paramétricos, a medida de eficiência técnica com mais conteúdo informativo é fornecida pela abordagem DEA. Esta mostra também consistência com a análise de covariância não-paramétrica. Quanto a abordagem estocástica não se detecta significância dos efeitos técnicos nem consistência com a análise de covariância não paramétrica correspondente.

Para a abordagem DEA o ajuste da distribuição normal truncada aos resíduos da produção e o modelo Tobit-gama, com censura unitária, produzem essencialmente os mesmos resultados e representam os melhores ajustes.

Os efeitos técnicos, associados às variáveis contextuais, significantes são o esforço na captação de recursos para a pesquisa externos ao Tesouro, ações em parceria, qualidade técnica de projetos, tipo e tamanho. Observa-se que o esforço na captação de recursos tem efeito negativo sobre a medida de eficiência de produção. Por outro lado observam-se efeitos positivos associados às ações em parcerias e na qualidade técnica de projetos. As mudanças administrativas ocorridas na vizinhança do tempo de avaliação não parecem ter causado mudanças significantes na eficiência. Os centros maiores tendem a ser mais eficientes. O mesmo se aplica aos centros temáticos. Em parte como resultado dessas observações a Embrapa tem tornado mais justo seu sistema de avaliação. Tem procurado também facilitar a administração das suas unidades melhorando processos e envidando esforços para a liberação mais expedita de recursos do Tesouro. Outra ação gerencial importante para a melhora dos níveis de eficiência e produtividade foi o estabelecimento de metas de operação mais claras e métodos mais rígidos de acompanhamento da execução dos planos diretores e do desempenho institucional. Espera-se que tais medidas tendam a reverter, por exemplo, o efeito negativo de Rp. Faz-se mister ressaltar que a direção da Embrapa tem conseguido manter um nível mediano crescente de eficiência técnica ao longo do tempo. O desafio importante do momento é o de associar a esse crescimento uma redução significativa na variabilidade das medidas de eficiência dos centros de pesquisa. O efeito positivo das parcerias na avaliação da eficiência respondeu a uma crítica importante ao sistema de avaliação. As parcerias não inibem eficiência e devem ser estimuladas. Neste contexto duas decisões gerenciais importantes foram considerados. A manutençao do uso das medidas de eficiência como critério de avaliação institucional e o incentivo às parcerias internas e externas com a criação de um indicador de desempenho institucional adicional incluindo explicitamente o indicador de parcerias.

As medidas de eficência técnica DEA sob a hipótese de retornos constantes apresentam correlação de posição apreciável (cerca de 69%) com as calculadas sob a hipótese de retornos variáveis. Isto sugere que os resultados obtidos aqui para as medidas calculadas com retornos variáveis tenham contrapartida semelhante quando as medidas são calculadas sob retornos constantes. Contudo, as duas medidas diferem bastante em magnitude. Este efeito escala leva a necessidade do uso das medidas de eficiência com retornos variáveis na modelagem para atenuar o efeito do tamanho nas avaliações.

  • Banker, R. D. (1993). Maximum likelihood, consistency and dea: a statistical foundation. Management Science, 39(10):12651273.
  • Banker, R. D. & Natarajan, R. (2004). Statistical tests based on dea efficiency scores. In Cooper, W. W., Seiford, L. M., & Zhu, J., editors, Handbook on Data Envelopment Analysis Kluwer Academic Publishers, Norwell.
  • Battese, G. E. & Coelli, T. J. (1993). A stochastic frontier production function incorporating a model for technical inefficiency effects. Technical Report 69, Department of Econometrics, University of New England, Armidale.
  • Coelli, T., Rao, D. P., & Battese, G. E. (1997). An Introduction to Efficiency and Productivity Analysis Springer.
  • Cooper, W. W., Tone, K., & Seiford, L. M. (2000). Data Envelopment Analysis, A Comprehensive Text with Models, Applications, References and DEA-Solver Software Kluwer, Boston.
  • Eseinbeis, R. A., Kwan, S. H., & Ferrier, G. D. (1999). The informativeness of stochastic frontier and programming frontier efficiency scores: cost efficiency and other measures of bank holding company performance. Working Paper. Federal Reserve Bank of Atlanta, pages 9923.
  • Färe, R., Grosskopf, S., & Lovel, C. A. K. (1994). Production Frontiers Cambridge University Press, New York.
  • Gallant, A. R. (1982). Unbiased determination of production technologies. Journal of Econometrics, 20:285323.
  • Greene, W. H. (2003). Simulated likelihood estimation of the normal-gama stochastic frontier function. Journal of Productivity Analysis, 19:179190.
  • Kumbhakar, S. & Lovell, C. A. K. (2000). Stochastic Frontier Analysis Cambridge University Press, New York.
  • Mccarthy, T. A. & Yaisawarng, S. (1993). The Measurement of Productive Efficiency Oxford University Press, New York.
  • Sathie, M. (1990). X-efficiency in australian banking: an empirical investigation. Journal of Banking and Financing, 25:613630.
  • Simar, L. & Wilson, P. W. (2002). Estimation and inference in two-stage, semi-parametric models of production processes. Discussion Paper no 0307, Institute de Statistique, Université Catholique de Louvain, Louvain-la-Neuve, Bélgica.
  • Souza, G. S. (2001). Statistical properties of data envelopment analysis estimators of production function. Brazilian Review of Econometrics, 21:291322.
  • Souza, G. S. (2002). The law of categorical judgement revisited. Brazilian Journal of Probability and Statitics, 16:123140.
  • Souza, G. S. (2003). Funções de produção, uma abordagem estatística com o uso de modelos de encapsulamento de dados. Texto para Discussão No. 17. Embrapa Informação Tecnológica Brasília. DF.
  • Souza, G. S., Ávila, A. F. D., & Alves, E. (1997). Produtividade e eficiência relativa de produção em sistemas de produção de pesquisa agropecuária. Revista Brasileira de Economia, 51(3):281307.
  • Souza, G. S., Ávila, A. F. D., & Alves, E. (1999). Technical efficiency in agricultural research. Scientometrics, 46:14116.
  • Souza, G. S., Ávila, A. F. D., & Alves, E. (2000). Psicometria linear da escalagem ordinal: uma aplicação na caracterização da importância relativa de atividades de produção em ciência e tecnologia. Cadernos de Ciência e Tecnologia, 17(3):1127.
  • Spiegel, M. R. & Stephens, L. J. (1999). Theory and Problems of Statistics Schawm's outline. McGraw-Hill, New York, 3 edition.
  • Thanassoulis, E. (2001). Introduction to the Theory and Application of Data Envelopment Analysis: A foundation text with integrated software Kluwer Academic Publishers, Boston.
  • Wang, H. (2002). Heteroscedasticity and non-monotonic efficiency effects of a stochastic frontier model. Journal of Productivity Analysis, 18:241253.
  • Wilson, P. W. (2003). Testing independence in models of produtive efficiency. Journal of Productivity Analysis, 20(3):361390.
  • *
    O autor agradece ao Conselho Nacional de Desenvolvimento Científico e Tecnológico suporte financeiro.
  • 1
    O critério de informação de Akaike é definido por -2ll+2k onde ll é a função log verossimilhança e k o número de parâmetros ajustados. O critério bayesiano de Shwarz é definido por -2ll+klog(n) onde n é o número de firmas. O melhor modelo deve possuir o menor valor para ambos os critérios.
  • Datas de Publicação

    • Publicação nesta coleção
      18 Set 2006
    • Data do Fascículo
      Mar 2006
    Fundação Getúlio Vargas Praia de Botafogo, 190 11º andar, 22253-900 Rio de Janeiro RJ Brazil, Tel.: +55 21 3799-5831 , Fax: +55 21 2553-8821 - Rio de Janeiro - RJ - Brazil
    E-mail: rbe@fgv.br