Como medir a confiabilidade de dobras cutâneas

Sichieri, Rosely; Fonseca, Vânia de Mattos; Lopes, Claudia de Souza

doi:10.1590/S1415-790X1999000100008

Resumos

Um dos métodos mais usados para a obtenção de informação relacionada à quantidade de gordura e sua distribuição no organismo é a medida de dobras cutâneas. O treinamento dos antropometristas para realização de medidas de dobras cutâneas representa um grande esforço na pesquisa nutricional e poucos estudos desenvolveram métodos práticos para a padronização destas medidas. O presente estudo compara os resultados de um estudo de confiabilidade utilizando os métodos previamente referidos e o coeficiente de correlação intra-classe (ICC), baseado no modelo ANOVA. Os resultados indicam que o ICC é o melhor método para a padronização dos antropometristas.

Confiabilidade da tecnologia; Dobras cutâneas; Coeficiente de correlação intra-classe

One of the most widely used and inexpensive methods for obtaining information concerning the amount and distribution of human subcutaneous fat is the measurement of skinfolds. The skinfold measurement technique requires long-term supervised practice and repetition to obtain reliable results and there are few practical methods for standardizing measures taken by anthropometrists. Two studies, developed methodology to standardize skinfold measurements. We compared data of a reliability study, using the two methods previously discussed, with intraclass correlation coefficient calculations based on an ANOVA mixed model in order to assess two technicians measuring three skinfolds. The technicians tested were considered reliable only when using intraclass correlation coefficients. The intraclass correlation coefficient appears to be a better choice for the standardization of skinfold measurements, since it is not influenced by measurements with greater discrepancies such as those for obese individuals.

Technology reliability; Skinfold; Intraclass correlation coefficient

Como medir a confiabilidade de dobras cutâneas

Measuring the reliability of skinfolds

Rosely Sichieri^I; Vânia de Mattos Fonseca^II; Claudia de Souza Lopes^III

^IInstituto de Medicina Social /UERJ. Rua São Francisco Xavier, 524, 7⁰ andar, Maracanã; 20551-030 Rio de Janeiro, RJ; E-mail: SICHIERI@UERJ.BR

^IIInstituto de Medicina Social e Instituto Fernandes Figueira

^IIIInstituto de Medicina Social, UERJ

RESUMO

Um dos métodos mais usados para a obtenção de informação relacionada à quantidade de gordura e sua distribuição no organismo é a medida de dobras cutâneas. O treinamento dos antropometristas para realização de medidas de dobras cutâneas representa um grande esforço na pesquisa nutricional e poucos estudos desenvolveram métodos práticos para a padronização destas medidas. O presente estudo compara os resultados de um estudo de confiabilidade utilizando os métodos previamente referidos e o coeficiente de correlação intra-classe (ICC), baseado no modelo ANOVA. Os resultados indicam que o ICC é o melhor método para a padronização dos antropometristas.

Palavras-chave: Confiabilidade da tecnologia. Dobras cutâneas. Coeficiente de correlação intra-classe.

ABSTRACT

One of the most widely used and inexpensive methods for obtaining information concerning the amount and distribution of human subcutaneous fat is the measurement of skinfolds. The skinfold measurement technique requires long-term supervised practice and repetition to obtain reliable results and there are few practical methods for standardizing measures taken by anthropometrists. Two studies, developed methodology to standardize skinfold measurements. We compared data of a reliability study, using the two methods previously discussed, with intraclass correlation coefficient calculations based on an ANOVA mixed model in order to assess two technicians measuring three skinfolds. The technicians tested were considered reliable only when using intraclass correlation coefficients. The intraclass correlation coefficient appears to be a better choice for the standardization of skinfold measurements, since it is not influenced by measurements with greater discrepancies such as those for obese individuals.

Keywords: Technology reliability. Skinfold. Intraclass correlation coefficient.

Introdução

Medir pregas cutâneas é um importante método de avaliação da quantidade e da distribuição da gordura corpórea em estudos epidemiológicos, por ser um método barato e não invasivo. Sua realização requer, contudo, treinamento prolongado e supervisão para que se obtenham resultados confiáveis¹, fazendo com que uma importante limitação na utilização das medidas de prega cutânea seja a dificuldade na padronização dos antropometristas. A realização de medidas confiáveis depende de um bom treinamento dos antropometristas, uma vez que o instrumento de coleta parece desempenhar um papel muito pequeno na determinação do erro. Leger e col. ² (1982) compararam medidores de plástico a outros mais sofisticados e, mais comumente utilizados, e não observaram importante discrepância nas medidas.

Embora os erros de medição de pregas cutâneas não possam ser completamente eliminados, existem métodos que permitem avaliá-los, sendo possível incorporar o conhecimento dos erros na análise dos dados. Uma discussão pormenorizada dos erros em medidas antropométricas é encontrada em Lohman e col. ³ (1988).

Duas são as questões a serem enfrentadas quando se deseja aferir medidas antropométricas capazes de retratar o estado nutricional de um indivíduo: a da validade e a da confiabilidade do método utilizado. A validade de um instrumento de medida pode ser definida como a extensão com que as diferenças de resultados obtidos com tal instrumento refletem diferenças reais entre indivíduos⁴. A validade das medidas de dobras cutâneas é aceita com base nas altas correlações encontradas com a medida de gordura corporal feita através de pesagem hidrostática, considerada padrão-ouro⁵ .

A confiabilidade por sua vez é definida como a extensão na qual as medidas (ou atribuições de valores ou categorias), obtidas com determinado teste ou instrumento ou ainda por diferentes avaliadores, são reproduzíveis ou repetíveis ⁶ . Assim, ainda que um método seja válido, testes de confiabilidade do seu uso são necessários⁷.

O treinamento dos antropometristas para realização de medidas de dobras cutâneas representa um grande esforço na pesquisa nutricional, sendo que poucos estudos desenvolveram métodos práticos para a padronização destas medidas. Dois estudos claramente relacionados a este ponto são os de Habicht⁸ (1974) e o de Sauerborn e col.⁹ (l991), descritos na metodologia deste trabalho. Contudo estes dois métodos, na realidade, não indicam o grau de concordância das medidas, mas simplesmente testam hipóteses sobre o erro de tipo I, quando o real problema nestas avaliações diz respeito a quão próximas são as medidas.

Este estudo tem como objetivo comparar os métodos propostos por Habicht (1974) ⁸ e Sauerborn et al.(1991) ⁹ com uma proposta de padronização de antropometristas, usando o coeficiente de correlação intra-classe (ICC).

Material e Método

Foram avaliados 22 adolescentes (11 meninos e 11 meninas) de uma escola privada do RJ, com idade entre 11 e 13 anos. Este é o tamanho de amostra necessário para medir um valor de ICC ou Kappa igual a 0,70, com um nível de significância de 0,05 e um poder de 0,95 ¹⁰ . Foram realizadas, em cada estudante, três medidas de cada uma das dobras cutâneas (tríceps, subescapular e supra-ilíaca). Dois antropometristas tomaram as medidas. Um deles foi uma das autoras deste trabalho (VMF) e o outro, o treinador desta, com grande experiência neste tipo de atividade, foi considerado como padrão ouro. A antropometrista (VMF) foi treinada por um período de 16 horas.

As dobras cutâneas foram obtidas utilizando-se um plicômetro da marca Cescorf, com pressão constante, tomadas segundo padronização¹¹. A dobra triciptal foi medida na parte posterior do braço direito, sobre o músculo triciptal, no ponto médio entre o acrômio e o olécrano, pinçando-se a pele e o tecido subcutâneo entre o polegar e o indicador, onde se aplicou o plicômetro 1 cm abaixo dos dedos que pinçavam a prega, sendo a leitura feita após 2 a 3 segundos no milímetro mais próximo. A dobra subescapular foi medida logo abaixo da extremidade inferior da escápula direita. A pele e o tecido subcutâneo foram pinçados neste local e a dobra angulada em 45º a partir do plano horizontal, dirigindo-se superiormente para dentro, onde se colocou o plicômetro 1 cm abaixo dos dedos que pinçavam a dobra. Para a medida da dobra supra-ilíaca, afastava-se levemente o membro superior direito do corpo e pinçava-se a dobra logo acima da crista ilíaca no sentido vertical, segundo a linha média axilar. Estas medidas foram tomadas na ordem: tríceps, subescapular e supra-ilíaca, por três vezes. Em cada medição era reiniciado o procedimento de colocação do plicômetro. As medidas foram feitas com o mesmo instrumento; um antropometrista desconhecia as medidas obtidas pelo outro e um anotador as registrava. A calibração do aparelho foi realizada no início das mensurações de cada antropometrista.

Análise de variância

Classicamente, uma análise de variância avalia a significância estatística das diferenças entre diferentes médias. Entretanto, ela também provê uma expressão para a variância intra conjunto de medidas tão bem quanto para a variância entre conjunto de medidas. Estes são os componentes da variância usados para compor as medidas do ICC.

Utilizamos um modelo misto de análise de variância conforme Landis e Koch ¹² (1975) e Bartko¹³ (1994), o qual contempla a repetição das medidas para um mesmo sujeito com o antropometrista considerado efeito fixo, e a repetição das medidas um efeito randômico, e cujo modelo é descrito como:

onde :

y= variável dependente, medida de interesse,

m = efeito geral comum a todas as observações,

p_i = são os valores aleatórios de cada um dos sujeitos analisados,

r_j = é o efeito fixo associado ao antropometrista,

(pr)_ij = é o termo de interação,

e_ijk = erro residual para sujeito"i", observador "j"e a medida "k".

O termo de interação (pr)_ij mede a extensão em que o antropometrista se afasta do seu padrão usual quando mede o sujeito "i"; a variância desta interação reflete quanto os observadores variam na sua classificação geral de um mesmo sujeito. Assume-se a independência dos efeitos.

O ICC nesta situação é estimado pela razão:

onde:

MSB é o estimador da variância devido a diferenças nas medidas dos sujeitos para os dois antropometristas e indica o efeito entre-sujeitos.

MSE é o estimador do componente da variância relativo ao erro intrínseco da medida.

Valores do ICC acima de 0.70 são considerados como apresentando substancial confiabilidade ¹². Os valores de variância foram obtidos através do programa Statistical Analysis System (SAS), pela inclusão de um termo de interação no modelo (antropometrista * repetição das medidas).

Padronização proposta por Habicht

A metodologia permite uma identificação rápida, em condições de campo, da confiabilidade entre e intra antropometrista. Este autor propõe que cada técnico repita a medida duas vezes para dez observações diferentes, sendo que a soma dos quadrados das diferenças para o mesmo antropometrista define a confiabilidade intra individual (o autor chamou esta aferição de precisão), enquanto que a soma dos quadrados das diferenças entre dois antropometristas para a mesma observação, define a confiabilidade entre indivíduos (o autor chamou esta aferição de exatidão). Quando um antropometrista atinge uma confiabilidade intra individual menor do que duas vezes a confiabilidade intra individual do supervisor ele é considerado preciso; quando ele apresenta uma confiabilidade entre indivíduos menor do que três vezes a confiabilidade intra individual do supervisor, o treinando é considerado padronizado.

Neste estudo, foram utilizadas as duas últimas medidas efetuadas pelos antropometristas, sendo elas avaliadas conforme segue:

1) cada avaliador faz 2 medidas de cada adolescente, sendo calculadas as diferenças (d) de cada par destas medidas. Estas diferenças são elevadas ao quadrado e é feito seu somatório (d2);

2) cada par de medidas é somado, sendo calculadas as diferenças das somas entre o avaliador em treinamento e o supervisor (padrão-ouro). As diferenças são elevadas ao quadrado e seu somatório calculado (D2).

Os resultados são analisados dentro dos seguintes critérios:

1) o somatório de d2 do supervisor será o menor, supondo-se que ele seja o mais competentes dos antropometristas;

2) o somatório do avaliador em treinamento tem relação inversa com a precisão, e assim não deve exceder o dobro do somatório de d2 do supervisor;

3) o somatório de D2 tem relação inversa com a exatidão, não devendo exceder o triplo de somatório de d2 do supervisor.

Padronização proposta por Sauerborn

Este método para identificação de concordância baseia-se nas médias de duas medidas por antropometrista para cada observação.

São calculadas a média da diferença dos pares de medidas (d) e seu desvio padrão (DP). O intervalo de concordância inclui d + 2(DP). Assim, calcularam-se a média de cada par de medidas e a diferença entre o treinando e o padrão-ouro, obtendo-se as médias das diferenças (d) e seus desvios padrões. Quanto mais próxima de zero estiver a média das diferenças, menor será a possibilidade de erro.

Resultados

A Tabela 1 mostra os valores médios das pregas cutâneas e o desvio padrão obtidos pelos dois antropometristas. A normalidade da distribuição foi testada em SAS e os testes não levaram à rejeição da hipótese de normalidade. Os valores do ICC, para as três medidas efetuadas, foram todos acima de 0,90, considerados como indicadores de muito boa concordância entre as medidas (Tabela 2). A Tabela 3 apresenta os resultados referentes ao proposto por Habicht⁸ (1974), mostrando que, para as três medidas, se excederia o limite aceitável para considerar o antropometrista como padronizado, ou seja, D do antropometrista 2 é maior do que três vezes o valor de d. Contudo, há reprodutibilidade para as pregas supra-ilíaca e tricipital.

Thumbnail

Os resultados obtidos com a proposta de Sauerborn e col. ⁹ (1991) indicam que, tanto para um mesmo antropometrista, quanto para as medidas entre antropometristas (Tabela 4), os valores obtidos apresentam ampla variação, tornando-se díficil aceitar a confiabilidade das medidas. Os valores médios das diferenças apresentadas na Tabela 4 referem-se à diferença entre a média de duas medidas por antropometrista.

Thumbnail

Discussão

Os resultados deste estudo confirmam os achados de outros autores sobre a dificuldade de realização das medidas de dobras cutâneas ¹⁴. Dos resultados apresentados e dada a facilidade, nos dias atuais, de utilização de programas que permitam a realização de análise de variância (ANOVA), parece mais adequado avaliar a concordância de antropometristas através do ICC.

Comparando os valores obtidos através da análise de variância com aqueles obtidos pelos dois outros métodos, conclui-se que, enquanto a análise de variância mostrou resultados para o ICC maiores do que 70%, valor considerado de bom nível de concordância ⁶ , os valores de concordância/exatidão, segundo Habicht, excederiam o limite aceitável que seria de 3 vezes o valor de d (precisão) a partir do antropometrista padrão. Conclusão semelhante se atingiria com a proposta de Sauerborn e col.⁹, cujos intervalos de confiança excederiam em muito os valores do percentil 95 da distribuição das pregas, em adolescente americanos (WHO 1995).

Observe-se que tanto na proposta de Habicht⁸, quanto na de Sauerborn e col.⁹ uma ou poucas medidas muito discrepantes têm uma influência muito grande nas medidas de concordância. Este é um problema particularmente importante na aferição de pregas cutâneas, pois as maiores discrepâncias ocorrem para as pessoas mais gordas, que vão influenciar sobremaneira os valores de "d" avaliados. Este problema não tem tanta importância para o cálculo do ICC, pois sendo uma razão, os obesos vão contribuir tanto na variância entre as medidas, quanto na variância entre os indivíduos medidos. Daí a menor influência de valores aberrantes sobre o ICC.

Os resultados deste estudo de confiabilidade nos permitem concluir que, embora o cálculo do ICC seja mais complexo do que as medidas alternativas avaliadas, ele é a medida mais desejável para o cálculo de confiabilidade.

Summary

One of the most widely used and inexpensive methods for obtaining information concerning the amount and distribution of human subcutaneous fat is the measurement of skinfolds. The skinfold measurement technique requires long-term extended supervised practice and repetition to obtain reliable results and there are few practical methods for standardizing anthropometrists. Two studies, Habicht, 1974 and Sauerborn et al, l991, developed a method to standardize skinfold measurements. Neither method, however, indicated agreement between technicians. The authors tested a hypothesis of a type I error, when the real issue was determining how close measures were. We compared data of a reliability study, using two methods previously discussed with intraclass correlation coefficient (ICC) calculations based on an ANOVA mixed model in order to compare two technicians measuring three skinfolds. For the three skinfolds tested, ICC values were greater than 0.90, considered good agreement, and indicating that the technician tested was reliable. The technicians tested were not considered reliable when both the Habicht and the Sauerborn methods were used. The high influence of a few large discrepancies between measures using the Habicht and Sauerborn methods may explain the difference found. This kind of discrepancy is particularly important when measuring skinfolds of obese individuals. The intraclass correlation coefficient appears to be a better choice for the standardization of skinfold measurements, since it is not influenced by measurements.

1. Jelliffe DB. The assessment of the nutritional status of the community Geneva; WHO; 1966. (WHO - Monograph Series, 53).
2. Léger AL, Lambert J, Martin P. Validity of skinfold caliper measurements. Wayne State University Press 1982; 54:667-75.
3. Lohman TG, Roche AF, Martorell R. Anthropometric standartization reference manual Illinois: Human Kinetics Books; 1988.
4. Last JM. A dictionary of epidemiology 3^rd ed. New York: Oxford University Press; 1995.
5. Revicki ED, Israel RG. Relationship between body mass and measures of body adiposity. Am J Public Health 1986; 76:992-4.
6. Streiner DL, Norman GR. Health measurement scales: a pratical guide to their development and use Oxford: Oxford University Press; 1989.
7. Bartko JJ, Carpenter WT. On the methods and theory of reliability. J Nerv Ment Dis 1976; 163:307-17.
8. Habicht JP. Estandartización de métodos epidemiológicos quantitativos sobre el terreno. Bol Oficina Sanit Panam 1974; 76: 375-84.
9. Sauerborn R, Morley DC, Bullough CHW. Un método estatístico simple para obtener confiabilidad en las mediciones antopométricas. Salud Pública Méx 1991; 33:106-11.
10. Dunn G. Designs for reliability studies New York: Oxford University Press; 1989. Designs for reliability studies; p. 59-72.
11. Durnin JVGA, Rahaman VM. The assessment of the amount of fat in the human body from measurements of skinfold thickness. Br J Nutr 1967; 21: 681-8.
12. Landis JR, Koch GG. A review of statistical methods in analysis of data arising from observer reliability studies (part I). Stat Neerland 1975; 3: 103-23.
13. Bartko JJ. General methodology. II - Measures of agreement: a single procedure. Stat Med 1994; 13:737-45.
14. Flegal KM. Defining obesity in children and adolescents: epidemiologic approaches. Crit Rev Food Nutr 1993; 33:307-12.
15. WHO Working Group. Use and interpretation of anthropometric indicators of nutritional status. Bull World Health Organ 1995; 64:929-41.

Datas de Publicação

Publicação nesta coleção
25 Jul 2007
Data do Fascículo
Ago 1999

This work is licensed under a Creative Commons Attribution 4.0 International License.

[1] 1. Jelliffe DB. The assessment of the nutritional status of the community Geneva; WHO; 1966. (WHO - Monograph Series, 53).

[2] 2. Léger AL, Lambert J, Martin P. Validity of skinfold caliper measurements. Wayne State University Press 1982; 54:667-75.

[3] 3. Lohman TG, Roche AF, Martorell R. Anthropometric standartization reference manual Illinois: Human Kinetics Books; 1988.

[4] 4. Last JM. A dictionary of epidemiology 3^rd ed. New York: Oxford University Press; 1995.

[5] 5. Revicki ED, Israel RG. Relationship between body mass and measures of body adiposity. Am J Public Health 1986; 76:992-4.

[6] 6. Streiner DL, Norman GR. Health measurement scales: a pratical guide to their development and use Oxford: Oxford University Press; 1989.

[7] 7. Bartko JJ, Carpenter WT. On the methods and theory of reliability. J Nerv Ment Dis 1976; 163:307-17.

[8] 8. Habicht JP. Estandartización de métodos epidemiológicos quantitativos sobre el terreno. Bol Oficina Sanit Panam 1974; 76: 375-84.

[9] 9. Sauerborn R, Morley DC, Bullough CHW. Un método estatístico simple para obtener confiabilidad en las mediciones antopométricas. Salud Pública Méx 1991; 33:106-11.

[10] 10. Dunn G. Designs for reliability studies New York: Oxford University Press; 1989. Designs for reliability studies; p. 59-72.

[11] 11. Durnin JVGA, Rahaman VM. The assessment of the amount of fat in the human body from measurements of skinfold thickness. Br J Nutr 1967; 21: 681-8.

[12] 12. Landis JR, Koch GG. A review of statistical methods in analysis of data arising from observer reliability studies (part I). Stat Neerland 1975; 3: 103-23.

[13] 13. Bartko JJ. General methodology. II - Measures of agreement: a single procedure. Stat Med 1994; 13:737-45.

[14] 14. Flegal KM. Defining obesity in children and adolescents: epidemiologic approaches. Crit Rev Food Nutr 1993; 33:307-12.

[15] 15. WHO Working Group. Use and interpretation of anthropometric indicators of nutritional status. Bull World Health Organ 1995; 64:929-41.

Brasil

Brasil

Como medir a confiabilidade de dobras cutâneas

Measuring the reliability of skinfolds

Resumos

Datas de Publicação