SciELO - Scientific Electronic Library Online

 
vol.20 número3Notas para a problematização do coletivo no campo da saúdeEventos adversos e outros incidentes na unidade de terapia intensiva neonatal índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

Compartilhar


Ciência & Saúde Coletiva

versão impressa ISSN 1413-8123

Ciênc. saúde coletiva vol.20 no.3 Rio de Janeiro mar. 2015

http://dx.doi.org/10.1590/1413-81232015203.04332013 

RevisÃo

Construção de instrumentos de medida na área da saúde

Construction of measurement instruments in the area of health

Marina Zambon Orpinelli Coluci 1  

Neusa Maria Costa Alexandre 1  

Daniela Milani 1  

1Faculdade de Enfermagem, Universidade Estadual de Campinas. Cidade Universitária Zeferino Vaz, Barão Geraldo. 13083-887 Campinas SP Brasil. mazorpinelli@yahoo.com.br

RESUMO

Instrumentos de medida são partes integrantes da prática clínica, da avaliação em saúde e de pesquisas. Esses instrumentos só são úteis e capazes de apresentar resultados cientificamente robustos quando são desenvolvidos de maneira apropriada e quando apresentam boas qualidades psicométricas. A literatura aponta que, apesar do aumento significativo no número de escalas de avaliação, muitas não têm sido desenvolvidas e validadas adequadamente. O presente estudo teve como objetivos realizar uma revisão narrativa sobre o processo de elaboração de novos instrumentos e apresentar algumas ferramentas que podem ser utilizadas em algumas etapas do seu processo de desenvolvimento. As etapas descritas foram: I-Estabelecimento da estrutura conceitual e definição dos objetivos do instrumento e da população envolvida; II-Construção dos itens e das escalas de respostas; III-Seleção e organização dos itens e estruturação do instrumento; IV-Validade de conteúdo; e V-Pré-teste. Uma discussão breve sobre a avaliação das propriedades psicométricas foi incluída devido à importância que esta tem para que os instrumentos sejam aceitos e reconhecidos tanto no meio científico como no meio clínico.

Palavras-Chave: Medidas; Métodos e teorias; Questionários; Estudos de Validação; Reprodutibilidade dos testes

ABSTRACT

Measurement instruments are an integral part of clinical practice, health evaluation and research. These instruments are only useful and able to present scientifically robust results when they are developed properly and have appropriate psychometric properties. Despite the significant increase of rating scales, the literature suggests that many of them have not been adequately developed and validated. The scope of this study was to conduct a narrative review on the process of developing new measurement instruments and to present some tools which can be used in some stages of the development process. The steps described were: I-The establishment of a conceptual framework, and the definition of the objectives of the instrument and the population involved; II-Development of the items and of the response scales; III-Selection and organization of the items and structuring of the instrument; IV-Content validity, V-Pre-test. This study also included a brief discussion on the evaluation of the psychometric properties due to their importance for the instruments to be accepted and acknowledged in both scientific and clinical environments.

Key words: Measurements; Methods and theories; Questionnaires; Validation studies; Reproducibility of the tests

Introdução e justificativa

Questionários são instrumentos integrantes da prática clínica, da avaliação em saúde e de pesquisas1. Estes instrumentos exercem grande influência nas decisões sobre o cuidado, tratamento e/ou intervenções e na formulação de programas de saúde e de políticas institucionais1 , 2.

Com o atual e crescente interesse pelo cuidado à saúde, pesquisadores e organizações internacionais têm desenvolvido instrumentos importantes e de grande aplicabilidade1 - 3. Os aspectos avaliados e/ou mensurados por estes instrumentos são diversos: dor, qualidade de vida, capacidade funcional, estado de saúde, vitalidade e limitações, adesão ao tratamento, fatores emocionais e psicossociais, dentre outros2 , 4 - 8.

Pesquisadores apontam que os instrumentos para avaliação só são úteis e capazes de apresentar resultados cientificamente robustos quando demonstram boas propriedades psicométricas3. Apesar do aumento significativo do número de escalas de avaliação e/ou questionários, muitos não são desenvolvidos e validados de forma apropriada1 , 9 - 10.

O desenvolvimento integral de um novo instrumento de mensuração em saúde é complexo, consome vários recursos e requer a mobilização de capacidades e de conhecimentos de diversas áreas11. Por este motivo, antes de se desenvolver novos instrumentos, recomenda-se que o pesquisador esteja ciente sobre os questionários já existentes. Estes, muitas vezes, podem atender às mesmas finalidades pretendidas ou similares11.

Outra recomendação é a de que haja preferência por realizar a adaptação cultural de questionários previamente desenvolvidos e validados em outros idiomas em detrimento de construir novos instrumentos12 , 13. Esta é uma alternativa facilitadora para a troca de informações e divulgação do conhecimento entre a comunidade científica11 - 13.

Porém, quando o desenvolvimento de um novo instrumento é realmente necessário, os pesquisadores e profissionais da área da saúde precisam estar cientes de que devem seguir uma metodologia adequada a fim de que esse novo instrumento seja apropriado e confiável2 , 14 - 16.

Neste sentido, discussões sobre o processo de desenvolvimento de novos questionários e escalas na área de saúde são bastante relevantes. O presente estudo tem como objetivos: discutir de forma sistematizada as principais etapas a serem seguidas na elaboração de instrumentos de medida na área de saúde e apresentar algumas ferramentas que podem ser utilizadas como auxílio nas etapas do desenvolvimento desses novos instrumentos.

Método

Trata-se de uma pesquisa bibliográfica que pode ser definida como narrativa17. O levantamento bibliográfico foi realizado nas seguintes bases de dados das Ciências da Saúde: Biblioteca Virtual em Saúde - Enfermagem (BDENF), Portal de Revistas de Enfermagem, SciELO, Lilacs (Literatura Latino - Americana e do Caribe em Ciências da Saúde), Medline (National Library of Medicine-USA), International Nursing Index (INI) e Cumulative Index to Nursing and Allied Health Literature (CINAHL).

No estudo foram incluídas publicações nacionais e internacionais disponíveis nos idiomas português e inglês a partir de 1990 e que abordassem temas relacionados ao desenvolvimento de instrumentos de medida.

Os seguintes descritores utilizados em português foram pesquisados na Bireme (DeCS - Terminologia em Saúde): "estudos de validação", "validade dos testes", "reprodutibilidade dos testes" e "questionários". Para os descritores em inglês utilizou-se a National Library of Medicine's Medical Subject Headings (MeSH = Medical Subject Heading Terms). Estes foram os seguintes: "validation studies", "psychometrics", e "questionnaire design".

Resultados e discussão

Devido ao aumento da importância dos instrumentos de medida em saúde, o entendimento sobre o processo e as técnicas utilizadas para o desenvolvimento destas é crucial2.

Com o objetivo de melhorar a qualidade dos instrumentos, autores sugerem e descrevem etapas e métodos padronizados e sistemáticos que devem ser utilizados durante esse processo3 , 18 , 19.

De uma forma geral, a literatura destaca as seguintes etapas a serem seguidas no processo de construção de instrumentos: I-Estabelecimento da estrutura conceitual; II-definição dos objetivos do instrumento e da população envolvida; III-Construção dos itens e das escalas de resposta; IV-Seleção e organização dos itens; V-Estruturação do instrumento; VI-Validade de Conteúdo; e VII-Pré-teste.

Cada uma dessas etapas será discutida de maneira mais detalhada nas seções seguintes. A Figura 1 ilustra esse processo e apresenta de maneira resumida os recursos, critérios e/ou recomendações que geralmente são utilizados em cada etapa.

Figura 1. As etapas do processo de desenvolvimento de instrumentos de medida e os recursos, critérios, recomendações e/ou atributos geralmente mais utilizados em cada etapa. 

Com relação ao processo de avaliação das propriedades psicométricas de um instrumento, não há um consenso na literatura sobre este pertencer ao processo de desenvolvimento do instrumento ou não. Com a justificativa de que a utilidade de um instrumento de medida no meio científico e clínico só é reconhecida após este ter suas propriedades psicométricas avaliadas, este estudo também inclui uma breve discussão sobre a avaliação dessas propriedades.

As etapas do processo de construção de instrumentos de medidas na área da saúde

Estabelecimento da estrutura conceitual e definição dos objetivos do instrumento e da população envolvida

Para a construção de instrumentos de medida, é fundamental que os objetivos sejam estabelecidos e que estes tenham conexão com os conceitos a serem abordados20 , 21. A caracterização/definição da população-alvo também é importante porque serve para justificar a relevância da criação de um instrumento específico15.

A elaboração da estrutura conceitual, também conhecida como definição operacional do constructo e de sua dimensionalidade, é a etapa responsável por definir o contexto do instrumento e sustentar o desenvolvimento dos domínios e itens22. Esta é considerada uma etapa bastante importante porque "quanto melhor e mais completa for a especificação do constructo, melhor será a garantia de que o instrumento será útil e válido"22. Por este motivo, pesquisadores apontam para a importância das definições operacionais do constructo de forma detalhada22.

Construção dos itens e das escalas de resposta

Os itens de uma escala não devem ser construídos ao acaso. Eles devem ser elaborados ou selecionados em função das definições operacionais do constructo que já foram analisadas na etapa anterior22.

Vários são os recursos a partir dos quais esses itens podem ser construídos: busca na literatura, questionários já existentes, relatos da população-alvo, observação clínica, opinião de especialistas, resultados de pesquisa, teorias, dentre outros3 , 11 , 15 , 23. Cada um desses recursos possui pontos fortes e fracos dependendo do tipo, do objetivo e da aplicação da escala a ser desenvolvida3.

A busca na literatura junto às bases de dados nacionais e internacionais é comumente utilizada como principal recurso nas pesquisas de desenvolvimento de instrumentos de medidas. Esta estratégia visa dar ciência ao pesquisador quanto aos instrumentos que já existem11.

A utilização de instrumentos já existentes também é apontada por pesquisadores3 , 11 como um recurso útil, pois, na maioria das vezes, seus itens já foram testados quanto às qualidades psicométricas3. A utilização destes itens em detrimento de construir novos pode economizar tempo e trabalho do pesquisador3 , 11.

Outro recurso que pode ser significativo e fonte excelente de itens é a experiência da população-alvo3 , 11. Dentre as técnicas utilizadas para obtenção de dados da população de forma sistemática, citam-se a realização de grupo focal e entrevistas em profundidade3 , 11 , 23.

A observação clínica pode ser útil quando utilizada previamente à opinião de especialistas e também é uma forma de reunir informações de forma sistemática. Geralmente este recurso está associado à teoria, resultados laboratoriais e achados clínicos3 , 11.

A opinião de especialistas também é um recurso bastante utilizado e influencia consideravelmente na geração de itens mais potenciais para a escala11. Dentre as vantagens, está o fato dos especialistas serem escolhidos cuidadosamente e, portanto, representarem o que há de mais recente no conhecimento da área3 , 11. Recomenda-se a participação de três a dez especialistas3 , 11.

Com relação aos resultados de pesquisas, os mais úteis são as revisões sistemáticas e estudos3 , 11.

Além da construção dos itens, o desenvolvimento e escolha de um método para obtenção das respostas também é imprescindível11. As escalas de respostas aos itens podem assumir muitas formas e a escolha do método deve ser determinada pela natureza da pergunta realizada11.

Dentre as técnicas utilizadas para a formulação de escalas de resposta, as mais comuns são as de estimativa direta, como a escala visual analógica, as escalas adjetivas, as escalas tipo Likert, as escala de faces, entre outras11.

Cada um dos tipos de escala tem suas vantagens e desvantagens11.

Seleção e organização dos itens, e estruturação do instrumento

Uma vez realizada a pesquisa bibliográfica, a consulta aos especialistas da área e aos representantes da população-alvo, o próximo passo é definir as suas dimensões/domínios de forma que se construa a variedade dos itens segundo os constructos24.

Geralmente, nem todos os itens criados estão em concordância com a proposta do pesquisador e nem todos possuem bom desempenho. Por isso, o pesquisador deve estar atento aos diversos tipos de critérios existentes para selecionar os itens adequados do novo instrumento3 , 11.

Dentre os critérios mais comumente utilizados estão: o critério comportamental, o critério da objetividade, da simplicidade, da clareza, da precisão, da validade, da relevância e da interpretabilidade21 - 23. O objetivo da adoção desses critérios é eliminar qualquer item que esteja ambíguo, incompreensível, com termos vagos, com duplas perguntas, com jargões e/ou que remeta a juízo de valores, dentre outros3 , 11 , 21 - 23.

Com relação à quantidade de itens de um instrumento, este é um quesito não consensual22. Estudos sugerem que a representação de um constructo é conseguida com uma quantidade de 20 itens aproximadamente22. No entanto, para outra vertente, aponta-se que o início da construção de um instrumento deve possuir pelo menos o triplo de itens do instrumento final.

Outros estudos22 , 23 se baseiam na teoria dos traços latentes para determinar o número de itens que farão parte do instrumento. De acordo com essa teoria, não se deve começar o instrumento com mais de 10% do número de itens desejado no instrumento final22.

A estruturação do questionário é o estágio que visa consolidar as etapas anteriores, ou seja, visa organizar os itens em seus respectivos domínios e estabelecer o formato geral do instrumento. Deve-se considerar o título, as instruções, as escalas de respostas, os escores, entre outros.

A estrutura e a sequência do questionário contribuem significativamente para reduzir o esforço físico e/ou mental dos respondentes e asseguram que todos os termos sejam tratados de forma que o interesse do respondente seja mantido até o final do questionário21.

Um princípio utilizado na estruturação do questionário é o de que os itens estejam em uma ordem lógica. O direcionamento desses itens sempre que possível deve ser do item mais geral até o mais específico; no sentido do menos pessoal e menos delicado para o mais pessoal e mais delicado21.

O procedimento de validade de conteúdo

Após ser estruturado e organizado, o novo instrumento provavelmente ainda contempla mais itens do que ele necessariamente apresentará em seu formato final11. Esse instrumento ainda precisa ser testado quanto à hipótese de que os itens escolhidos representam e/ou contemplam adequadamente os domínios do constructo desejado3 , 11 , 20 , 22 , 24 - 26.

O procedimento de escolha é a avaliação de conteúdo. Esta é essencial no processo de desenvolvimento de novos instrumentos de medidas porque representa o início de mecanismos para associar conceitos abstratos com indicadores observáveis e mensuráveis11 , 24 - 27.

A avaliação de conteúdo deve ser realizada por um comitê composto por cinco a dez juízes especialistas na área do instrumento de medida28 , 29. A avaliação por juízes pode envolver procedimentos qualitativos e quantitativos29 - 32. O processo é iniciado com o convite aos membros do comitê de juízes.

Deve-se redigir aos especialistas uma carta constando o motivo da escolha daquele sujeito como juiz e a relevância dos conceitos envolvidos e do instrumento como um todo33.

Todo o procedimento para o julgamento da validade de conteúdo deve ser descrito de forma estruturada e entregue aos juízes. Cada um deles deve realizar uma avaliação inicial independente antes de se reunir com os demais membros34. Para isso, são necessárias instruções específicas a partir das quais esses juízes poderão determinar a validade de conteúdo33.

É importante que o comitê de especialistas participe em dois estágios distintos. O primeiro estágio é aquele em que os juízes realizam uma avaliação para a fase de especificação dos domínios. O segundo estágio é aquele para o qual realizam uma avaliação na fase de desenvolvimento dos itens34. Os especialistas devem receber instruções específicas em cada estágio sobre como avaliar cada item, como avaliar o instrumento como um todo e como preencher o questionário que orienta a avaliação.

No primeiro estágio de avaliação, os membros do comitê devem julgar os domínios e os itens criados para interpretação das respostas do questionário. Inicialmente é realizada a avaliação dos domínios, determinando a abrangência destes. Isto é, os juízes devem avaliar se cada domínio ou conceito foi adequadamente coberto pelo conjunto de itens e se todas as dimensões foram incluídas31. Os especialistas deverão verificar se o conteúdo está apropriado aos respondentes, se a estrutura do domínio e seu conteúdo estão corretos, e se o conteúdo contido no domínio é representativo34. Nesta fase, sugestões quanto à inclusão ou a eliminação de itens podem ser feitas35. As instruções para análise da validade de conteúdo podem ser redigidas como no Quadro 1.

Quadro 1. Modelo de instruções para primeira análise da validade de conteúdo. 

Após a avaliação dos juízes, pode-se utilizar a taxa de concordância do comitê, que é obtida pelo cálculo da porcentagem em cada domínio. Este é realizado por meio da seguinte fórmula31:

Essa taxa é interpretada considerando que um resultado maior ou igual a 90% de concordância, significa que os domínios estão adequados26. Quando o resultado for menor que 90%, o domínio precisa ser discutido e alterado.

No segundo estágio, os juízes devem avaliar cada item individualmente. Além disso, essa avaliação deve ser realizada com relação ao formato, ao título, às instruções, aos domínios, aos escores dos domínios (ou do instrumento) e à análise (interpretação) dos escores, considerando a clareza e/ou pertinência de cada aspecto a ser avaliado.

Com relação à clareza, a orientação é feita no sentido de que seja avaliada a redação dos itens. Ou seja, se estes itens estão redigidos de forma que o conceito esteja compreensível e se expressam adequadamente o que se espera medir36. Quanto à pertinência ou representatividade, os juízes devem notar se os itens realmente refletem os conceitos envolvidos, se estes são relevantes e se são e/ou estão adequados para atingir os objetivos propostos36 , 37. Além disso, os especialistas podem reavaliar a abrangência dos domínios e do instrumento como um todo. Sugestões e/ou comentários para melhorar o item poderão ser feitos em espaços deixados especificamente para essa finalidade31 , 35.

Neste segundo estágio recomenda-se que a concordância dos membros do comitê seja verificada de forma quantitativa por meio do Índice de Validade de Conteúdo (IVC)26 , 29 , 38. Esse índice mede a proporção ou porcentagem de juízes que estão em concordância sobre determinados aspectos do instrumento e de seus itens. Uma ferramenta a ser utilizada para avaliação dos juízes nessa etapa pode ser baseada no Quadro 2.

Quadro 2. Modelo de instruções para segunda análise da validade de conteúdo. 

O IVC é calculado com a utilização de uma escala tipo Likert de 4-pontos ordinais. Para avaliar a relevância/representatividade do item, os juízes poderão escolher as seguintes respostas: 1 = não relevante ou não representativo, 2 = item necessita de grande revisão para ser representativo, 3 = item necessita de pequena revisão para ser representativo, ou 4 = item relevante ou representativo26 , 35 , 38. A abrangência, a clareza e a pertinência serão avaliadas com a mesma escala e podem apresentar opções mais curtas, como: 1 = não claro, 2 = pouco claro, 3 = bastante claro, 4 = muito claro26 , 32 , 39.

Assim, o cálculo é feito a partir da somatória das respostas "3" e "4" de cada juiz em cada item do questionário e divide-se esta soma pelo número total de respostas, como segue29 , 32.

Os itens que recebem pontuação "1" ou "2" devem ser revisados ou eliminados. A taxa de concordância aceitável entre os juízes para avaliação dos itens individualmente deve ser superior a 0,7840. Para a verificação da validade do novo instrumento de uma forma geral, deve haver uma concordância mínima de 0,8036 e, preferencialmente, superior a 0,9040.

Nos dois estágios, a avaliação de conteúdo do instrumento é quantitativa. Esta é inicialmente realizada pelos juízes de forma individual, independente e em um período pré-estabelecido. Em seguida deve ser feita uma discussão em grupo que corresponde ao procedimento qualitativo31 , 32 ,34.

A abordagem de se usar pelo menos dois métodos, geralmente quantitativo e qualitativo, é denominada triangulação metodológica41.

A fase qualitativa é representada por um processo interativo entre pesquisadores e os membros do comitê por meio de entrevistas e discussões para clarificar pontos controversos36.

Nessas discussões/entrevistas, todas as sugestões e comentários dos membros do comitê são expostos e anotados pelo pesquisador. Os documentos devolvidos pelos juízes e suas propostas de modificações emitidas durante a reunião devem ser avaliadas e revisadas.

Posteriormente, uma nova versão do instrumento que contemple as sugestões apresentadas pelo comitê pode ser entregue novamente a cada membro. Os juízes deverão revisar seus critérios de avaliação para que seja finalizado o processo de validade de conteúdo e a versão para pré-teste seja obtida.

O procedimento de pré-teste

O pré-teste (também referido como análise semântica dos itens) tem como objetivo verificar se todos os itens são compreensíveis para todos os membros da população a qual o instrumento se destina22.

Esta etapa deve ser realizada em uma amostra de 30-40 indivíduos da população-alvo. Cada sujeito deve completar o questionário e em seguida ser entrevistado individualmente com relação ao entendimento dos itens e das palavras e quanto ao preenchimento das respostas22.

Algumas modificações poderão ser necessárias na versão final do instrumento. Caso sejam alterações significativas, estas devem ser submetidas à avaliação pelos membros do comitê de juízes novamente.

Terminada essa etapa, o instrumento de medida estará pronto para ter suas propriedades psicométricas avaliadas22.

Avaliação das propriedades psicométricas

A robustez dos resultados de um estudo depende muito do instrumento utilizado. Se a qualidade deste estudo é apropriada, os resultados são válidos e o questionário pode ser uma ferramenta útil para novas pesquisas ou para a prática clínica42. No entanto, quando a qualidade do estudo é inadequada, os resultados não são confiáveis e a qualidade e utilidade do questionário utilizado no estudo permanecem obscuras42.

Portanto, ao desenvolver e/ou selecionar instrumentos que serão utilizados em pesquisas e/ou na prática clínica, é muito importante que estes sejam ou tenham sido avaliados quanto às suas propriedades psicométricas43.

A literatura descreve vários atributos que podem ser testados no processo de avaliação das propriedades psicométricas de um instrumento14 , 44 , 45: validade (validity), confiabilidade (reliability), praticabilidade (praticability), sensibilidade (sensitivity), responsividade (responsiveness) e interpretabilidade (interpretability).

A seleção dos atributos que devem ser avaliados, bem como o método a ser utilizado vai depender do tipo e objetivos de cada instrumento. Dentre os atributos citados, aqueles mais comumente utilizados são a validade, a confiabilidade e a responsividade42.

A validade é a capacidade de um instrumento medir com precisão o fenômeno a ser estudado14 , 19 , 27 , 46. A avaliação deste atributo pode ser feita de várias maneiras: validade de conteúdo, validade de constructo e validade de critério1 , 3 , 47. Cada uma dessas maneiras avalia aspectos diferentes do instrumento e deve ser pensada como parte de um processo3.

A confiabilidade é a capacidade do instrumento em reproduzir um resultado de forma consistente no tempo e no espaço ou com observadores diferentes14 , 27. Ou seja, confiabilidade refere-se à quão estável, consistente ou preciso é o instrumento19 , 28. Os procedimentos utilizados para a avaliação da confiabilidade também são diversos. Dentre eles, os mais utilizados são: consistência interna (homogeneidade) e estabilidade (confiabilidade teste-reteste, confiabilidade interobservadores ou intraobservadores)3.

A responsividade é a capacidade de um instrumento detectar mudanças sobre o constructo a ser medido ao longo do tempo14 , 42. Este atributo se refere à validade no contexto longitudinal. A diferença entre a validade e responsividade é que a primeira se refere à validade de um escore simples e a responsividade se refere à validade de mudanças nesse escore42.

Com relação às propriedades psicométricas, é importante ressaltar que estas não são estáticas do instrumento. Ou seja, elas podem variar de acordo com a mudança da população de estudo3.

Além disso, outros fatores que também podem influenciar na avaliação das propriedades psicométricas são: modo de administração (entrevista, telefone, ou autoaplicado), tipo de população-alvo, tamanho amostral, dentre outros11 , 48.

Conclusões

Este estudo realizou uma discussão de forma sistematizada sobre os procedimentos recomendados para a construção de novos instrumentos de saúde a serem utilizados tanto na assistência como em pesquisas.

Compreender, analisar e seguir o processo descrito neste estudo é essencial para pesquisadores e profissionais da área de saúde, que estejam preocupados em construir e utilizar instrumentos de medidas cada vez mais confiáveis e apropriados.

Referências

1. Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290. [ Links ]

2. Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111. [ Links ]

3. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. [ Links ]

4. Rattray J, Jones MC. Essential elements of questionnaire design and development. J Clin Nurs 2007; 16(2):234-243. [ Links ]

5. Gallasch CH, Alexandre NMC, Amick III B. Cross-cultural adaptation, Reliability, and validity of the Work Role Functioning Questionnaire to Brazilian Portuguese. J Occup Rehabil 2007; 17(4):701-711. [ Links ]

6. Vigatto R, Alexandre NMC, Correa Filho HR. Development of a Brazilian Portuguese version of the Oswestry Disability Index. Cross-cultural adaptation, reliability, and validity. Spine 2007; 32(4):481-486. [ Links ]

7. Nakajima KM, Rodrigues RCM, Gallani MCBJ, Alexandre NMC, Oldridge N. Psychometric properties of MacNew Heart Disease Health-related Quality of Life Questionnaire: Brazilian version. J Adv Nurs 2009; 65(5):1084-1094. [ Links ]

8. Toledo R, Alexandre NMC, Rodrigues RCM. Psychometric evaluation of a Brazilian Portuguese version of the Spitzer Quality of Life Index in patients with low back pain. Rev Lat Am Enfermagem 2008; 16(6):943-950. [ Links ]

9. Cano SJ, Hobart JC, Fitzpatrick R, Bhatia K, Thompson AJ, Warner TT. Patient-based outcomes of cervical dystonia: a review of rating scales. Mov Disord 2004; 19(9):1054-1059. [ Links ]

10. Chen CM, Cano SJ, Klassen AF, King T, McCarthy C, Cordeiro PG, Morrow M, Pusic AL. Measuring quality of life in oncologic breast surgery: a systematic review of patient-reported outcome measures. Breast J 2010; 16(6):58-97. [ Links ]

11. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. [ Links ]

12. Alexandre NMC, Guirardello EB. Adaptación cultural de instrumentos utilizados em salud ocupacional. Rev Panam Salud Publica 2002; 11(2):109-111. [ Links ]

13. Hutchinson A, Bentzen N, Konig-Zanhn C. Cross cultural health outcome assessment: a user's guide. The Netherlands: ERGHO; 1996. [ Links ]

14. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42. [ Links ]

15. Turner R, Quittner AL, Parasuraman BM, Kallich JD, Cleeland CS, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcomes: instrument development and selection issues. Value Health 2007; 10(Supl. 2):S86-S93. [ Links ]

16. Selby-Harrington ML, Mehta SM, Jutsum V, Riportella-Muller R, Quade D. Reporting of instrument validity and reliability in selected clinical nursing journals. J Prof Nurs 1994; 10(1):47-56. [ Links ]

17. Rother ET. Revisão sistemática X revisão narrativa. Acta paul enfer 2007; 20(2):V-VI. [ Links ]

18. Haynes SN, Richard DCS, Kubany ES. Content validity in psychological assessment: a functional approach to concepts and methods. Psychol Assess 1995; 7(3):238-247. [ Links ]

19. Pittman J, Bakas T. Measurement and instrument design. J Wound Ostomy Continence Nurs 2010; 37(6): 603-607. [ Links ]

20. Snyder CF, Watson ME, Jackson JD, Cella D, Halyard MY, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcome instrument selection: designing a measurement strategy. Value Health 2007; 10(Supl. 2):S76-S85. [ Links ]

21. Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15. [ Links ]

22. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213. [ Links ]

23. Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407. [ Links ]

24. Sireci SG. The construct of content validity. Soc Indic Res 1998; 45(1-3):83-117. [ Links ]

25. Fagarasanu M, Kumar S. Measurement instruments and data collection: a consideration of constructs and biases in ergonomics research. Int J Ind Ergon 2002; 30(6):355-369. [ Links ]

26. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518. [ Links ]

27. Contandriopoulos AP. Saber preparar uma pesquisa. 3ª ed. São Paulo, Rio de Janeiro: Hucitec, Abrasco; 1999. [ Links ]

28. Polit DF, Beck CT, Hungler BP. Fundamentos em pesquisa em enfermagem: métodos, avaliação e utilização. 5ª ed. Porto Alegre: Artmed Editora; 2004. [ Links ]

29. Alexandre NMC, Coluci MZO. Validade de conteúdo nos processos de construção e adaptação de instrumentos de medida. Cien Saude Colet 2011; 16(7):3061-3067. [ Links ]

30. Burns N, Grove SK. The practice of nursing research: conduct, critique & utilization. 3a ed. Philadelphia: Saunders Company; 1997. [ Links ]

31. Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175. [ Links ]

32. Hyrkas K, Appelqvist-Schmidlechner K, Oksa L. Validating an instrument for clinical supervision using an expert panel. Int J Nurs Stud 2003; 40:619-625. [ Links ]

33. Salmond SS. Evaluating the reliability and validity of measurement instruments. Orthop Nurs 2008; 27(1): 28-30. [ Links ]

34. Berk RA. Importance of expert judgment in content-related validity evidence. West J Nurs Res 1990; 12(5):659-671. [ Links ]

35. Rubio DM, Berg-Weger M, Tebb SS, Lee S, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res 2003; 27(2):94-105. [ Links ]

36. Grant JS, Davis LL. Selection and use of content experts for instrument development. Res Nurs Health 1997; 20(3):269-274. [ Links ]

37. McGilton K. Development and psychometric evaluation of supportive leadership scales. Can J Nurs Res 2003; 35(4):72-86. [ Links ]

38. Summers S. Establishing the Reliability and Validity of a New Instrument: Pilot Testing. J Post Anesth Nurs 1993; 8(2):124-127. [ Links ]

39. DeVon HA, Block ME, Moyle-Wright P, Ernst DM, Hayden SJ, Lazzara DJ, Savoy SM, Kostas-Polston E. A psychometric toolbox for testing validity and reliability. J Nurs Scholarsh 2007; 39(2):155-164. [ Links ]

40. Polit DF, Beck CT. The content validity index: are you sure you know what's being reported? Critique and recommendations. Res Nurs Health 2006; 29(5):489-497. [ Links ]

41. Morse JM. Approaches to qualitative-quantitative methodological triangulation. Nurs Res 1991; 40(1):120-123. [ Links ]

42. Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272. [ Links ]

43. Olivo SA, Macedo LG, Gadotti IC, Fuentes J, Stanton T, Magee DJ. Scales to assess the quality of randomized controlled trials: a systematic review. Phys Ther 2008; 88(2):156-175. [ Links ]

44. Kimberling CL, Winterstein AG. Validity and reliability of measurement instruments used in research. Am J Health Syst Pharm 2008; 65(23):2276-2284. [ Links ]

45. DeVon HA, Block ME, Moyle-Wright P, Ernst DM, Hayden SJ, Lazzara DJ, Savoy SM, Kostas-Polston E. A psychometric toolbox for testing validity and reliability. J Nurs Scholarsh 2007; 39(2):155-164. [ Links ]

46. Roberts P, Priest H, Traynor M. Reliability and validity in research. Nurs Stand 2006; 20(44):41-45. [ Links ]

47. Pasquali L. Psicometria. Rev Esc Enf USP 2009; 43(esp):992-999. [ Links ]

48. Frost MH, Reeve BB, Liepa AM, Stauffer JW, Hays RD, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. What is sufficient for reliability and validity of patient-reported outcome measures? Value Health 2007; 10(Supl. 2):S94-S105. [ Links ]

Recebido: 15 de Março de 2013; Aceito: 14 de Abril de 2013

Colaboradores MZO Coluci trabalhou na concepção, no desenvolvimento dos modelos para avaliação da validade de conteúdo, na redação e revisão final do artigo. D Milani trabalhou na concepção, redação e revisão final e crítica do artigo. NMC Alexandre trabalhou na concepção, no delineamento do estudo e na revisão crítica do artigo.

Creative Commons License This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License, which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.