Acessibilidade / Reportar erro

Construção de instrumentos de medida na área da saúde

Construction of measurement instruments in the area of health

Resumos

Instrumentos de medida são partes integrantes da prática clínica, da avaliação em saúde e de pesquisas. Esses instrumentos só são úteis e capazes de apresentar resultados cientificamente robustos quando são desenvolvidos de maneira apropriada e quando apresentam boas qualidades psicométricas. A literatura aponta que, apesar do aumento significativo no número de escalas de avaliação, muitas não têm sido desenvolvidas e validadas adequadamente. O presente estudo teve como objetivos realizar uma revisão narrativa sobre o processo de elaboração de novos instrumentos e apresentar algumas ferramentas que podem ser utilizadas em algumas etapas do seu processo de desenvolvimento. As etapas descritas foram: I-Estabelecimento da estrutura conceitual e definição dos objetivos do instrumento e da população envolvida; II-Construção dos itens e das escalas de respostas; III-Seleção e organização dos itens e estruturação do instrumento; IV-Validade de conteúdo; e V-Pré-teste. Uma discussão breve sobre a avaliação das propriedades psicométricas foi incluída devido à importância que esta tem para que os instrumentos sejam aceitos e reconhecidos tanto no meio científico como no meio clínico.

Medidas; Métodos e teorias; Questionários; Estudos de Validação; Reprodutibilidade dos testes


Measurement instruments are an integral part of clinical practice, health evaluation and research. These instruments are only useful and able to present scientifically robust results when they are developed properly and have appropriate psychometric properties. Despite the significant increase of rating scales, the literature suggests that many of them have not been adequately developed and validated. The scope of this study was to conduct a narrative review on the process of developing new measurement instruments and to present some tools which can be used in some stages of the development process. The steps described were: I-The establishment of a conceptual framework, and the definition of the objectives of the instrument and the population involved; II-Development of the items and of the response scales; III-Selection and organization of the items and structuring of the instrument; IV-Content validity, V-Pre-test. This study also included a brief discussion on the evaluation of the psychometric properties due to their importance for the instruments to be accepted and acknowledged in both scientific and clinical environments.

Measurements; Methods and theories; Questionnaires; Validation studies; Reproducibility of the tests


Introdução e justificativa

Questionários são instrumentos integrantes da prática clínica, da avaliação em saúde e de pesquisas11. Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290.. Estes instrumentos exercem grande influência nas decisões sobre o cuidado, tratamento e/ou intervenções e na formulação de programas de saúde e de políticas institucionais11. Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290. , 22. Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111..

Com o atual e crescente interesse pelo cuidado à saúde, pesquisadores e organizações internacionais têm desenvolvido instrumentos importantes e de grande aplicabilidade11. Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290.

2. Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111.
- 33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323.. Os aspectos avaliados e/ou mensurados por estes instrumentos são diversos: dor, qualidade de vida, capacidade funcional, estado de saúde, vitalidade e limitações, adesão ao tratamento, fatores emocionais e psicossociais, dentre outros22. Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111. , 44. Rattray J, Jones MC. Essential elements of questionnaire design and development. J Clin Nurs 2007; 16(2):234-243.

5. Gallasch CH, Alexandre NMC, Amick III B. Cross-cultural adaptation, Reliability, and validity of the Work Role Functioning Questionnaire to Brazilian Portuguese. J Occup Rehabil 2007; 17(4):701-711.

6. Vigatto R, Alexandre NMC, Correa Filho HR. Development of a Brazilian Portuguese version of the Oswestry Disability Index. Cross-cultural adaptation, reliability, and validity. Spine 2007; 32(4):481-486.

7. Nakajima KM, Rodrigues RCM, Gallani MCBJ, Alexandre NMC, Oldridge N. Psychometric properties of MacNew Heart Disease Health-related Quality of Life Questionnaire: Brazilian version. J Adv Nurs 2009; 65(5):1084-1094.
- 88. Toledo R, Alexandre NMC, Rodrigues RCM. Psychometric evaluation of a Brazilian Portuguese version of the Spitzer Quality of Life Index in patients with low back pain. Rev Lat Am Enfermagem 2008; 16(6):943-950..

Pesquisadores apontam que os instrumentos para avaliação só são úteis e capazes de apresentar resultados cientificamente robustos quando demonstram boas propriedades psicométricas33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323.. Apesar do aumento significativo do número de escalas de avaliação e/ou questionários, muitos não são desenvolvidos e validados de forma apropriada11. Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290. , 99. Cano SJ, Hobart JC, Fitzpatrick R, Bhatia K, Thompson AJ, Warner TT. Patient-based outcomes of cervical dystonia: a review of rating scales. Mov Disord 2004; 19(9):1054-1059. - 1010. Chen CM, Cano SJ, Klassen AF, King T, McCarthy C, Cordeiro PG, Morrow M, Pusic AL. Measuring quality of life in oncologic breast surgery: a systematic review of patient-reported outcome measures. Breast J 2010; 16(6):58-97..

O desenvolvimento integral de um novo instrumento de mensuração em saúde é complexo, consome vários recursos e requer a mobilização de capacidades e de conhecimentos de diversas áreas1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.. Por este motivo, antes de se desenvolver novos instrumentos, recomenda-se que o pesquisador esteja ciente sobre os questionários já existentes. Estes, muitas vezes, podem atender às mesmas finalidades pretendidas ou similares1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Outra recomendação é a de que haja preferência por realizar a adaptação cultural de questionários previamente desenvolvidos e validados em outros idiomas em detrimento de construir novos instrumentos1212. Alexandre NMC, Guirardello EB. Adaptación cultural de instrumentos utilizados em salud ocupacional. Rev Panam Salud Publica 2002; 11(2):109-111. , 1313. Hutchinson A, Bentzen N, Konig-Zanhn C. Cross cultural health outcome assessment: a user's guide. The Netherlands: ERGHO; 1996.. Esta é uma alternativa facilitadora para a troca de informações e divulgação do conhecimento entre a comunidade científica1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.

12. Alexandre NMC, Guirardello EB. Adaptación cultural de instrumentos utilizados em salud ocupacional. Rev Panam Salud Publica 2002; 11(2):109-111.
- 1313. Hutchinson A, Bentzen N, Konig-Zanhn C. Cross cultural health outcome assessment: a user's guide. The Netherlands: ERGHO; 1996..

Porém, quando o desenvolvimento de um novo instrumento é realmente necessário, os pesquisadores e profissionais da área da saúde precisam estar cientes de que devem seguir uma metodologia adequada a fim de que esse novo instrumento seja apropriado e confiável22. Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111. , 1414. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42.

15. Turner R, Quittner AL, Parasuraman BM, Kallich JD, Cleeland CS, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcomes: instrument development and selection issues. Value Health 2007; 10(Supl. 2):S86-S93.
- 1616. Selby-Harrington ML, Mehta SM, Jutsum V, Riportella-Muller R, Quade D. Reporting of instrument validity and reliability in selected clinical nursing journals. J Prof Nurs 1994; 10(1):47-56..

Neste sentido, discussões sobre o processo de desenvolvimento de novos questionários e escalas na área de saúde são bastante relevantes. O presente estudo tem como objetivos: discutir de forma sistematizada as principais etapas a serem seguidas na elaboração de instrumentos de medida na área de saúde e apresentar algumas ferramentas que podem ser utilizadas como auxílio nas etapas do desenvolvimento desses novos instrumentos.

Método

Trata-se de uma pesquisa bibliográfica que pode ser definida como narrativa1717. Rother ET. Revisão sistemática X revisão narrativa. Acta paul enfer 2007; 20(2):V-VI.. O levantamento bibliográfico foi realizado nas seguintes bases de dados das Ciências da Saúde: Biblioteca Virtual em Saúde - Enfermagem (BDENF), Portal de Revistas de Enfermagem, SciELO, Lilacs (Literatura Latino - Americana e do Caribe em Ciências da Saúde), Medline (National Library of Medicine-USA), International Nursing Index (INI) e Cumulative Index to Nursing and Allied Health Literature (CINAHL).

No estudo foram incluídas publicações nacionais e internacionais disponíveis nos idiomas português e inglês a partir de 1990 e que abordassem temas relacionados ao desenvolvimento de instrumentos de medida.

Os seguintes descritores utilizados em português foram pesquisados na Bireme (DeCS - Terminologia em Saúde): "estudos de validação", "validade dos testes", "reprodutibilidade dos testes" e "questionários". Para os descritores em inglês utilizou-se a National Library of Medicine's Medical Subject Headings (MeSH = Medical Subject Heading Terms). Estes foram os seguintes: "validation studies", "psychometrics", e "questionnaire design".

Resultados e discussão

Devido ao aumento da importância dos instrumentos de medida em saúde, o entendimento sobre o processo e as técnicas utilizadas para o desenvolvimento destas é crucial22. Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111..

Com o objetivo de melhorar a qualidade dos instrumentos, autores sugerem e descrevem etapas e métodos padronizados e sistemáticos que devem ser utilizados durante esse processo33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1818. Haynes SN, Richard DCS, Kubany ES. Content validity in psychological assessment: a functional approach to concepts and methods. Psychol Assess 1995; 7(3):238-247. , 1919. Pittman J, Bakas T. Measurement and instrument design. J Wound Ostomy Continence Nurs 2010; 37(6): 603-607..

De uma forma geral, a literatura destaca as seguintes etapas a serem seguidas no processo de construção de instrumentos: I-Estabelecimento da estrutura conceitual; II-definição dos objetivos do instrumento e da população envolvida; III-Construção dos itens e das escalas de resposta; IV-Seleção e organização dos itens; V-Estruturação do instrumento; VI-Validade de Conteúdo; e VII-Pré-teste.

Cada uma dessas etapas será discutida de maneira mais detalhada nas seções seguintes. A Figura 1 ilustra esse processo e apresenta de maneira resumida os recursos, critérios e/ou recomendações que geralmente são utilizados em cada etapa.

Figura 1.
As etapas do processo de desenvolvimento de instrumentos de medida e os recursos, critérios, recomendações e/ou atributos geralmente mais utilizados em cada etapa.

Com relação ao processo de avaliação das propriedades psicométricas de um instrumento, não há um consenso na literatura sobre este pertencer ao processo de desenvolvimento do instrumento ou não. Com a justificativa de que a utilidade de um instrumento de medida no meio científico e clínico só é reconhecida após este ter suas propriedades psicométricas avaliadas, este estudo também inclui uma breve discussão sobre a avaliação dessas propriedades.

As etapas do processo de construção de instrumentos de medidas na área da saúde

Estabelecimento da estrutura conceitual e definição dos objetivos do instrumento e da população envolvida

Para a construção de instrumentos de medida, é fundamental que os objetivos sejam estabelecidos e que estes tenham conexão com os conceitos a serem abordados2020. Snyder CF, Watson ME, Jackson JD, Cella D, Halyard MY, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcome instrument selection: designing a measurement strategy. Value Health 2007; 10(Supl. 2):S76-S85. , 2121. Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15.. A caracterização/definição da população-alvo também é importante porque serve para justificar a relevância da criação de um instrumento específico1515. Turner R, Quittner AL, Parasuraman BM, Kallich JD, Cleeland CS, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcomes: instrument development and selection issues. Value Health 2007; 10(Supl. 2):S86-S93..

A elaboração da estrutura conceitual, também conhecida como definição operacional do constructo e de sua dimensionalidade, é a etapa responsável por definir o contexto do instrumento e sustentar o desenvolvimento dos domínios e itens2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.. Esta é considerada uma etapa bastante importante porque "quanto melhor e mais completa for a especificação do constructo, melhor será a garantia de que o instrumento será útil e válido"2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.. Por este motivo, pesquisadores apontam para a importância das definições operacionais do constructo de forma detalhada2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213..

Construção dos itens e das escalas de resposta

Os itens de uma escala não devem ser construídos ao acaso. Eles devem ser elaborados ou selecionados em função das definições operacionais do constructo que já foram analisadas na etapa anterior2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213..

Vários são os recursos a partir dos quais esses itens podem ser construídos: busca na literatura, questionários já existentes, relatos da população-alvo, observação clínica, opinião de especialistas, resultados de pesquisa, teorias, dentre outros33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. , 1515. Turner R, Quittner AL, Parasuraman BM, Kallich JD, Cleeland CS, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcomes: instrument development and selection issues. Value Health 2007; 10(Supl. 2):S86-S93. , 2323. Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407.. Cada um desses recursos possui pontos fortes e fracos dependendo do tipo, do objetivo e da aplicação da escala a ser desenvolvida33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323..

A busca na literatura junto às bases de dados nacionais e internacionais é comumente utilizada como principal recurso nas pesquisas de desenvolvimento de instrumentos de medidas. Esta estratégia visa dar ciência ao pesquisador quanto aos instrumentos que já existem1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

A utilização de instrumentos já existentes também é apontada por pesquisadores33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. como um recurso útil, pois, na maioria das vezes, seus itens já foram testados quanto às qualidades psicométricas33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323.. A utilização destes itens em detrimento de construir novos pode economizar tempo e trabalho do pesquisador33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Outro recurso que pode ser significativo e fonte excelente de itens é a experiência da população-alvo33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.. Dentre as técnicas utilizadas para obtenção de dados da população de forma sistemática, citam-se a realização de grupo focal e entrevistas em profundidade33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. , 2323. Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407..

A observação clínica pode ser útil quando utilizada previamente à opinião de especialistas e também é uma forma de reunir informações de forma sistemática. Geralmente este recurso está associado à teoria, resultados laboratoriais e achados clínicos33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

A opinião de especialistas também é um recurso bastante utilizado e influencia consideravelmente na geração de itens mais potenciais para a escala1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.. Dentre as vantagens, está o fato dos especialistas serem escolhidos cuidadosamente e, portanto, representarem o que há de mais recente no conhecimento da área33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.. Recomenda-se a participação de três a dez especialistas33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Com relação aos resultados de pesquisas, os mais úteis são as revisões sistemáticas e estudos33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Além da construção dos itens, o desenvolvimento e escolha de um método para obtenção das respostas também é imprescindível1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.. As escalas de respostas aos itens podem assumir muitas formas e a escolha do método deve ser determinada pela natureza da pergunta realizada1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Dentre as técnicas utilizadas para a formulação de escalas de resposta, as mais comuns são as de estimativa direta, como a escala visual analógica, as escalas adjetivas, as escalas tipo Likert, as escala de faces, entre outras1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Cada um dos tipos de escala tem suas vantagens e desvantagens1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Seleção e organização dos itens, e estruturação do instrumento

Uma vez realizada a pesquisa bibliográfica, a consulta aos especialistas da área e aos representantes da população-alvo, o próximo passo é definir as suas dimensões/domínios de forma que se construa a variedade dos itens segundo os constructos2424. Sireci SG. The construct of content validity. Soc Indic Res 1998; 45(1-3):83-117..

Geralmente, nem todos os itens criados estão em concordância com a proposta do pesquisador e nem todos possuem bom desempenho. Por isso, o pesquisador deve estar atento aos diversos tipos de critérios existentes para selecionar os itens adequados do novo instrumento33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008..

Dentre os critérios mais comumente utilizados estão: o critério comportamental, o critério da objetividade, da simplicidade, da clareza, da precisão, da validade, da relevância e da interpretabilidade2121. Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15.

22. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.
- 2323. Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407.. O objetivo da adoção desses critérios é eliminar qualquer item que esteja ambíguo, incompreensível, com termos vagos, com duplas perguntas, com jargões e/ou que remeta a juízo de valores, dentre outros33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. , 2121. Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15.

22. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.
- 2323. Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407..

Com relação à quantidade de itens de um instrumento, este é um quesito não consensual2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.. Estudos sugerem que a representação de um constructo é conseguida com uma quantidade de 20 itens aproximadamente2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.. No entanto, para outra vertente, aponta-se que o início da construção de um instrumento deve possuir pelo menos o triplo de itens do instrumento final.

Outros estudos2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213. , 2323. Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407. se baseiam na teoria dos traços latentes para determinar o número de itens que farão parte do instrumento. De acordo com essa teoria, não se deve começar o instrumento com mais de 10% do número de itens desejado no instrumento final2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213..

A estruturação do questionário é o estágio que visa consolidar as etapas anteriores, ou seja, visa organizar os itens em seus respectivos domínios e estabelecer o formato geral do instrumento. Deve-se considerar o título, as instruções, as escalas de respostas, os escores, entre outros.

A estrutura e a sequência do questionário contribuem significativamente para reduzir o esforço físico e/ou mental dos respondentes e asseguram que todos os termos sejam tratados de forma que o interesse do respondente seja mantido até o final do questionário2121. Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15..

Um princípio utilizado na estruturação do questionário é o de que os itens estejam em uma ordem lógica. O direcionamento desses itens sempre que possível deve ser do item mais geral até o mais específico; no sentido do menos pessoal e menos delicado para o mais pessoal e mais delicado2121. Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15..

O procedimento de validade de conteúdo

Após ser estruturado e organizado, o novo instrumento provavelmente ainda contempla mais itens do que ele necessariamente apresentará em seu formato final1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.. Esse instrumento ainda precisa ser testado quanto à hipótese de que os itens escolhidos representam e/ou contemplam adequadamente os domínios do constructo desejado33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. , 2020. Snyder CF, Watson ME, Jackson JD, Cella D, Halyard MY, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcome instrument selection: designing a measurement strategy. Value Health 2007; 10(Supl. 2):S76-S85. , 2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213. , 2424. Sireci SG. The construct of content validity. Soc Indic Res 1998; 45(1-3):83-117.

25. Fagarasanu M, Kumar S. Measurement instruments and data collection: a consideration of constructs and biases in ergonomics research. Int J Ind Ergon 2002; 30(6):355-369.
- 2626. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518..

O procedimento de escolha é a avaliação de conteúdo. Esta é essencial no processo de desenvolvimento de novos instrumentos de medidas porque representa o início de mecanismos para associar conceitos abstratos com indicadores observáveis e mensuráveis1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. , 2424. Sireci SG. The construct of content validity. Soc Indic Res 1998; 45(1-3):83-117.

25. Fagarasanu M, Kumar S. Measurement instruments and data collection: a consideration of constructs and biases in ergonomics research. Int J Ind Ergon 2002; 30(6):355-369.

26. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518.
- 2727. Contandriopoulos AP. Saber preparar uma pesquisa. 3ª ed. São Paulo, Rio de Janeiro: Hucitec, Abrasco; 1999..

A avaliação de conteúdo deve ser realizada por um comitê composto por cinco a dez juízes especialistas na área do instrumento de medida2828. Polit DF, Beck CT, Hungler BP. Fundamentos em pesquisa em enfermagem: métodos, avaliação e utilização. 5ª ed. Porto Alegre: Artmed Editora; 2004. , 2929. Alexandre NMC, Coluci MZO. Validade de conteúdo nos processos de construção e adaptação de instrumentos de medida. Cien Saude Colet 2011; 16(7):3061-3067.. A avaliação por juízes pode envolver procedimentos qualitativos e quantitativos2929. Alexandre NMC, Coluci MZO. Validade de conteúdo nos processos de construção e adaptação de instrumentos de medida. Cien Saude Colet 2011; 16(7):3061-3067.

30. Burns N, Grove SK. The practice of nursing research: conduct, critique & utilization. 3a ed. Philadelphia: Saunders Company; 1997.

31. Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175.
- 3232. Hyrkas K, Appelqvist-Schmidlechner K, Oksa L. Validating an instrument for clinical supervision using an expert panel. Int J Nurs Stud 2003; 40:619-625.. O processo é iniciado com o convite aos membros do comitê de juízes.

Deve-se redigir aos especialistas uma carta constando o motivo da escolha daquele sujeito como juiz e a relevância dos conceitos envolvidos e do instrumento como um todo3333. Salmond SS. Evaluating the reliability and validity of measurement instruments. Orthop Nurs 2008; 27(1): 28-30..

Todo o procedimento para o julgamento da validade de conteúdo deve ser descrito de forma estruturada e entregue aos juízes. Cada um deles deve realizar uma avaliação inicial independente antes de se reunir com os demais membros3434. Berk RA. Importance of expert judgment in content-related validity evidence. West J Nurs Res 1990; 12(5):659-671.. Para isso, são necessárias instruções específicas a partir das quais esses juízes poderão determinar a validade de conteúdo3333. Salmond SS. Evaluating the reliability and validity of measurement instruments. Orthop Nurs 2008; 27(1): 28-30..

É importante que o comitê de especialistas participe em dois estágios distintos. O primeiro estágio é aquele em que os juízes realizam uma avaliação para a fase de especificação dos domínios. O segundo estágio é aquele para o qual realizam uma avaliação na fase de desenvolvimento dos itens3434. Berk RA. Importance of expert judgment in content-related validity evidence. West J Nurs Res 1990; 12(5):659-671.. Os especialistas devem receber instruções específicas em cada estágio sobre como avaliar cada item, como avaliar o instrumento como um todo e como preencher o questionário que orienta a avaliação.

No primeiro estágio de avaliação, os membros do comitê devem julgar os domínios e os itens criados para interpretação das respostas do questionário. Inicialmente é realizada a avaliação dos domínios, determinando a abrangência destes. Isto é, os juízes devem avaliar se cada domínio ou conceito foi adequadamente coberto pelo conjunto de itens e se todas as dimensões foram incluídas3131. Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175.. Os especialistas deverão verificar se o conteúdo está apropriado aos respondentes, se a estrutura do domínio e seu conteúdo estão corretos, e se o conteúdo contido no domínio é representativo3434. Berk RA. Importance of expert judgment in content-related validity evidence. West J Nurs Res 1990; 12(5):659-671.. Nesta fase, sugestões quanto à inclusão ou a eliminação de itens podem ser feitas3535. Rubio DM, Berg-Weger M, Tebb SS, Lee S, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res 2003; 27(2):94-105.. As instruções para análise da validade de conteúdo podem ser redigidas como no Quadro 1.

Quadro 1.
Modelo de instruções para primeira análise da validade de conteúdo.

Após a avaliação dos juízes, pode-se utilizar a taxa de concordância do comitê, que é obtida pelo cálculo da porcentagem em cada domínio. Este é realizado por meio da seguinte fórmula3131. Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175.:

Essa taxa é interpretada considerando que um resultado maior ou igual a 90% de concordância, significa que os domínios estão adequados2626. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518.. Quando o resultado for menor que 90%, o domínio precisa ser discutido e alterado.

No segundo estágio, os juízes devem avaliar cada item individualmente. Além disso, essa avaliação deve ser realizada com relação ao formato, ao título, às instruções, aos domínios, aos escores dos domínios (ou do instrumento) e à análise (interpretação) dos escores, considerando a clareza e/ou pertinência de cada aspecto a ser avaliado.

Com relação à clareza, a orientação é feita no sentido de que seja avaliada a redação dos itens. Ou seja, se estes itens estão redigidos de forma que o conceito esteja compreensível e se expressam adequadamente o que se espera medir3636. Grant JS, Davis LL. Selection and use of content experts for instrument development. Res Nurs Health 1997; 20(3):269-274.. Quanto à pertinência ou representatividade, os juízes devem notar se os itens realmente refletem os conceitos envolvidos, se estes são relevantes e se são e/ou estão adequados para atingir os objetivos propostos3636. Grant JS, Davis LL. Selection and use of content experts for instrument development. Res Nurs Health 1997; 20(3):269-274. , 3737. McGilton K. Development and psychometric evaluation of supportive leadership scales. Can J Nurs Res 2003; 35(4):72-86.. Além disso, os especialistas podem reavaliar a abrangência dos domínios e do instrumento como um todo. Sugestões e/ou comentários para melhorar o item poderão ser feitos em espaços deixados especificamente para essa finalidade3131. Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175. , 3535. Rubio DM, Berg-Weger M, Tebb SS, Lee S, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res 2003; 27(2):94-105..

Neste segundo estágio recomenda-se que a concordância dos membros do comitê seja verificada de forma quantitativa por meio do Índice de Validade de Conteúdo (IVC)2626. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518. , 2929. Alexandre NMC, Coluci MZO. Validade de conteúdo nos processos de construção e adaptação de instrumentos de medida. Cien Saude Colet 2011; 16(7):3061-3067. , 3838. Summers S. Establishing the Reliability and Validity of a New Instrument: Pilot Testing. J Post Anesth Nurs 1993; 8(2):124-127.. Esse índice mede a proporção ou porcentagem de juízes que estão em concordância sobre determinados aspectos do instrumento e de seus itens. Uma ferramenta a ser utilizada para avaliação dos juízes nessa etapa pode ser baseada no Quadro 2.

Quadro 2.
Modelo de instruções para segunda análise da validade de conteúdo.

O IVC é calculado com a utilização de uma escala tipo Likert de 4-pontos ordinais. Para avaliar a relevância/representatividade do item, os juízes poderão escolher as seguintes respostas: 1 = não relevante ou não representativo, 2 = item necessita de grande revisão para ser representativo, 3 = item necessita de pequena revisão para ser representativo, ou 4 = item relevante ou representativo2626. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518. , 3535. Rubio DM, Berg-Weger M, Tebb SS, Lee S, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res 2003; 27(2):94-105. , 3838. Summers S. Establishing the Reliability and Validity of a New Instrument: Pilot Testing. J Post Anesth Nurs 1993; 8(2):124-127.. A abrangência, a clareza e a pertinência serão avaliadas com a mesma escala e podem apresentar opções mais curtas, como: 1 = não claro, 2 = pouco claro, 3 = bastante claro, 4 = muito claro2626. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518. , 3232. Hyrkas K, Appelqvist-Schmidlechner K, Oksa L. Validating an instrument for clinical supervision using an expert panel. Int J Nurs Stud 2003; 40:619-625. , 3939. DeVon HA, Block ME, Moyle-Wright P, Ernst DM, Hayden SJ, Lazzara DJ, Savoy SM, Kostas-Polston E. A psychometric toolbox for testing validity and reliability. J Nurs Scholarsh 2007; 39(2):155-164..

Assim, o cálculo é feito a partir da somatória das respostas "3" e "4" de cada juiz em cada item do questionário e divide-se esta soma pelo número total de respostas, como segue2929. Alexandre NMC, Coluci MZO. Validade de conteúdo nos processos de construção e adaptação de instrumentos de medida. Cien Saude Colet 2011; 16(7):3061-3067. , 3232. Hyrkas K, Appelqvist-Schmidlechner K, Oksa L. Validating an instrument for clinical supervision using an expert panel. Int J Nurs Stud 2003; 40:619-625..

Os itens que recebem pontuação "1" ou "2" devem ser revisados ou eliminados. A taxa de concordância aceitável entre os juízes para avaliação dos itens individualmente deve ser superior a 0,784040. Polit DF, Beck CT. The content validity index: are you sure you know what's being reported? Critique and recommendations. Res Nurs Health 2006; 29(5):489-497.. Para a verificação da validade do novo instrumento de uma forma geral, deve haver uma concordância mínima de 0,803636. Grant JS, Davis LL. Selection and use of content experts for instrument development. Res Nurs Health 1997; 20(3):269-274. e, preferencialmente, superior a 0,904040. Polit DF, Beck CT. The content validity index: are you sure you know what's being reported? Critique and recommendations. Res Nurs Health 2006; 29(5):489-497..

Nos dois estágios, a avaliação de conteúdo do instrumento é quantitativa. Esta é inicialmente realizada pelos juízes de forma individual, independente e em um período pré-estabelecido. Em seguida deve ser feita uma discussão em grupo que corresponde ao procedimento qualitativo3131. Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175. , 3232. Hyrkas K, Appelqvist-Schmidlechner K, Oksa L. Validating an instrument for clinical supervision using an expert panel. Int J Nurs Stud 2003; 40:619-625. ,34.

A abordagem de se usar pelo menos dois métodos, geralmente quantitativo e qualitativo, é denominada triangulação metodológica4141. Morse JM. Approaches to qualitative-quantitative methodological triangulation. Nurs Res 1991; 40(1):120-123..

A fase qualitativa é representada por um processo interativo entre pesquisadores e os membros do comitê por meio de entrevistas e discussões para clarificar pontos controversos3636. Grant JS, Davis LL. Selection and use of content experts for instrument development. Res Nurs Health 1997; 20(3):269-274..

Nessas discussões/entrevistas, todas as sugestões e comentários dos membros do comitê são expostos e anotados pelo pesquisador. Os documentos devolvidos pelos juízes e suas propostas de modificações emitidas durante a reunião devem ser avaliadas e revisadas.

Posteriormente, uma nova versão do instrumento que contemple as sugestões apresentadas pelo comitê pode ser entregue novamente a cada membro. Os juízes deverão revisar seus critérios de avaliação para que seja finalizado o processo de validade de conteúdo e a versão para pré-teste seja obtida.

O procedimento de pré-teste

O pré-teste (também referido como análise semântica dos itens) tem como objetivo verificar se todos os itens são compreensíveis para todos os membros da população a qual o instrumento se destina2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213..

Esta etapa deve ser realizada em uma amostra de 30-40 indivíduos da população-alvo. Cada sujeito deve completar o questionário e em seguida ser entrevistado individualmente com relação ao entendimento dos itens e das palavras e quanto ao preenchimento das respostas2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213..

Algumas modificações poderão ser necessárias na versão final do instrumento. Caso sejam alterações significativas, estas devem ser submetidas à avaliação pelos membros do comitê de juízes novamente.

Terminada essa etapa, o instrumento de medida estará pronto para ter suas propriedades psicométricas avaliadas2222. Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213..

Avaliação das propriedades psicométricas

A robustez dos resultados de um estudo depende muito do instrumento utilizado. Se a qualidade deste estudo é apropriada, os resultados são válidos e o questionário pode ser uma ferramenta útil para novas pesquisas ou para a prática clínica4242. Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272.. No entanto, quando a qualidade do estudo é inadequada, os resultados não são confiáveis e a qualidade e utilidade do questionário utilizado no estudo permanecem obscuras4242. Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272..

Portanto, ao desenvolver e/ou selecionar instrumentos que serão utilizados em pesquisas e/ou na prática clínica, é muito importante que estes sejam ou tenham sido avaliados quanto às suas propriedades psicométricas4343. Olivo SA, Macedo LG, Gadotti IC, Fuentes J, Stanton T, Magee DJ. Scales to assess the quality of randomized controlled trials: a systematic review. Phys Ther 2008; 88(2):156-175..

A literatura descreve vários atributos que podem ser testados no processo de avaliação das propriedades psicométricas de um instrumento1414. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42. , 4444. Kimberling CL, Winterstein AG. Validity and reliability of measurement instruments used in research. Am J Health Syst Pharm 2008; 65(23):2276-2284. , 4545. DeVon HA, Block ME, Moyle-Wright P, Ernst DM, Hayden SJ, Lazzara DJ, Savoy SM, Kostas-Polston E. A psychometric toolbox for testing validity and reliability. J Nurs Scholarsh 2007; 39(2):155-164.: validade (validity), confiabilidade (reliability), praticabilidade (praticability), sensibilidade (sensitivity), responsividade (responsiveness) e interpretabilidade (interpretability).

A seleção dos atributos que devem ser avaliados, bem como o método a ser utilizado vai depender do tipo e objetivos de cada instrumento. Dentre os atributos citados, aqueles mais comumente utilizados são a validade, a confiabilidade e a responsividade4242. Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272..

A validade é a capacidade de um instrumento medir com precisão o fenômeno a ser estudado1414. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42. , 1919. Pittman J, Bakas T. Measurement and instrument design. J Wound Ostomy Continence Nurs 2010; 37(6): 603-607. , 2727. Contandriopoulos AP. Saber preparar uma pesquisa. 3ª ed. São Paulo, Rio de Janeiro: Hucitec, Abrasco; 1999. , 4646. Roberts P, Priest H, Traynor M. Reliability and validity in research. Nurs Stand 2006; 20(44):41-45.. A avaliação deste atributo pode ser feita de várias maneiras: validade de conteúdo, validade de constructo e validade de critério11. Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290. , 33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323. , 4747. Pasquali L. Psicometria. Rev Esc Enf USP 2009; 43(esp):992-999. . Cada uma dessas maneiras avalia aspectos diferentes do instrumento e deve ser pensada como parte de um processo33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323..

A confiabilidade é a capacidade do instrumento em reproduzir um resultado de forma consistente no tempo e no espaço ou com observadores diferentes1414. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42. , 2727. Contandriopoulos AP. Saber preparar uma pesquisa. 3ª ed. São Paulo, Rio de Janeiro: Hucitec, Abrasco; 1999.. Ou seja, confiabilidade refere-se à quão estável, consistente ou preciso é o instrumento1919. Pittman J, Bakas T. Measurement and instrument design. J Wound Ostomy Continence Nurs 2010; 37(6): 603-607. , 2828. Polit DF, Beck CT, Hungler BP. Fundamentos em pesquisa em enfermagem: métodos, avaliação e utilização. 5ª ed. Porto Alegre: Artmed Editora; 2004.. Os procedimentos utilizados para a avaliação da confiabilidade também são diversos. Dentre eles, os mais utilizados são: consistência interna (homogeneidade) e estabilidade (confiabilidade teste-reteste, confiabilidade interobservadores ou intraobservadores)33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323..

A responsividade é a capacidade de um instrumento detectar mudanças sobre o constructo a ser medido ao longo do tempo1414. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42. , 4242. Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272.. Este atributo se refere à validade no contexto longitudinal. A diferença entre a validade e responsividade é que a primeira se refere à validade de um escore simples e a responsividade se refere à validade de mudanças nesse escore4242. Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272..

Com relação às propriedades psicométricas, é importante ressaltar que estas não são estáticas do instrumento. Ou seja, elas podem variar de acordo com a mudança da população de estudo33. Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323..

Além disso, outros fatores que também podem influenciar na avaliação das propriedades psicométricas são: modo de administração (entrevista, telefone, ou autoaplicado), tipo de população-alvo, tamanho amostral, dentre outros1111. Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008. , 4848. Frost MH, Reeve BB, Liepa AM, Stauffer JW, Hays RD, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. What is sufficient for reliability and validity of patient-reported outcome measures? Value Health 2007; 10(Supl. 2):S94-S105..

Conclusões

Este estudo realizou uma discussão de forma sistematizada sobre os procedimentos recomendados para a construção de novos instrumentos de saúde a serem utilizados tanto na assistência como em pesquisas.

Compreender, analisar e seguir o processo descrito neste estudo é essencial para pesquisadores e profissionais da área de saúde, que estejam preocupados em construir e utilizar instrumentos de medidas cada vez mais confiáveis e apropriados.

Referências

  • 1
    Cano SJ, Hobart JC. The problem with health measurement. Patient Prefer Adherence 2011; 5:279-290.
  • 2
    Marx RG, Bombardier C, Hogg-Johnson S, Wright JG. Clinimetric and psychometric strategies for development of a health measurement scale. J Clin Epidemiol 1999; 5(2):105-111.
  • 3
    Keszei A, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res 2010; 68(4);319-323.
  • 4
    Rattray J, Jones MC. Essential elements of questionnaire design and development. J Clin Nurs 2007; 16(2):234-243.
  • 5
    Gallasch CH, Alexandre NMC, Amick III B. Cross-cultural adaptation, Reliability, and validity of the Work Role Functioning Questionnaire to Brazilian Portuguese. J Occup Rehabil 2007; 17(4):701-711.
  • 6
    Vigatto R, Alexandre NMC, Correa Filho HR. Development of a Brazilian Portuguese version of the Oswestry Disability Index. Cross-cultural adaptation, reliability, and validity. Spine 2007; 32(4):481-486.
  • 7
    Nakajima KM, Rodrigues RCM, Gallani MCBJ, Alexandre NMC, Oldridge N. Psychometric properties of MacNew Heart Disease Health-related Quality of Life Questionnaire: Brazilian version. J Adv Nurs 2009; 65(5):1084-1094.
  • 8
    Toledo R, Alexandre NMC, Rodrigues RCM. Psychometric evaluation of a Brazilian Portuguese version of the Spitzer Quality of Life Index in patients with low back pain. Rev Lat Am Enfermagem 2008; 16(6):943-950.
  • 9
    Cano SJ, Hobart JC, Fitzpatrick R, Bhatia K, Thompson AJ, Warner TT. Patient-based outcomes of cervical dystonia: a review of rating scales. Mov Disord 2004; 19(9):1054-1059.
  • 10
    Chen CM, Cano SJ, Klassen AF, King T, McCarthy C, Cordeiro PG, Morrow M, Pusic AL. Measuring quality of life in oncologic breast surgery: a systematic review of patient-reported outcome measures. Breast J 2010; 16(6):58-97.
  • 11
    Streiner DL, Norman GR. Health measurement scales. A practical guide to their development and use. 4th ed. New York: Oxford University Press; 2008.
  • 12
    Alexandre NMC, Guirardello EB. Adaptación cultural de instrumentos utilizados em salud ocupacional. Rev Panam Salud Publica 2002; 11(2):109-111.
  • 13
    Hutchinson A, Bentzen N, Konig-Zanhn C. Cross cultural health outcome assessment: a user's guide. The Netherlands: ERGHO; 1996.
  • 14
    Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60(1):34-42.
  • 15
    Turner R, Quittner AL, Parasuraman BM, Kallich JD, Cleeland CS, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcomes: instrument development and selection issues. Value Health 2007; 10(Supl. 2):S86-S93.
  • 16
    Selby-Harrington ML, Mehta SM, Jutsum V, Riportella-Muller R, Quade D. Reporting of instrument validity and reliability in selected clinical nursing journals. J Prof Nurs 1994; 10(1):47-56.
  • 17
    Rother ET. Revisão sistemática X revisão narrativa. Acta paul enfer 2007; 20(2):V-VI.
  • 18
    Haynes SN, Richard DCS, Kubany ES. Content validity in psychological assessment: a functional approach to concepts and methods. Psychol Assess 1995; 7(3):238-247.
  • 19
    Pittman J, Bakas T. Measurement and instrument design. J Wound Ostomy Continence Nurs 2010; 37(6): 603-607.
  • 20
    Snyder CF, Watson ME, Jackson JD, Cella D, Halyard MY, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. Patient-reported outcome instrument selection: designing a measurement strategy. Value Health 2007; 10(Supl. 2):S76-S85.
  • 21
    Günther H. Como Elaborar um Questionário. Serie Planejamento de pesquisa nas ciências sociais 2003; 1:1-15.
  • 22
    Pasquali L. Princípios de elaboração de escalas psicológicas. Rev Psiq Clin 1998; 25(5):206-213.
  • 23
    Cardoso CS, Bandeira M, Ribeiro ALP, Oliveira GL, Caiaffa WT. Escalas de satisfação com o atendimento às doenças cardiovasculares: Cardiosatis- usuário equipe. Cien Saude Colet 2011; 16(Supl. 1):1401-1407.
  • 24
    Sireci SG. The construct of content validity. Soc Indic Res 1998; 45(1-3):83-117.
  • 25
    Fagarasanu M, Kumar S. Measurement instruments and data collection: a consideration of constructs and biases in ergonomics research. Int J Ind Ergon 2002; 30(6):355-369.
  • 26
    Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res 2003; 25(5):508-518.
  • 27
    Contandriopoulos AP. Saber preparar uma pesquisa. 3ª ed. São Paulo, Rio de Janeiro: Hucitec, Abrasco; 1999.
  • 28
    Polit DF, Beck CT, Hungler BP. Fundamentos em pesquisa em enfermagem: métodos, avaliação e utilização. 5ª ed. Porto Alegre: Artmed Editora; 2004.
  • 29
    Alexandre NMC, Coluci MZO. Validade de conteúdo nos processos de construção e adaptação de instrumentos de medida. Cien Saude Colet 2011; 16(7):3061-3067.
  • 30
    Burns N, Grove SK. The practice of nursing research: conduct, critique & utilization. 3a ed. Philadelphia: Saunders Company; 1997.
  • 31
    Tilden VP, Nelson CA, May BA. Use of qualitative methods to enhance content validity. Nurs Res 1990; 39(3):172-175.
  • 32
    Hyrkas K, Appelqvist-Schmidlechner K, Oksa L. Validating an instrument for clinical supervision using an expert panel. Int J Nurs Stud 2003; 40:619-625.
  • 33
    Salmond SS. Evaluating the reliability and validity of measurement instruments. Orthop Nurs 2008; 27(1): 28-30.
  • 34
    Berk RA. Importance of expert judgment in content-related validity evidence. West J Nurs Res 1990; 12(5):659-671.
  • 35
    Rubio DM, Berg-Weger M, Tebb SS, Lee S, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res 2003; 27(2):94-105.
  • 36
    Grant JS, Davis LL. Selection and use of content experts for instrument development. Res Nurs Health 1997; 20(3):269-274.
  • 37
    McGilton K. Development and psychometric evaluation of supportive leadership scales. Can J Nurs Res 2003; 35(4):72-86.
  • 38
    Summers S. Establishing the Reliability and Validity of a New Instrument: Pilot Testing. J Post Anesth Nurs 1993; 8(2):124-127.
  • 39
    DeVon HA, Block ME, Moyle-Wright P, Ernst DM, Hayden SJ, Lazzara DJ, Savoy SM, Kostas-Polston E. A psychometric toolbox for testing validity and reliability. J Nurs Scholarsh 2007; 39(2):155-164.
  • 40
    Polit DF, Beck CT. The content validity index: are you sure you know what's being reported? Critique and recommendations. Res Nurs Health 2006; 29(5):489-497.
  • 41
    Morse JM. Approaches to qualitative-quantitative methodological triangulation. Nurs Res 1991; 40(1):120-123.
  • 42
    Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, de Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther 2011; 34(4):261-272.
  • 43
    Olivo SA, Macedo LG, Gadotti IC, Fuentes J, Stanton T, Magee DJ. Scales to assess the quality of randomized controlled trials: a systematic review. Phys Ther 2008; 88(2):156-175.
  • 44
    Kimberling CL, Winterstein AG. Validity and reliability of measurement instruments used in research. Am J Health Syst Pharm 2008; 65(23):2276-2284.
  • 45
    DeVon HA, Block ME, Moyle-Wright P, Ernst DM, Hayden SJ, Lazzara DJ, Savoy SM, Kostas-Polston E. A psychometric toolbox for testing validity and reliability. J Nurs Scholarsh 2007; 39(2):155-164.
  • 46
    Roberts P, Priest H, Traynor M. Reliability and validity in research. Nurs Stand 2006; 20(44):41-45.
  • 47
    Pasquali L. Psicometria. Rev Esc Enf USP 2009; 43(esp):992-999.
  • 48
    Frost MH, Reeve BB, Liepa AM, Stauffer JW, Hays RD, Mayo/FDA Patient-Reported Outcomes Consensus Meeting Group. What is sufficient for reliability and validity of patient-reported outcome measures? Value Health 2007; 10(Supl. 2):S94-S105.

Datas de Publicação

  • Publicação nesta coleção
    Mar 2015

Histórico

  • Recebido
    15 Mar 2013
  • Aceito
    14 Abr 2013
ABRASCO - Associação Brasileira de Saúde Coletiva Av. Brasil, 4036 - sala 700 Manguinhos, 21040-361 Rio de Janeiro RJ - Brazil, Tel.: +55 21 3882-9153 / 3882-9151 - Rio de Janeiro - RJ - Brazil
E-mail: cienciasaudecoletiva@fiocruz.br