Acessibilidade / Reportar erro

Longitudinal Data and Correlated Measures Bias: The Alternative of Mixed Models

Keywords
Cohort Studies; Longitudinal Studies; Cross-Section,Studies; Epidemiology; Biostatistics

Longitudinal studies have two important data typologies: single outcomes or repeated measures.11. Medronho RA, Bloch KV, Raggio LR, Werneck GL. Epidemiologia. 2ª ed. São Paulo: Atheneu; 2009. 685 P . Single outcome, such as death or disease onset, should have a different data treatment than those studies with repeated measures outcome. But, they have in common the detection of changes over time and the contributing factors for this change. Cohort differs from cross-sectional studies that desire only variables relationshiP , without causal effect.

Fernandes et al.22. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. wrote an article entitled The RelationshiP between Lifestyle and Costs Related to Medicine Use in Adults, published in this journal, volume 112, number 6, 2019, and they used behavioral independent variables to estimate their effects on drug costs outcome, collected as repeated measurements in a prospective cohort design.

The aim of this exposition is to show that, probably, there was a mistake in the Fernandes et al.22. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. data analysis, which compromises the causality inferences due to the great possibility of the estimates’ accuracy to be mistaken.

Let's get to the facts. Considering the prospective cohort design with repeated measures, there is a hierarchical structure in the outcome data due to their clustering in the same participant after various measures. Data cluster leave to the model error, that is the difference between what was predicted by the model and the actual measurement, of the same participant, at different times, to be correlated.33. Fausto MA, Carneiro M, Antunes CMDF, Pinto JA, Colosimo EA. O modelo de regressão linear misto para dados longitudinais: Uma aplicação na análise de dados antropométricos desbalanceados. Cad Saude Publica. 2008;24(3):513-24. This is a condition for not using multiple linear regression (MLR) which assumes the independence of the model error given by the assumption that the distribution of each participant is equal. MLR does not extract from the data which is variability within the individual from variability between individuals (population).33. Fausto MA, Carneiro M, Antunes CMDF, Pinto JA, Colosimo EA. O modelo de regressão linear misto para dados longitudinais: Uma aplicação na análise de dados antropométricos desbalanceados. Cad Saude Publica. 2008;24(3):513-24.

Using RLM in repeated measures generates regression coefficients with standard errors biased. This requires covariance matrix application that will produce more reliable estimates, in others words, narrower confidence intervals from Mixed Effects Models.44. Helena Constantino Spyrides M, José Struchiner C, Tereza Serrano Barbosa Gilberto Kac M. Análise de Dados com Medidas Repetidas. In: Kac G, Sichieri R, Gigante D Epidemiologia nutricional. Rio de Janeiro: Editora FIOCRUZ/Atheneu; 2007.P . 245-60. This is the best alternative to verify changes over time or the conditioners effects on repeated measures outcomes in longitudinal studies, controlling for individual effects.

There is greater variability between individuals than within individuals, mainly due to biological and social conditioning differences, it’s observed that drug costs will be more correlated over time in the same individual than among participants. To think that this distribution is the same among the participants ignores theoretical assumption in the social determination on people's behavior.55. Garbois JA, Sodre F, Dalbello-Araujo M. Da noção de determinação social à de determinantes sociais da saúde. Saúde Debate. 2017;41(112):63-76.

Build distinct MLRs (A, B, C and D), see Fernandes et al.22. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55., does not control this covariance effect, and therefore may be producing coefficients with confidence intervals biased in independent variables and can not detect the rate of change from basal either.33. Fausto MA, Carneiro M, Antunes CMDF, Pinto JA, Colosimo EA. O modelo de regressão linear misto para dados longitudinais: Uma aplicação na análise de dados antropométricos desbalanceados. Cad Saude Publica. 2008;24(3):513-24. In addition, with mixed models it would also be possible to take advantage of measurements that were measured on lost participants, increasing modeling sensitivity.44. Helena Constantino Spyrides M, José Struchiner C, Tereza Serrano Barbosa Gilberto Kac M. Análise de Dados com Medidas Repetidas. In: Kac G, Sichieri R, Gigante D Epidemiologia nutricional. Rio de Janeiro: Editora FIOCRUZ/Atheneu; 2007.P . 245-60.

From another perspective, the objective of the research being to estimate the interrelation of drug cost and behavioral habits, without establishing causality, would only require a cross-sectional design of the participants with the collection of outcome data and independent variables at a single moment. Thus, the basal regression model would be sufficient to estimate gross and adjusted associations.11. Medronho RA, Bloch KV, Raggio LR, Werneck GL. Epidemiologia. 2ª ed. São Paulo: Atheneu; 2009. 685 P .

Thus, the use of RLM should be restricted to cross-sectional research designs and longitudinal studies with repeated measures outcomes need to differentiate the individual effect of the population effect in the identification of temporal changes and their conditioning. Possibly, the findings of Fernandes el al.22. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. should be based regarding their conclusions about the inverse relationshiP between alcohol use and drug costs or the statistically non-significant relationships with body fat, gender and smoking status that have great impact on other health situations, especially chronic diseases.

References

  • 1
    Medronho RA, Bloch KV, Raggio LR, Werneck GL. Epidemiologia. 2ª ed. São Paulo: Atheneu; 2009. 685 P .
  • 2
    Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55.
  • 3
    Fausto MA, Carneiro M, Antunes CMDF, Pinto JA, Colosimo EA. O modelo de regressão linear misto para dados longitudinais: Uma aplicação na análise de dados antropométricos desbalanceados. Cad Saude Publica. 2008;24(3):513-24.
  • 4
    Helena Constantino Spyrides M, José Struchiner C, Tereza Serrano Barbosa Gilberto Kac M. Análise de Dados com Medidas Repetidas. In: Kac G, Sichieri R, Gigante D Epidemiologia nutricional. Rio de Janeiro: Editora FIOCRUZ/Atheneu; 2007.P . 245-60.
  • 5
    Garbois JA, Sodre F, Dalbello-Araujo M. Da noção de determinação social à de determinantes sociais da saúde. Saúde Debate. 2017;41(112):63-76.

I appreciate the opportunity to answer the questions concerning our manuscript recently published in Arquivos Brasileiros de Cardiologia.11. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. Academic discussion is always healthy and welcome.

Firstly, thank you for your interest in our study. The question raised refers to the use of linear regression in the treatment of data from a prospective cohort with repeated measures, which is believed to have caused mistaken estimates (mixed linear regression is suggested instead). Linear regression is debated as it fails to detect intra-individual variability properly, as it focuses on variability between individuals. From a theoretical point of view, this statement is correct, but it does not reflect the way the data were analyzed in the study.

The dependent variable of the study was defined as “drug spending over 12 months.” In the study, we did not analyze the history of drug spending over the year22. Lemes ÍR, Fernandes RA, Turi-Lynch BC, Codogno JS, de Morais LC, Koyama KAK, Monteiro HL. Metabolic Syndrome, Physical Activity, and Medication-Related Expenditures: A Longitudinal Analysis. J Phys Act Health. 2019;16(10):830-5. (and how this history would be affected by behavioral variables), nor did we seek to identify the relationshiP between changes compared to baseline (for dependent and independent variables). We did try to analyze the relationshiP of behavioral variables with the final amount spent over the year.

In fact, this dependent variable is unusual in its construction, as it was longitudinally designed (expenditures on drugs computed over 12 months), but treated cross-sectionally (total amount spent over 12 months). The total amount of drug spending reflects a cross-sectional construct, although its construction considers the 12 months of follow-uP . This particularity of the dependent variable, added to the fact that the behavioral variables were collected at only two moments (baseline and at the end of 12 months), led us to create the four models proposed in the study, which characterize a cross-sectional view of the problem (especially models A [baseline data] and B [at the end of 12 months]). Unfortunately, the monthly assessment of behavioral variables was not an available methodological option.

In an ideal model, the dependent variable and the independent variables should be collected monthly, allowing to identify the impact of changes on behavioral variables on changes in drug spending history over the year. However, I repeat, this was not the purpose of the study.11. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. For this type of analysis, specific structural equation modelling (latent growth curve analysis) would be more suitable (even more so than mixed linear regression), as they would make it possible to analyze the direct impact of changes on independent variable (slope)over changes observed on dependent variable (slope).33. Brailean A, Aartsen MJ, Muniz-Terrera G, Prince M, Prina AM, Comijs HC, Huisman M, Beekman A. Longitudinal associations between late-life depression dimensions and cognitive functioning: a cross-domain latente growth curve analysis. Psychol Med. 2017;47(4):690-702. The “impact” measures generated by the model are easily interpreted, as they can be expressed as correlation coefficients, which additionally provide effect-size measurements.44. Maher JM, Markey JC, Ebert-May D. The other half of the story: effect size analysis in quantitative research. CBE Life Sci Educ. 2013; 12(3):345-51.

Additionally, the dependent variable as it was presented (cross-sectionally, with spending accruing over follow-uP time) was necessary due to the particularities observed in its structure. Unlike other variables usually measured in different areas of health sciences (height, blood pressure, lipid profile components), which do not have zero value, drug spending occurs irregularly, reflecting the high occurrence of zero values (that is, spending can be reported in the first month of collection, then no spending can be reported over the subsequent months). Against this background, analyses considering the month-to-month variable would be problematic. Likewise, the issue of intra-individual variability needs to be considered with caution in this study because drug spending in the previous month does not recur in the following month, unlike what was observed for variables like height55. Fausto MA, Carneiro M, Antunes CM, Pinto JA, Colosimo EA. Mixed linear regression model for longitudinal data: application to an unbalanced anthropometric data set. Cad Saude Publica. 2008;24(3):513-24. which, even without any gain, the amount of the previous month will repeat in the following month.

Finally, the absence of significant relationships for obesity and smoking is not surprising in this study, as the sample is relatively young, without the presence of chronic diseases and low occurrence of smoking.

References

  • 1
    Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55.
  • 2
    Lemes ÍR, Fernandes RA, Turi-Lynch BC, Codogno JS, de Morais LC, Koyama KAK, Monteiro HL. Metabolic Syndrome, Physical Activity, and Medication-Related Expenditures: A Longitudinal Analysis. J Phys Act Health. 2019;16(10):830-5.
  • 3
    Brailean A, Aartsen MJ, Muniz-Terrera G, Prince M, Prina AM, Comijs HC, Huisman M, Beekman A. Longitudinal associations between late-life depression dimensions and cognitive functioning: a cross-domain latente growth curve analysis. Psychol Med. 2017;47(4):690-702.
  • 4
    Maher JM, Markey JC, Ebert-May D. The other half of the story: effect size analysis in quantitative research. CBE Life Sci Educ. 2013; 12(3):345-51.
  • 5
    Fausto MA, Carneiro M, Antunes CM, Pinto JA, Colosimo EA. Mixed linear regression model for longitudinal data: application to an unbalanced anthropometric data set. Cad Saude Publica. 2008;24(3):513-24.

Agradeço a oportunidade de resposta aos questionamentos relacionados ao nosso manuscrito recentemente publicado no Arquivos Brasileiros de Cardiologia.11. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. A discussão acadêmica sempre é saudável e bem-vinda.

Inicialmente, agradeço o interesse em nosso trabalho. O questionamento levantado refere-se ao uso da regressão linear no tratamento de dados provenientes de uma coorte prospectiva com medidas repetidas, fato que teria levado a geração de estimativas equivocadas (faz-se a sugestão do uso da regressão linear mista). A crítica sustenta-se na fragilidade da regressão linear em detectar a variabilidade intra indivíduo, ao passo que o modelo centra na variabilidade entre os indivíduos. Do ponto de vista teórico, o comentário está correto, porém não reflete a forma como os dados foram analisados neste estudo.

A variável dependente deste estudo foi definida como “custos com medicamentos acumulados ao longo de 12 meses”. Neste estudo, não se tentou analisar a trajetória dos custos com medicamento ao longo do ano22. Lemes ÍR, Fernandes RA, Turi-Lynch BC, Codogno JS, de Morais LC, Koyama KAK, Monteiro HL. Metabolic Syndrome, Physical Activity, and Medication-Related Expenditures: A Longitudinal Analysis. J Phys Act Health. 2019;16(10):830-5. (e como estas trajetórias seriam afetadas pelas variáveis comportamentais) e, também, não se buscou identificar a relação entre mudanças frente à linha de base (para variáveis dependentes e independentes). Houve sim, a tentativa de analisar a relação das variáveis comportamentais com o montante final acumulado ao longo do ano.

De fato, esta variável dependente é inusitada em sua forma de construção, pois foi elaborada longitudinalmente (gastos com medicamentos computados ao longo de 12 meses), mas tratada transversalmente (total acumulado ao longo dos 12 meses). O montante total de gastos com medicamento reflete um construto transversal, embora sua construção considere os 12 meses de seguimento. Esta particularidade da variável dependente, somada ao fato das variáveis comportamentais terem sido coletadas em apenas dois momentos do estudo (linha de base e ao final de 12 meses), nos levou a criar os quatro modelos propostos no artigo, os quais caracterizam uma leitura transversal do problema (principalmente os modelos A [dados de linha de base] e B [ao final de 12 meses]). Infelizmente, a avaliação mensal das variáveis comportamentais não foi uma opção metodológica disponível.

Em um modelo ideal, a variável dependente e as variáveis independentes deveriam ser coletadas mensalmente, possibilitando identificar o impacto de mudanças nas variáveis comportamentais sobre mudanças na trajetória dos custos com medicamento ao longo do ano. Porém, repito, este não foi o objetivo do referido artigo.11. Fernandes RA, Mantovani AM, Sanches Codogno J, Camilo Turi-Lynch B, Pokhrel S, Anokye N. Relação entre Estilo de Vida e Custos Relacionados ao Uso de Medicamentos em Adultos. Arq Bras Cardiol. 2018;11(2):749-55. Para este tipo de análise, modelos de equação estrutural com modelagem específica (Latent Growth Curve Analysis) seriam mais interessantes (até mais que a regressão linear mista), pois possibilitariam analisar o impacto direto da taxa de mudança ao longo do seguimento na variável independente sobre a taxa de mudança da variável dependente.33. Brailean A, Aartsen MJ, Muniz-Terrera G, Prince M, Prina AM, Comijs HC, Huisman M, Beekman A. Longitudinal associations between late-life depression dimensions and cognitive functioning: a cross-domain latente growth curve analysis. Psychol Med. 2017;47(4):690-702. As medidas de “impacto” geradas pelo modelo são facilmente interpretadas, pois podem ser expressas em medidas de correlação, as quais adicionalmente fornecem medidas de tamanho de efeito.44. Maher JM, Markey JC, Ebert-May D. The other half of the story: effect size analysis in quantitative research. CBE Life Sci Educ. 2013; 12(3):345-51.

Adicionalmente, a apresentação da variável dependente da forma como foi apresentada (transversalmente, os gastos acumulados ao longo do seguimento) se fez necessária devido a particularidades observadas na estrutura da mesma. Diferentemente de outras variáveis usualmente mensuradas nas diferentes áreas das ciências da saúde (estatura, pressão arterial, componentes do perfil lipídico), as quais não apresentam o valor zero, os gastos com medicamentos ocorrem de maneira irregular, refletindo-se na elevada ocorrência de valores zero, ou seja, é possível relatar gastos no primeiro mês de coleta e, ao longo dos demais meses, relatar nenhum gasto. Nesse pano de fundo, análises considerando a variável mês a mês seriam problemáticas. Da mesma forma, a questão da variabilidade intra indivíduo precisa ser considerada com cautela neste estudo devido ao fato do gasto com medicamento do mês anterior não se repetir no mês seguinte, diferentemente do observado para variáveis como a estatura55. Fausto MA, Carneiro M, Antunes CM, Pinto JA, Colosimo EA. Mixed linear regression model for longitudinal data: application to an unbalanced anthropometric data set. Cad Saude Publica. 2008;24(3):513-24. que, mesmo sem ganho, o valor do mês anterior se repetirá no mês seguinte.

Por fim, a ausência de relações significativas para obesidade e fumo não chega a ser uma surpresa neste estudo, devido ao fato da amostra ser relativamente jovem, sem a presença de doenças crônicas e com baixa ocorrência de tabagismo.

Publication Dates

  • Publication in this collection
    2 Dec 2019
  • Date of issue
    Dec 2019

History

  • Received
    02 Sept 2019
  • Reviewed
    04 Sept 2019
  • Accepted
    04 Sept 2019
Sociedade Brasileira de Cardiologia - SBC Avenida Marechal Câmara, 160, sala: 330, Centro, CEP: 20020-907, (21) 3478-2700 - Rio de Janeiro - RJ - Brazil, Fax: +55 21 3478-2770 - São Paulo - SP - Brazil
E-mail: revista@cardiol.br