Desempenho do ChatGPT nas questões da avaliação anual de residentes do Colégio Brasileiro de Radiologia

Leitão, Cleverson Alex; Salvador, Gabriel Lucca de Oliveira; Rabelo, Leda Maria; Escuissato, Dante Luiz

doi:10.1590/0100-3984.2023.0083

Acessibilidade / Reportar erro

Brasil

Español English

sumário « anterior atual seguinte »

Sumário

Artigo Original • Radiol Bras 57 • 2024 • https://doi.org/10.1590/0100-3984.2023.0083 copiar

Desempenho do ChatGPT nas questões da avaliação anual de residentes do Colégio Brasileiro de Radiologia

Autoria SCIMAGO INSTITUTIONS RANKINGS

Resumo

Objetivo:

Testar o desempenho do ChatGPT em questões de radiologia formuladas pelo Colégio Brasileiro de Radiologia (CBR), avaliando seus erros e acertos.

Materiais e Métodos:

165 questões da avaliação anual dos residentes do CBR (2018, 2019 e 2022) foram apresentadas ao ChatGPT. Elas foram divididas, para análise estatística, em questões que avaliavam habilidades cognitivas de ordem superior ou inferior e de acordo com a subespecialidade, o tipo da questão (descrição de um achado clínico ou sinal, manejo clínico de um doente, aplicação de um conceito, cálculo ou classificação dos achados descritos, associação entre doenças ou anatomia) e o ano da residência (R1, R2 ou R3).

Resultados:

O ChatGPT acertou 53,3% das questões (88/165). Houve diferença estatística entre o desempenho em questões de ordem cognitiva inferior (64,4%; 38/59) e superior (47,2%; 50/106) (p = 0,01). Houve maior índice de acertos em física (90,0%; 18/20) do que em questões clínicas (48,3%; 70/145) (p = 0,02). Não houve diferença significativa de desempenho entre subespecialidades ou ano de residência (p > 0,05).

Conclusão:

Mesmo sem treinamento dedicado a essa área, o ChatGPT apresenta desempenho razoável, mas ainda insuficiente para aprovação, em questões de radiologia formuladas pelo CBR.

Unitermos:
Inteligência artificial; Radiologia; Questões de prova; Diagnóstico por imagem

Característica da questão	Número de questões	Acertos n (%)	P
Tipo
Ordem inferior	59	38 (64,4)
Ordem superior	106	50 (47,2)
Descrição de achados	42	22 (52,4)	0,81^* * Teste exato de Fisher.
Manejo clínico	22	12 (54,5)	0,72^* * Teste exato de Fisher.
Aplicar conceito	57	38 (66,7)	0,67^* * Teste exato de Fisher.
Cálculo/classificação	8	3 (37,5)	0,92^* * Teste exato de Fisher.
Associar doenças	26	11 (42,3)	0,63^* * Teste exato de Fisher.
Anatomia	10	2 (20,0)	0,58^* * Teste exato de Fisher.
Tema
Física	20	18 (90,0)	0,02^* * Teste exato de Fisher.
Clínica	145	68 (46,8)	0,41^* * Teste exato de Fisher.
Abdome	20	13 (65,0)	0,62^† † Análise de variância.
Tórax	15	9 (60,0)	0,56^† † Análise de variância.
Neurorradiologia	15	5 (33,3)	0,76^† † Análise de variância.
Musculoesquelético	15	8 (53,3)	0.87^† † Análise de variância.
Mama	15	7 (46,7)	0,61^† † Análise de variância.
Meios de contraste	15	9 (60,0)	0,94^† † Análise de variância.
Ultrassonografia	15	3 (20,0)	0,78^† † Análise de variância.
Pediatria	15	10 (66,7)	0,93^† † Análise de variância.
Ginecologia e obstetrícia	10	2 (20,0)	0,72^† † Análise de variância.
Miscelânea	10	4 (40,0)	0,65^† † Análise de variância.
Total	165	88 (53,3)	0,01^* * Teste exato de Fisher.

Publicação do Colégio Brasileiro de Radiologia e Diagnóstico por Imagem Av. Paulista, 37 - 7º andar - conjunto 71, 01311-902 - São Paulo - SP, Tel.: +55 11 3372-4541, Fax: 3285-1690, Fax: +55 11 3285-1690 - São Paulo - SP - Brazil
E-mail: radiologiabrasileira@cbr.org.br

Acompanhe os números deste periódico no seu leitor de RSS

[1] Correspondência: Dr. Cleverson Alex Leitão. Universidade Federal do Paraná. Rua General Carneiro, 181, Alto da Glória. Curitiba, PR, Brasil, 80060-900. E-mail: cleverleitao@gmail.com