Avaliação do Teste do Progresso de uma faculdade de Medicina pelos pressupostos da Taxonomia SOLO

Resende, Pedro Paulo Trindade; Pereira, Alexandre de Araújo; Peixoto, José Maria; Resende, Pedro Paulo Trindade; Pereira, Alexandre de Araújo; Peixoto, José Maria

doi:10.1590/1981-5271v49.1-2023-0262

Serviços Personalizados

Journal

Artigo

Mais
Mais

Permalink

Revista Brasileira de Educação Médica

versão impressa ISSN 0100-5502versão On-line ISSN 1981-5271

Rev. Bras. Educ. Med. vol.49 no.1 Rio de Janeiro 2025 Epub 16-Mar-2025

https://doi.org/10.1590/1981-5271v49.1-2023-0262

ARTIGO ORIGINAL

Avaliação do Teste do Progresso de uma faculdade de Medicina pelos pressupostos da Taxonomia SOLO

Pedro Paulo Trindade Resende¹, elaboração do projeto de pesquisa, revisão bibliográfica, análise dos dados, discussão dos resultados, produção e revisão do manuscrito
http://orcid.org/0000-0002-8683-1571

Alexandre de Araújo Pereira², elaboração do projeto de pesquisa, análise dos dados, discussão dos resultados, produção e revisão do manuscrito
http://orcid.org/0000-0002-4166-9312

José Maria Peixoto², elaboração do projeto de pesquisa, discussão dos resultados, produção e revisão do manuscrito
http://orcid.org/0000-0002-2684-0142

^¹ Universidade Federal de São João del-Rei, São João Del Rei, Minas Gerais, Brasil.

^² Universidade José do Rosário Velano, Belo Horizonte, Minas Gerais, Brasil.

RESUMO

Introdução:

A capacitação de futuros egressos das faculdades de Medicina para uma prática assistencial responsável e qualificada de atenção à saúde é um desafio. O objetivo é que estejam aptos para a resolução de problemas que demandem habilidades cognitivas de ordem superior. Sendo assim, a avaliação da aquisição de tais competências se torna muito importante. Um método de avaliação que vem ganhando atenção no ensino médico é o Teste do Progresso (TP). Teorias cognitivas têm trazido progresso em pesquisas educacionais relativas aos processos de avaliação. Utilizamos no nosso estudo a Taxonomia Structure of Observing Learning Outcome (SOLO) para avaliar e categorizar os itens do TP aplicado em uma faculdade de Medicina. A Taxonomia SOLO (TS) possibilita a análise cognitiva necessária para a realização de determinadas tarefas, permitindo uma observação integral da compreensão do entendimento do aluno. Utilizamos também no nosso estudo a Teoria Clássica dos Testes (TCT) e calculamos para cada item de múltipla escolha (IME) do TP o índice de dificuldade (IDF) e o índice de discriminação (ID), e os correlacionamos com a classificação SOLO.

Objetivo:

Este estudo teve como objetivo avaliar características do TP aplicado em uma faculdade privada de Medicina, analisando seus itens pelos pressupostos da TS e correlacionando-os com a TCT.

Método:

Trata-se de um estudo descritivo, de abordagem quantitativa e qualitativa. De acordo com os princípios da TS, foram realizadas a análise e a caracterização dos itens da prova de um TP aplicado em uma faculdade privada de Medicina e a correlação com o IDF e o ID.

Resultado:

Verificamos um equilíbrio entre a aprendizagem superficial (AS) e a aprendizagem profunda (AP) no total de itens e uma relação direta entre os níveis de AP e IME compostos por casos clínicos. Não verificamos diferença estatisticamente significativa entre as categorias SOLO quanto às médias do IDF e do ID.

Conclusão:

A análise das atividades avaliativas não deve ser restringida às propriedades psicométricas. Ferramentas taxonômicas, como a TS, podem auxiliar de maneira significativa a realização dessas atividades, de modo a conciliar as avaliações ao currículo, possibilitar a realização de provas adequadas ao nível de aprendizagem desejável e favorecer a progressividade do ensino.

Palavras-chave: Taxonomia; Educação Médica; Desempenho acadêmico; Avaliação Educacional

ABSTRACT

Introduction:

the training of future graduates from medical schools for responsible and qualified health care practice is a significant challenge. The goal is for them to be equipped to solve problems that require higher-order cognitive skills. Thus, evaluating the acquisition of such competencies becomes crucial. One assessment method that has been gaining attention in medical education is the Progress Test (PT). Cognitive theories have advanced educational research related to assessment processes. In our study, we used the Structure of Observing Learning Outcome (SOLO) taxonomy to evaluate and categorize the items of the PT applied at a medical school. The SOLO taxonomy (ST) allows for the necessary cognitive analysis required for performing specific tasks, enabling a comprehensive observation of the student’s understanding. We also applied the Classical Test Theory (CTT) in our study, calculating the difficulty index (DFI) and discrimination index (DI) for each multiple-choice item (MCI) of the PT and correlating them with the SOLO classification.

Objective:

the objective of this study is to evaluate the characteristics of the PT applied in a private medical school, analyzing its items based on the assumptions of ST and correlating them with CTT.

Materials and Methods:

this is a descriptive study with a quantitative and qualitative approach. According to the principles of ST, we conducted the analysis and characterization of the items from a PT applied in a private medical school and correlated them with the DFI and DI.

Results:

we found a balance between surface learning (SL) and deep learning (DL) across the total items, as well as a direct relationship between the levels of DL and MCIs consisting of clinical cases. We did not find statistically significant differences between the SOLO categories regarding the means of DFI and DI.

Conclusion: t

he analysis of assessment activities should not be restricted to psychometric properties. Taxonomic tools, such as the ST, can significantly aid in conducting these activities, aligning assessments with the curriculum and facilitating the creation of tests appropriate for the desired level of learning, thereby promoting effective teaching progression.

Keywords: Taxonomy; Education, Medical; Academic Performance; Educational Measurement

INTRODUÇÃO

O propósito das escolas de Medicina é preparar futuros egressos para uma prática assistencial responsável e qualificada. Nesse sentido, o processo de avaliação da aprendizagem é essencial, pois possibilita observar os resultados das intervenções educacionais¹. O procedimento de avaliação é uma importante ferramenta no arsenal do ensino, sendo um instrumento impulsionador da aprendizagem²^)-(⁴. No entanto, comumente os métodos de avaliação utilizados não são planejados para identificar a evolução das habilidades cognitivas dos estudantes e, em geral, avaliam a aquisição dos conteúdos estudados, muitas vezes cobrando uma simples memorização.

Para que possa contribuir para o processo de aprendizagem, a avaliação deve ser planejada de forma a espelhar os objetivos a serem alcançados, nos níveis cognitivos, afetivos e psicomotores, e permitir que tanto os docentes como os estudantes possam identificar seus progressos e pontos de melhorias⁵.

Um método de avaliação que vem ganhando atenção nas escolas médicas é o Teste do Progresso (TP), que avalia o desempenho cognitivo longitudinal dos estudantes⁶. O TP é aplicado semestralmente ou anualmente a todos os discentes do curso, de forma simultânea, sendo constituído de itens de múltipla escolha (IME). O conteúdo do TP compreende toda a matriz curricular, sendo relacionado aos seus objetivos finais e baseado nas Diretrizes Curriculares Nacionais do curso de graduação em Medicina⁷^),(⁸.

O TP deve exigir dos alunos muito além da memorização. Os IME são elaborados por docentes da própria instituição ou de consórcios formados com esse propósito, e espera-se um ganho cognitivo gradativo com o passar dos períodos⁸.

Pela importância que o TP vem ganhando na educação médica, é relevante avaliar se a qualidade de seus itens atende às premissas de um bom processo avaliativo. Isso inclui verificar se os IME do TP apresentam:

Capacidade discriminativa: Os itens devem ser capazes de distinguir entre estudantes com diferentes níveis de conhecimento e habilidades.
Equilíbrio quantitativo em relação à dificuldade dos itens: Deve haver uma distribuição balanceada de itens com diferentes graus de dificuldade, de modo a garantir que o teste seja desafiador o suficiente para todos os alunos, sem ser excessivamente fácil ou difícil.
Complexidade cognitiva apropriada: Os itens devem exigir não apenas memorização, mas também capacidade de fazer relações, inferências e generalizações, refletindo as demandas cognitivas da prática médica.

É importante distinguir entre dificuldade e complexidade em itens avaliativos. A dificuldade se relaciona a fatores que oferecem obstáculos para a resolução de um problema, enquanto a complexidade envolve as habilidades cognitivas necessárias para resolvê-lo. A dificuldade é geralmente avaliada estatisticamente, enquanto a complexidade é avaliada qualitativamente, muitas vezes utilizando taxonomias educacionais⁹^),(¹⁰. Portanto, um item pode apresentar elevado índice de dificuldade e baixa complexidade ou vice-versa.

Dentre os métodos estatísticos para a avaliação psicométrica, a Teoria Clássica dos Testes (TCT) permite avaliar o índice de dificuldade (IDF) e o índice de discriminação (ID) dos itens que compõem o teste. O IDF é encontrado calculando a razão entre o número de alunos que responderam corretamente e o número total de alunos submetidos ao item. Esse índice varia de 0 a 1. A Tabela 1 apresenta uma classificação dos itens de uma prova em relação ao IDF e o percentual esperado de distribuição em uma avaliação¹¹.

Tabela 1 Critérios de distribuição e classificação do grau de dificuldade do item pela TCT.

Quantitativo ideal de itens em uma avaliação (% esperado)	Índice de dificuldade do item	Classificação do item em relação ao índice de dificuldade
10%	Superior a 0,9	Muito fáceis
20%	De 0,7 a 0,9	Fáceis
40%	De 0,3 a 0,7	Medianos
20%	De 0,1 a 0,3	Difíceis
10%	Até 0,1	Muito difíceis

Fonte: Vilarinho¹¹ (p. 27).

O ID é calculado pela diferença entre o percentual de acerto de um determinado item dos estudantes que tiveram melhor desempenho no teste e o percentual dos que tiveram pior desempenho. Para obter esse cálculo, os candidatos serão alocados em três grupos: o grupo superior (27% das maiores pontuações), o grupo inferior (27% das menores pontuações) e o grupo intermediário com os demais 46% dos candidatos¹¹. A Tabela 2 apresenta os critérios dos valores do ID e a classificação do item de acordo com seu poder de discriminação.

Tabela 2 Valores do poder de discriminação e classificação do item pela TCT.

Valores	Classificação
Discriminação < 0,20	Item deficiente, deve ser rejeitado
0,20 ≤ Discriminação < 0,30	Item marginal, sujeito a reelaboração
0,30 ≤ Discriminação < 0,40	Item bom, mas sujeito a aprimoramento
Discriminação ≥ 0,40	Item bom

Fonte: Vilarinho¹¹ (p. 28).

Em relação à complexidade dos itens, eles podem ser avaliados por meio das taxonomias educacionais, que são sistemas de classificação que possibilitam a categorização dos níveis de aprendizagem atingidos pelos estudantes, sendo útil para o sistema de avaliação e planejamento dos objetivos educacionais¹². Dentre as taxonomias educacionais existentes, a Taxonomia Structure of Observing Learning Outcome (SOLO) foi concebida com a ideia de que os indivíduos aprendem diferentes conteúdos em estágios de complexidade ascendentes¹³^),(¹⁴.

Biggs et al.¹⁵ propuseram uma categorização dos estágios de entendimento de conteúdo, denominados “modos de pensamento”, baseados nos estágios piagetianos. Esse sistema identifica diferentes graus de formalização do pensamento, permitindo avaliar a qualidade da aprendizagem. A Taxonomia SOLO (TS), derivada desses conceitos, classifica a estrutura da aprendizagem demonstrada em cinco níveis progressivos de complexidade cognitiva¹⁵ (Figura 1):

Pré-estrutural (SOLO 1): respostas inadequadas, informações irrelevantes ou incoerentes.
Uniestrutural (SOLO 2): respostas direcionadas a um único elemento da tarefa e, portanto, inconsistentes.
Multiestrutural (SOLO 3): respostas identificam mais de um elemento da tarefa, mas não há integração das informações, levando a incoerências.
Relacional (SOLO 4): diversas informações são identificadas e são estabelecidas relações de forma coerente, havendo um entendimento do todo, não havendo inconsistências.
Abstrato estendido (SOLO 5): resposta vai além dos elementos do item, partindo para abstração e generalização.

Fonte: Elaborado pelos autores a partir de BIGGS, John. Calidad del aprendizaje universitario. Narcea, 2006. p. 71¹⁶.

Figura 1 Taxonomia SOLO.

Estudos identificaram duas formas principais de aprendizagem: uma denominada superficial e a outra profunda. A aprendizagem superficial (AS) é caracterizada pela reprodução do conteúdo sem conexões ou reflexões, enquanto a aprendizagem profunda (AP) envolve um entendimento intrínseco e reflexivo, exigindo processos cognitivos elaborados¹⁵. A AS é formada pelos níveis SOLO 2 e SOLO 3, e a AP, pelos níveis SOLO 4 e SOLO 5. A AS se baseia na retenção de detalhes concretos por meio de memorização. A AP é mais complexa, pois requerer relações de informações, de modo a qualificar o indivíduo para compreender mecanismos e princípios e realizar generalizações ou teorizações¹⁵^),(¹⁷.

Ao longo da formação, os estudantes progridem de forma ascendente, de uma compreensão concreta para abstrata, desenvolvendo habilidades de estabelecer relações e fazer inferências, refletindo um aumento na capacidade de manejar informações de forma consistente e realizar generalizações. Essa evolução ascendente do processo cognitivo dos estudantes pode ser categorizada como ciclos de aprendizagem, que representam a forma como o discente compreende e opera o conteúdo estudado, do modo mais concreto ao mais abstrato¹⁸.

Pelos motivos expostos, o objetivo do presente estudo foi analisar as características psicométricas de uma avaliação do TP pela TCT, em relação ao IDF e ao ID obtidos, além de categorizar a complexidade cognitivas de seus itens pelos pressupostos da TS. A TS foi selecionada para este estudo devido à sua capacidade de classificar a complexidade da estrutura da aprendizagem demonstrada pelos estudantes em uma tarefa específica, identificando os processos de pensamento envolvidos, e pela possibilidade de diferenciar a AS da AP¹⁹^),(²⁰.

MATERIAIS E MÉTODO

Trata-se de um estudo descritivo, de abordagem quantitativa e qualitativa. Analisamos o TP aplicado, no primeiro semestre do ano de 2022, a todos os alunos, do primeiro ao 12º período, do curso de Medicina da Universidade Professor Edson Antônio Velano (Unifenas) - câmpus de Belo Horizonte (TPU2022-1), de forma simultânea, contendo 120 IME. O conteúdo foi dividido nas áreas do conhecimento: cirurgia, clínica médica, ginecologia-obstetrícia, pediatria e saúde coletiva, com 24 itens para cada área.

A prova do TPU2022-1 foi baseada na matriz de prova do TEP MINAS 2019, que foi elaborada pela equipe do Consórcio Mineiro de Escolas Médicas para o Teste do Progresso (TEP MINAS 1). Fazem parte do TEP MINAS 1 oito escolas médicas do estado de Minas Gerais, entre entidades públicas e privadas.

As encomendas (guia para elaboração das questões) foram enviadas aos professores das instituições de acordo com a sua área de atuação. Quando entregues, as questões foram revisadas, e realizaram-se as correções necessárias.

Os IME do TPU2022-1 foram avaliados por meio da TCT e categorizados pelos critérios da TS. A categorização dos IME pela TS foi realizada por meio de uma adaptação do modelo de classificação da complexidade dos itens de uma avaliação proposto por Mário Ceia²¹. Por esse modelo, o item de uma avaliação é analisado a partir da reposta esperada para a questão, considerando três parâmetros: quantidade de conhecimento necessário para sua resolução, operações cognitivas envolvidas na solução do problema e complexidade da resposta solicitada. O Quadro 1 apresenta o sistema de categorização proposto para este estudo, que foi adaptado dos trabalhos de Ceia²¹ e Pereira¹⁰.

A partir das informações do Quadro 1, elaborou-se a Ficha de Categorização do Item - FCI (Quadro 2), em que, para cada item do TPU2022-1, transcreveram-se o enunciado, as alternativas e o gabarito da questão. Ainda constam na FCI espaços para análise do conteúdo do item e dos procedimentos cognitivos necessários para sua resolução, e, por fim, um espaço para sua categorização pela TS. Uma lista de verbos frequentemente associada a cada categoria SOLO foi anexada à FCI para que os avaliadores pudessem consultar e melhor ajustar seus pareceres.

Quadro 1 Sistema de categorização dos itens do TPU2022-1.

Categoria SOLO da questão	Exemplos de verbos de comando e sua relação com as categorias SOLO	Conhecimento abordado no item		Procedimentos cognitivos envolvidos para resolução do item
Categoria SOLO da questão		Número de tópicos utilizados	Relação entre os tópicos	Procedimentos cognitivos envolvidos para resolução do item
Abstrato (SOLO 5)	Discutir, hipotetizar, avaliar, raciocinar, estimar, criticar, interpretar, prever, refletir, programar, julgar, generalizar, implementar.	Dois ou mais tópicos.	Necessita de associação entres os tópicos.	Indução e/ou dedução; exige identificação de informações relevantes não comumente discutidas no curso médico, elaboração de hipóteses e generalizações.
Relacional (SOLO 4)	Explicar, integrar, referir, analisar, comparar, interpretar, construir, planejar, resumir, relacionar, argumentar.		Necessita de associação entres os tópicos.	Indução e/ou dedução; exige identificação de informações relevantes frequentemente discutidas no curso médico.
Multiestrutural (SOLO 3)	Descrever, executar, resolver, aplicar, combinar, completar, classificar, enumerar.		Utilizados isoladamente.	Indução e/ou dedução; exige identificação de informações relevantes frequentemente discutidas no curso médico.
Uniestrutural (SOLO 2)	Identificar, decidir, organizar, reproduzir, eleger, encontrar, reconhecer, contar, buscar, parafrasear.	Um único tópico.	Não se aplica.	Indução e/ou dedução; exige identificação de informação relevante frequentemente discutida no curso médico.

Fonte: Adaptado de Ceia²¹ e Pereira¹⁰.

Quadro 2 Ficha de Categorização do Item.

A seguir você encontrará a transcrição da questão de nº ...... do Teste do Progresso da Unifenas-BH do ano de 20......... Leia o enunciado da questão e avalie a resposta assinalada como correta. Partindo da resposta correta, analise os conteúdos e os procedimentos cognitivos exigidos para a resolução da questão, considerando o sistema de categorização dos itens apresentado a você. Ao final classifique a complexidade da questão pela Taxonomia SOLO.

Enunciado do item:

Alternativas:

Gabarito da questão: ............

Análise de conteúdo:

Análise de procedimentos:

Categoria SOLO da questão: ( ) SOLO 2 ( ) SOLO 3 ( ) SOLO 4 ( ) SOLO 5

Fonte: Elaborado pelos autores.

Participaram da categorização dos IME dois professores médicos, doutores, que receberam treinamento sobre os pressupostos da TS para a categorização de IME, além do pesquisador principal. Foram selecionados 33,33% dos itens do TPU2022-1, que correspondem a 40 itens, utilizando uma amostragem probabilística sistemática para que os três avaliadores realizassem suas análises com o intuito de identificar algum viés de categorização. Cada avaliador recebeu os itens selecionados e, após análise individual, preencheu a FCI. As análises dos avaliadores foram confrontadas, e verificou-se uma alta taxa de concordância: 95%. Ajustes foram realizados por consenso, permitindo uma calibração da categorização por parte do pesquisador principal. Os demais itens foram analisados e classificados somente pelo pesquisador principal.

Todos os itens do TPU2022-1 foram classificados de acordo com os princípios da TS, em quatro níveis de complexidade cognitivas: uniestrutural, multiestrutural, relacional e abstrato estendido. O nível pré-estrutural não foi incluído, uma vez que o propósito era analisar os IME do TP em relação à complexidade cognitiva exigida para sua resolução; portanto, não eram esperados itens com essa categorização. Após categorização, os itens foram subdivididos em duas categorias de aprendizagem: superficial (SOLO 2 e 3) e profunda (SOLO 4 e 5).

Os IME foram também submetidos à análise psicométrica pela TCT, em que se calcularam para cada item: o IDF e o ID. Como o TP é aplicado a estudantes com diferentes ciclos de aprendizagem, para a análise pela TCT consideraram-se como referência as provas dos alunos do último ano do curso, uma vez que se trata de uma amostra representativa de discentes que integralizaram 83,33% da matriz curricular.

Com o objetivo de investigar se houve diferença significativa nas médias das medidas dos parâmetros IDF e ID quanto aos níveis do SOLO, a análise de variância com um fator (oneway) foi aplicada aos dados. O Teste de Igualdade de Variância de Levene foi utilizado para investigar se as variâncias entre as categorias eram estatisticamente diferentes. Além disso, calculou-se o tamanho de efeito (“eta parcial ao quadrado”). Para investigar se ocorreu diferença significativa nas médias das medidas dos parâmetros IDF e ID quanto às categorias SOLO que representam a AS e a AP (2 ou 3 × 4), o teste t de Student para amostras independentes foi aplicado aos dados. O Teste de Igualdade de Variância de Levene foi novamente utilizado para investigar se as variâncias entre as categorias eram estatisticamente diferentes. Além disso, calculou-se o tamanho de efeito (d de Cohen). Os resultados foram considerados significativos para uma probabilidade de significância inferior a 5%, com pelo menos 95% de confiança nas conclusões apresentadas.

O presente estudo foi aprovado pelo Comitê de Ética em Pesquisa da Unifenas, sob o CAAE nº 56009222.9.0000.5143, Parecer nº 5.379.183, solicitou-se a dispensa do Termo de Consentimento Livre e Esclarecido, e encaminharam-se o Termo de Compromisso de Utilização de Dados e o Termo de Anuência.

RESULTADOS

Encontramos um equilíbrio entre a AS e a AP nos itens do TPU2022-1. Cerca de 41% foram classificados como AS, e 59,2% como AP, como mostra a Tabela 3. Quando analisamos por áreas específicas do conhecimento, constatamos esse equilíbrio nas áreas de cirurgia, ginecologia-obstetrícia e pediatria. Nas áreas de clínica médica e saúde coletiva, não verificamos equilíbrio entre a AS e a AP. Em clínica médica, verificamos que 87,5% dos itens analisados estavam relacionados à AP e 12,5% à AS. Já na área de saúde coletiva, constatamos que cerca de 83,3% dos itens relacionavam-se à AS e 16,7% à AP. A Tabela 3 divide os itens do TPU2022-1 entre AS e AP.

Tabela 3 Distribuição dos itens do TPU2022-1 entre aprendizagem superficial e aprendizagem profunda.

Área/SOLO	Aprendizagem superficial	Aprendizagem profunda
Cirurgia	7 (29,2%)	17 (70,8%)
Clínica médica	3 (12,5%)	21 (87,5%)
Ginecologia-obstetrícia	10 (41,7%)	14 (58,3%)
Pediatria	9 (37,5%)	15 (62,5%)
Saúde coletiva	20 (83,3%)	4 (16,7%)
Total	49 (40,8%)	71 (59,2%)