SciELO - Scientific Electronic Library Online

 
vol.28 issue67Global educational governance and the genesis of the socio-emotional skills testsEvaluation of Enem (2009 and 2011) quality with psychometric techniques author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Share


Estudos em Avaliação Educacional

Print version ISSN 0103-6831On-line version ISSN 1984-932X

Est. Aval. Educ. vol.28 no.67 São Paulo Jan./Apr. 2017  Epub Jan 10, 2017

https://doi.org//10.18222/eae.v0ix.3385 

Artigos

Contribuições ao estudo do Modelo de Crédito Parcial Generalizado

Contribuciones al estudio del Modelo de Crédito Parcial Generalizado

Contributions to the study of Generalized Partial Credit Model

Eduardo Vargas FerreiraI 

Caio Lucidius Naberezny AzevedoII 

IDepartamento de Estatística, Universidade Federal do Paraná, Curitiba, Paraná, Brasil, e.ferreira@ufpr.br

IIDepartamento de Estatística, Universidade Estadual de Campinas, Campinas, São Paulo, Brasil, cnaber@ime.unicamp.br


Resumo:

Este artigo aborda os mais importantes aspectos inferenciais do Modelo de Crédito Parcial Generalizado (MCPG), da Teoria da Resposta ao Item (TRI). É mostrado um estudo sobre uma das principais dificuldades encontradas no processo de estimação e inferência dos modelos da TRI, que é a falta de identificabilidade. Além disso, apresenta-se a interpretação dos parâmetros do modelo e da função de informação do item e do teste.

Palavras-chave: Teoria da Resposta ao Item; Modelos Politômicos; Modelo de Crédito Parcial Generalizado; Psicometria

Resumen:

Este artículo aborda los más importantes aspectos inferenciales del Modelo de Crédito Parcial Generalizado (MCPG), de la Teoría de la Respuesta al Ítem (TRI). Se presenta un estudio sobre una de las principales dificultades encontradas en el proceso de estimación e inferencia de los modelos de la TRI, que es la falta de identificabilidad. Por otra parte, se expone la interpretación de los parámetros del modelo y de la función de información del ítem y el test.

Palabras clave: Teoría de la Respuesta al Ítem; Modelos Politómicos; Modelo de Crédito Parcial Generalizado; Psicometría

Abstract:

This article covers the most important inferential aspects of the Generalized Partial Credit Model (GPCM) of the Item Response Theory (IRT). It presents a study on one of the main difficulties encountered in the process of estimation and inference of the IRT models, which is the lack of identifiability. In addition, it presents the interpretation of the model parameters and the information function of the item and the test.

Keywords: It em Response Theory; Polytomous Models; Generalized Partial Credit Model; Psychometrics

INTRODUÇÃO

É cada vez mais frequente o uso dos modelos da Teoria da Resposta ao Item (TRI) para estudar certas características de indivíduos, as quais, muitas vezes, são representadas por quantidades denominadas como traços latentes, que são características que não podem ser medidas diretamente, tais como nível de estresse, nível de depressão, proficiência em determinada área de conhecimento, entre outras. Em muitos instrumentos de medida, os itens (questões) que os compõem apresentam alternativas que pertencem a alguma escala gradual (ordinal). Por exemplo, num questionário de avaliação de um produto por parte de consumidores, as categorias de resposta podem variar de zero (ruim) a cinco (excelente), de modo discreto (MURAKI, 1992); ou, numa avaliação cognitiva, como no vestibular da Universidade Estadual de Campinas (Unicamp),1 são incluídas questões dissertativas, cujas respostas recebem escores que variam de zero (erro total) a quatro (acerto total), no conjunto {0,1,2,3,4}. Nessas situações, tem-se interesse em avaliar os traços latentes (dos indivíduos) envolvidos. Na primeira, seria o grau de qualidade do produto atribuído pelos consumidores, enquanto, na segunda, seria o conhecimento dos vestibulandos. Em ambos os casos, o Modelo de Crédito Parcial Generalizado (MCPG) poderia ser utilizado para analisar tais dados (MURAKI, 1992, 1997). O MCPG, pertencente à família dos modelos para as respostas politômicas graduais da Teoria de Resposta ao Item (TRI), considera as probabilidades de escolha para cada uma das categorias (MURAKI, 1997).

A literatura brasileira existente sobre o MCPG é escassa. Mesmo na literatura internacional, alguns pontos não têm sido estudados adequadamente, ainda que estes sejam de grande importância. Em parte, isso se deve a uma relativa dificuldade de interpretação dos parâmetros do modelo (ANDRADE; TAVARES; VALLE, 2000), como comentaremos adiante. Em face desse quadro, o presente trabalho tem por objetivo estudar, mais detalhadamente, alguns dos principais aspectos relacionados ao MCPG: interpretação dos parâmetros, principalmente por meio de análises gráficas da função de resposta à categoria do item (FRCI) que caracteriza tal modelo (ANDRADE; TAVARES; VALLE, 2000); avaliação de como mudanças nos parâmetros dos itens afetam a função de informação do item e do teste (MURAKI, 1993); e aspectos ligados à identificabilidade (tema este que por vezes é abordado de modo casual e inadequado). Salientamos que tais resultados são importantes para uma correta utilização de qualquer modelo, em particular do MCPG, bem como na escolha de um método de estimação apropriado.

MODELO DE CRÉDITO PARCIAL GENERALIZADO

O Modelo de Crédito Parcial Generalizado, formulado por Muraki (1992), pertence à família dos modelos de resposta ao item (MRI) para respostas politômicas graduais, sendo, portanto, apropriado na modelagem de itens cuja resposta está relacionada a algum tipo de escala gradual. Em outras palavras, o respondente ganha mais crédito (teria um maior valor para seu traço latente) à medida que sua resposta se aproxima da completa. A probabilidade de um indivíduo j, com traço latente θj, escolher a categoria k do item i tem por expressão:

em que: i = 1,2,..., I; j = 1,2,..., n e k = 1,2,..., mi; Yijk é igual a 1, se o indivíduo j escolhe a categoria (recebe o escore) k no item i e 0 em caso contrário; ai é o parâmetro associado à discriminação do i-ésimo item (seu valor também influencia na discriminação do item como um todo); bik = bi - dk está associado à dificuldade da categoria k do item i; dk é a dificuldade relativa da categoria k em comparação com as outras categorias; θj é o traço latente do j-ésimo indivíduo; ζi = (ai, bi1,..., bimi); D é um fator de escala, sendo que D = 1,7 é utilizado quando se deseja que a função logística - equação (1) - forneça resultados semelhantes aos da ogiva normal; Pijkj , ζi ) é chamada de Função de Resposta à Categoria do Item (FRCI).

Interpretação dos parâmetros

No MCPG, devido à complexidade de sua formulação matemática, a interpretação dos parâmetros dos itens, por meio da visualização (análise gráfica) das curvas características do item (CCI), se torna de extrema importância, mais ainda do que no caso dos modelos para respostas dicotômicas. Nesta subseção, avalia-se como os valores dos parâmetros dos itens afetam o comportamento das curvas (probabilidade de escolha) de cada categoria, bem como seus significados. Nos exemplos apresentados, consideraremos bi0 ≡ 0, i = 1, 2,…,I, por razões que explicaremos mais adiante.

Parâmetro ai

O parâmetro ai é denominado parâmetro de discriminação do item, embora, para o MCPG, afete o comportamento de cada categoria, em relação a esse aspecto. Para o modelo em estudo não são esperados valores de ai negativos, uma vez que isso indicaria que a probabilidade de atingir categorias “mais difíceis” diminuiria com o aumento do traço latente.

Como ilustrado pela Figura 1, fixando os parâmetros bik, quanto maior o valor do parâmetro ai mais as probabilidades de escolha de cada categoria distinguem-se entre si e maior é a distância entre as probabilidades de escolha de duas categorias para indivíduos com traços latentes diferentes. Note-se que a diferença entre as probabilidades de dois indivíduos com traços latentes -2 e 0, por exemplo, escolherem uma determinada categoria de resposta é maior no item 4 (que apresenta maior valor do parâmetro “a”) do que no item 1 (com menor valor do parâmetro “a”), ou seja, o item 4 é mais apropriado para discriminá-los. Assim, quanto maior é o valor do parâmetro “a” de um item, mais diferente é a FRCI entre suas categorias e maior é o seu poder de discriminação.

Figura 1: Representação gráfica do MCP G para quatro itens variando sua discriminação 

Parâmetro bik

Os parâmetros bik, k = 1,..., mi estão associados à dificuldade de cada categoria do item e apresentam valores na mesma escala do traço latente, com espaço paramétrico igual a R. O fato de o traço latente e os parâmetros de dificuldade aparecerem como uma diferença entre si - ver equação (1) - os coloca na mesma escala (há uma relação direta entre a natureza dos dois). Isso permite compreender melhor o que cada nível (categoria) está medindo em relação ao traço latente de interesse. Assim, se os diferentes níveis de dificuldade estiverem vinculados a uma definição de operações cognitivas ou do conteúdo da tarefa, as informações obtidas na avaliação, na maioria das vezes, se tornam qualitativamente mais refinadas (SANTOS et al., 2002).

A Figura 2 apresenta o gráfico da FRCI do MCPG de quatro itens com quatro categorias de resposta, em que se considerou a = 1 para todos os itens, enquanto que os parâmetros de dificuldade variam assim: bi = (bi1,bi2,...,bimi) com b1 = (0, -2,0,2), b2 = (0, -0.5,0,2), b3 = (0,0,0,2) e b4 = (0,1,0,2). Em alguns casos (em geral, quando os valores dos parâmetros de dificuldade estão ordenados de forma crescente, em função do valor da categoria), o intervalo (bik; bik + 1) representa o conjunto de valores de θj, no qual a probabilidade de escolha da categoria “k” é maior do que a das outras k - 1 categorias. Observando o item 1, nota-se que um indivíduo com traço latente entre -2, por exemplo, tem maior probabilidade de optar pela categoria 2. O mesmo indivíduo, no item 4, tem maior probabilidade de optar pela categoria 1.

Figura 2: Representação gráfica do MCP G para quatro itens variando os parâmetros de dificuldade 

Temos ainda que os parâmetros de dificuldade do item podem ser decompostos como bik = bi - dk, em que dk serão chamados de parâmetros de categoria (ou dik, quando assumimos parâmetros de categoria diferentes para cada item), e que eles correspondem aos pontos na escala do traço latente (θ) em que as curvas associadas à Pijk-1 e Pijk se interceptam. Essas duas funções igualam-se somente uma vez, o que pode ocorrer em qualquer ponto na escala de θ. Então, a partir da hipótese de que ai > 0, tome-se Zik (θ) = Dai (θ - bik), portanto: Se θ = bih, temos que:

Se θ > bih, temos que:

Pode ser considerado um raciocínio análogo, tal como o caso anterior, agora para θ < bih, em que:

Parâmetro θ

Como apontado por Andrade, Tavares e Valle (2000), teoricamente o traço latente pode assumir qualquer valor entre -∞ e ∞. Assim, é necessário estabelecer uma escala na qual ele será medido. Em geral, tal escala é definida fixando-se a média e a variância dos traços latentes, denotando-a por (valor da média, valor do desvio padrão). Ainda, os resultados obtidos em uma métrica podem ser transportados para outra, por meio de transformações lineares (ANDRADE; TAVARES; VALLE, 2000). Por exemplo, o Sistema de Avaliação da Educação Básica (Saeb)/Prova Brasil usa a métrica (250,50). Assim, na escala (0,1), um indivíduo com traço latente 1,5 está a 1,5 desvio padrão acima do traço latente médio, enquanto na escala (250,50) esse mesmo indivíduo teria um traço latente de 325, valor também correspondente a 1,5 desvio padrão acima do traço latente médio (ANDRADE; TAVARES; VALLE, 2000).

Função de Resposta do Item

Como definido em Muraki (1993), a função de resposta ao item para uma dada função de escore (pontuação) Tk = k, k=1,2...,mi é dada por:

Essa função pode ser vista como a regressão dos escores do item na escala do traço latente (LORD, 1980), apresentando um comportamento estritamente crescente em θj e Tk = k, o que pode ser visto a partir de:

A Função de Resposta do Item (FRI) de cada um dos itens analisados anteriormente (referentes à Figura 2) é apresentada na Figura 3, a qual representa a relação entre o escore esperado de um determinado item, em função do traço latente. Vale ressaltar que o item 1 mostra dois pontos de inflexão (como atestado na Figura 4).

Figura 3: Função de Resposta do Item 

Função de Informação do Item

A Função de Informação do Item (FII) permite avaliar o quanto o item apresenta de informação a respeito do traço latente, ou seja, a qualidade do item para, apropriadamente, estimar os traços latentes e distinguir indivíduos que possuem valores diferentes para estes. A informação do item para a classe de modelos de resposta ao item politômicos foi apresentada por Samejima (1974) e tem por expressão:

Para melhor entender o comportamento da função de informação do item, a Figura 4 apresenta a FII de cinco itens, com a1 = 1, b1 = (0, -2,4); a2 = 1, b2 = (0, -2,0); a3 = 1, b3 = (0, -2,-2); a4 = 1, b4 = (0, -2,-4); e a5 = 0,5, b5 = (0, -2,-4). A partir do item 1, nota-se que a FII para o MCPG não é, necessariamente, unimodal e, quanto maior for a distância entre dois parâmetros de dificuldade de categorias adjacentes, menor é a informação na faixa ao redor da mediana (lembremos que estamos considerando uma escala (0,1)) da distribuição de θ. Por outro lado, o item 2, entre todos os apresentados, é o mais apropriado quando se quer estimar o traço latente de indivíduos de uma população em que há grande concentração de indivíduos em torno da mediana. Além disso, a informação do item tende a ser maior em torno dos valores dos seus parâmetros de dificuldade.

Figura 4: Função de Informação do Item 

Função de Informação do Teste

A Função de Informação do Teste (FIT) é representada pela soma das informações de cada item:

A informação do teste está associada ao erro padrão relativo à estimativa do traço latente do j-ésimo indivíduo (nos casos da estimação por máxima verossimilhança e moda a posteriori), da seguinte forma:

Ou seja, quanto maior for a informação do teste, menor será o erro padrão associado à estimativa do traço latente.

IDENTIFICABILIDADE

Na TRI, o problema de falta de identificabilidade aparece com frequência, porém são escassos na literatura textos que viabilizem a compreensão de um tema que, no desenvolvimento inferencial, de acordo com Rivers (2003), “é por vezes abordado de modo casual e inadequado”. O autor afirma também que a identificabilidade, apesar de não ser suficiente, é condição necessária para garantir a consistência dos estimadores de máxima verossimilhança. Andrade, Tavares e Valle (2000) ladeiam a questão, destacando que a falta de identificabilidade ocorre porque diferentes valores dos parâmetros dos itens e/ou do traço latente podem produzir a mesma probabilidade de um indivíduo escolher certa categoria, o que inviabiliza o desenvolvimento de qualquer procedimento de utilização direta da verossimilhança.

De acordo com Matos (2008), a solução para a não identificabilidade depende basicamente do modelo em estudo e do método de estimação adotado. Na TRI, existe um tipo de falta de identificabilidade em função da invariância a transformações lineares, mais conhecido como um problema de indeterminação da escala de medida, que muitas vezes é solucionado estabelecendo-se uma métrica para os traços latentes (fixando-se sua média e seu desvio padrão) ou impondo restrições aos valores dos parâmetros dos itens.

Particularmente, no MCPG, devido à sua estrutura complexa, na maioria das vezes, é necessário restringir ambas as classes de parâmetros. A seguir são apresentadas algumas definições que serão úteis para a compreensão do texto e que podem ser vistas, por exemplo, em Matos (2008). Posteriormente, discutiremos como elas se encaixam nos aspectos de identificabilidade do MCPG.

Definição 1 (Parâmetros Observacionalmente Equivalentes). Dois pontos do espaço paramétrico ψ1, ψ2 ∈ θ são ditos observacionalmente equivalentes se Pψ1 = Pψ2. A igualdade Pψ1 = Pψ2 significa dizer que dois modelos probabilísticos são ponto a ponto iguais, ou seja, Pψ1(y) = Pψ2(y) para todo valor y.

Definição 2 (Parâmetro e Modelo Globalmente Identificável). Um ponto do espaço paramétrico ψ0 ∈ θ é dito identificável ou globalmente identificável se não existe outro ponto do espaço paramétrico observacionalmente equivalente a ψ0. Nesse caso, dizemos que o modelo probabilístico Pψ0 é globalmente identificável.

Como mencionado em “Interpretação dos parâmetros”, uma condição imprescindível para assegurar a identificabilidade do modelo é fixar um dos parâmetros de dificuldade de cada item, por exemplo, bi,0 = 0, i = 1,2,...,I. Do ponto de vista teórico, a estimação dos parâmetros dos itens e dos traços latentes dos indivíduos é dividida em três situações, nomeadamente:

  • θj desconhecido, ai e bik conhecidos;

  • θj conhecido, ai e bik desconhecidos;

  • todos desconhecidos.

Para cada um desses cenários, será feito um estudo de modo analítico, estabelecendo condições necessárias (e suficientes) para assegurar a identificabilidade do modelo, impondo restrições em uma classe de parâmetros ou em ambas, quando necessário.

θj desconhecido, ai e bik conhecidos

Na prática, esta situação ocorre quando os parâmetros dos itens já foram calibrados (estimados) e o que se pretende é estimar o traço latente dos indivíduos. Nesse caso, o modelo é globalmente identificável (Definição 2).

Demonstração. Considerem-se dois pontos do espaço paramétrico, θ1, θ2 ∈ θ, observacionalmente equivalentes (Definição 1), ou seja, Pijk1) = Pijk2). Será provado que θ1 = θ2:

Multiplicando ambos os lados por:

obtém-se:

Note-se que o lado direito da equação (2) é constante para todo k ∈ (1,...,m). Sendo assim, seja k1 e k2 ∈ (1,...,m) e tal que k1 < k2.

Para k = k1:

Para k = k2:

Igualando (3) e (4), passa-se a ter:

Como ai > 0 e k1 < k2, a equação (5) é verdadeira quando θ1 - θ2 = 0, ou seja, quando θ1 = θ2. Chega-se assim ao resultado de interesse. Portanto, em se querendo fazer inferência sobre os traços latentes, não é necessário restringir qualquer classe de parâmetros, pois uma métrica já fora definida, uma vez que os parâmetros dos itens são conhecidos, e o modelo está globalmente identificado.

θj conhecido, ai e bik desconhecidos

Agora, com θj conhecido, o MCPG é função apenas dos parâmetros ai e bik. Para itens com resposta dicotômica (duas categorias), ambos os parâmetros de discriminação e dificuldade podem ser estimados sem a necessidade de impor restrições. Nesse caso, d1 já estaria definido como zero. Porém, quando se tem mais de duas categorias, existe uma indeterminação entre os parâmetros de categoria e o de dificuldade, ou seja, o modelo não é identificável.

Demonstração. Para provar a falta de identificabilidade do modelo, é suficiente exibir um exemplo de dois conjuntos de parâmetros observacionalmente equivalentes (Definição 1). Para tal, considerem-se dois modelos probabilísticos Pijkj) e P'ijkj), análogos ponto a ponto, cujos parâmetros do item não são todos iguais, por conseguinte:

Multiplicando ambos os lados por

obtém-se:

Note-se que o lado direito da equação (6) é constante para todo k ∈ (1,...,m). Sendo assim, seja k1 e k2 ∈ (1,...,m) tal que k1 < k2.

Para k = k1:

Para k = k2:

Igualando-se o lado direito de (7) e (8), obtém-se a forma:

Como o lado direito da equação (9) é constante para todo

θj e k1 < k2, resulta que:

Assim, decompondo biv = bi - dv, seja b'i = bi - t e d'v = dv - t, com t ≠ 0. É fácil constatar que tais parâmetros são observacionalmente equivalentes, o que mostra, particularmente, que o modelo não é identificável, isto é:

Assim, no caso em que se conhece o traço latente dos indivíduos, a fim de garantir unicidade dos parâmetros dos itens, devem-se impor restrições lineares aos mesmos, por exemplo,

Ambos desconhecidos

No caso em que todos os parâmetros são desconhecidos, não há uma métrica definida e, portanto, deve-se estabelecê- -la. Porém, devido à complexidade do modelo, impor restrições somente aos parâmetros do item ou apenas aos traços latentes, isoladamente, não é suficiente, fazendo-se necessário impor restrições para ambas as classes. Com intuito de realizar a estimação dos parâmetros dos itens, sem a presença dos traços latentes, por exemplo, integrando- se a verossimilhança em relação a estes, é comum considerar para eles uma distribuição de probabilidade latente, e que os n indivíduos constituem uma amostra aleatória simples de uma população com essa distribuição. Com isso, em vez de se trabalhar com a verossimilhança completa, utiliza-se, numa primeira etapa, uma verossimilhança marginal (integrada), que possui as mesmas propriedades da verossimilhança genuína (CORDEIRO, 1992). Sendo assim, considere-se que g(θ|η) denota uma função densidade de probabilidade (fdp), duplamente diferenciável. Uma escolha comum para g(θ|η) consiste em:

Sob a verossimilhança marginal, o cenário mostra-se similar ao apresentado na subseção anterior, cujo desenvolvimento já foi mostrado. Dessa forma, no caso em que se desconhecem todos os parâmetros do modelo, é condição suficiente impor restrições tanto aos traços latentes quanto aos parâmetros dos itens. Também é possível restringir a soma dos valores observados e dos valores observados ao quadrado dos traços latentes, embora essa abordagem seja menos frequente.

CONCLUSÃO

No presente trabalho, foi apresentada uma discussão sobre diversos aspectos de interesse do MCPG. A fim de melhor entender o significado dos parâmetros dos itens, avaliou-se, graficamente, como mudanças nos valores dos parâmetros influenciam o comportamento da CCI relacionada a cada categoria, bem como a função de informação do item e do teste. A partir das discussões sobre falta de identificabilidade do modelo, foi possível observar, de forma detalhada, as causas assim como as melhores estratégias para eliminá-la, seja restringindo os parâmetros dos itens, os traços latentes ou ambos, ampliando os conhecimentos sobre um assunto ainda pouco discutido na literatura estatística.

AGRADECIMENTOS

Os autores agradecem ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pela bolsa concedida por meio do Programa Institucional de Bolsas de Iniciação Científica/Universidade Estadual de Campinas (Pibic/Unicamp) ao primeiro autor, sob orientação do segundo, bem como ao parecerista anônimo pelos comentários que contribuíram para melhorar substancialmente o artigo.

Referências

ANDRADE, D. F.; TAVARES, H. R.; VALLE, R. C. Teoria da Resposta ao Item: conceitos e aplicações. In: SIMPÓSIO NACIONAL DE PROBABILIDADE E ESTATÍSTICA (SINAPE), 14., 2000. Caxambu. Anais... São Paulo: ABE, 2000. [ Links ]

CORDEIRO, G. M. Introdução à teoria da verossimilhança. Rio de Janeiro: ABE, 1992 [ Links ]

MATOS, G. S. Modelos multidimensionais da TRI com distribuições assimétricas para os traços latentes. 2008. 134 f. Tese (Doutorado em Ciência) - Instituto de Matemática e Estatística, Universidade de São Paulo - USP, São Paulo, 2008. [ Links ]

MURAKI, E. A generalized partial credit model: application of an EM algorithm. Applied Psychological Measurement, v. 16, n. 2, p. 159-176, 1992. [ Links ]

MURAKI, E. Information function of the generalized partial credit model. Applied Psychological Measurement, v. 17, n. 4, p. 351-363, 1993. [ Links ]

MURAKI, E. A Generalized Partial Credit Model. In: VAN DER LINDEN, W. J. et al. (Ed.). Handbook of modern Item Response Theory. 1. ed. New York: Springer-Verlag, 1997. [ Links ]

RIVERS, D. Identification of multidimensional spatial voting models. Stanford: Department of Political Science, Stanford University, 2003. Mimeografado. [ Links ]

SAMEJIMA, F. Normal ogive model on the continuous response level in the multidimensional latent space. Psychometrika, n. 39, p. 111-121, 1974. [ Links ]

SANTOS, A. A. A. dos; PRIMI, R.; TAXA, F. O. S.; VENDRAMINI, C. M. M. O teste de cloze na avaliação da compreensão em leitura. Psicologia: Reflexão e Crítica, v. 15, n. 3, p. 549-560, 2002 [ Links ]

1Disponível em: <http://www.comvest.unicamp.br/>.

Recebido: Junho de 2015; Aceito: Outubro de 2016

Creative Commons License Este é um artigo publicado em acesso aberto sob uma licença Creative Commons