SciELO - Scientific Electronic Library Online

 
vol.29 número71Avaliação educacional: concepções e embates teóricos índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Compartilhar


Estudos em Avaliação Educacional

versão impressa ISSN 0103-6831versão On-line ISSN 1984-932X

Est. Aval. Educ. vol.29 no.71 São Paulo ago. 2018

https://doi.org/18222/eae.v29i71.4973 

ARTIGOS

Estudo de fatores associados através de regressão quantílica hierárquica

Estudio de factores asociados a través de regresión cuantílica jerárquica

Pedro Alberto BarbettaI 

Dalton Francisco de AndradeII 

Héliton Ribeiro TavaresIII 

IUniversidade Federal de Santa Catarina (UFSC), Florianópolis, SC, Brasil; http://orcid.org/0000-0002-5359-0134; pedro.barbetta@ufsc.br

IIUniversidade Federal de Santa Catarina (UFSC), Florianópolis, SC, Brasil; http://orcid.org/0000-0002-4403-980X; dalton.andrade@ufsc.br

IIIUniversidade Federal do Pará(UFPA), Belém, PA, Brasil; http://orcid.org/0000-0003-1725-3664; heliton@ufpa.br


RESUMO

Este trabalho apresenta uma abordagem não usual em estudo de fatores associados ao desempenho escolar, utilizando regressões quantílicas hierárquicas. Enquanto na abordagem tradicional tem-sepor objetivo identificar fatores importantes com base nos indivíduos da faixa intermediária de proficiência, nesta aqui apresentada procura-se detectar efeitos nos quantis da distribuição de proficiência, permitindo identificar como determinado fator influencia estudantes de baixa, intermediária e alta proficiências. São realizadas a descrição da metodologia adotada e uma aplicação com os dados das provas de Língua Portuguesa e Matemática do 8º ano do ensino fundamental doestado do Pará, em 2016.

PALAVRAS-CHAVE: Avaliação da Educação; Fatores Associados; Regressão Quantílica Hierárquica; Rendimento Escolar

RESUMEN

Este trabajo presenta un abordaje no usual en el estudio de factores asociados aldesempeño escolar, haciendo uso de regresiones cuantílicas jerárquicas. Mientrasque en el enfoque tradicional se tiene el objetivo de identificar factores importantesen base a los individuos del rango intermedio de competencia, en este abordajese pretende detectar efectos en los cuantiles de la distribución de competencia, lo que permite identificar cómo determinado factor influye en los estudiantes decompetencia baja, intermedia y alta. Se describe la metodología adoptada y unaaplicación con los datos de las pruebas de Lengua Portuguesa y Matemáticas del 8ºaño de la Educación Básica del estado de Pará, en el 2016.

PALABRAS CLAVE: Evaluación de la Educación; Factores Asociados; Regresión Cuantílica Jerárquica; Rendimiento Escolar

ABSTRACT

In this paper, we present an unusual approach to factors associated with academic achievement since we use hierarchical quantile regressions. While the traditional approach aims to identify important factors based on individuals with an intermediate performance, our approach aims to detect the effects on performance distribution quantiles, thus allowing to identify how a certain factor can affect poor-,intermediate-, and high-performing pupils. We describe the methodology and use it with data from Portuguese and Mathematics tests of the 8th grade of primary education in the Brazilian state of Pará, in 2016.

KEYWORDS: Educational Assessment; Associated Factors; Hierarchical Quantile Regression; Academic Achievement

INTRODUÇÃO

O conhecimento dos principais fatores que afetam o desempenho escolar auxilia os gestores e os professores a orientarem suas ações de forma mais objetiva e pragmática, melhorando o desempenho escolar dos estudantes e diminuindo as diference entre eles. Muitos fatores não dependem dos professores ou dos gestores, como o nível socioeconômico familiar, mas outros estão intimamente ligados a gestão e ao trabalho em sala de aula, como passar, cobrar e corrigir os deveres escolares dos estudantes. Identificar os fatores mais influentes no desempenho escolar e a forma que eles interagem com diferentes níveis de desempenho tem sido alvo de várias pesquisas cientificas, sendo que a base das informações vem com as avaliações de larga escala.

Ao longo das últimas décadas no Brasil, nota-se que a avaliação em larga escala vem se consolidando como um instrumento das políticas públicas em educação, em seus diferentes âmbitos de gestão, seja ele em nível federal, estadual ou municipal. No entanto, ainda se observam inúmeros desafios quanto ao uso efetivo dessas avaliações na formulação, reformulação e no monitoramento de ações, projetos e programas educacionais, e, notadamente, no que diz respeito ao trabalho no interior das unidades escolares. (GIMENES, 2015, p. 254)

Nos estudos de fatores associados ao desempenho escolar, seja nos níveis fundamental, médio ou superior, a metodologia de modelos hierárquicos se destaca, já que existem fatores associados ao estudante e fatores relacionados à escola onde ele estuda, ou seja, há um nível de hierarquia primário - os estudantes - e um nível agregado - as escolas (ALVES; SOARES, 2008; ANDRADE; SOARES, 2008; LAROS; MARCIANO; ANDRADE, 2010; NASCIMENTO, 2012; MORICONI; NASCIMENTO, 2014; PONTES; SOARES, 2016). Como o desempenho de um estudante numa avaliação de larga escala é, geralmente, medido por uma escala contínua, a maioria dos estudos usa modelos hierárquicos lineares.

Os modelos lineares hierárquicos podem ser considerados uma extensão da regressão linear múltipla para acomodar uma estrutura hierárquica, como é o caso dos estudantes que estão agrupados em escolas. Nesses modelos, procura-se avaliar a parcela do desempenho do estudante devida a cada fator associado ao estudante (nível socioeconômico familiar, percepção do estudante quanto ao clima escolar, necessidade de o estudante fazer trabalhos domésticos, etc.) e cada fator associado à escola (infraestrutura, localização, dependência administrativa, etc.).

Um dos principais objetivos do estudo de fatores associados está na avaliação da influência da escola no desempenho cognitivo de seus alunos, conhecido como efeito escola (ALVES; SOARES, 2013; ANDRADE; SOARES, 2008). Esse efeito é obtido com a retirada da influência dos fatores extraescolares, como o nível socioeconômico e ambiente da região da escola, resultando na parcela relativa ao ambiente escolar propriamente dito, o qual pode ser aprimorado por uma boa gestão escolar.

A questão que se coloca é que tradicionalmente os modelos relacionam o valor médio do desempenho dos estudantes com os diversos fatores extra e intraescolares. Mas muitos desses fatores podem afetar diferentemente estudantes de baixo e de alto desempenho. Nas políticas educacionais que buscam melhorar o aprendizado de crianças com maiores dificuldades na escola, há interesse em encontrar os fatores intraescolares com maior efeito em crianças com baixo desempenho.

Este trabalho propõe avaliar o efeito dos diferentes fatores associados não só na média de proficiência dos estudantes, mas também em diversos quantis (ou percentis) da distribuição das proficiências, permitindo verificar se determinado fator tem maior efeito em estudantes (ou em escolas) de alto desempenho ou naqueles (ou em escolas) de baixo desempenho. Promover um fator de ambiente escolar com efeito positivo e mais forte em estudantes (ou em escolas) de baixo desempenho é colaborar com a equidade do aprendizado.

A metodologia proposta é aplicada no Sistema Paraense de Avaliação Educacional (SisPAE), usando as provas do 8º ano do ensino fundamental (EF) e medidas e indicadores obtidos nos questionários de contexto.

QUANTIS, REGRESSÃO QUANTÍLICA E ESTRUTURA HIERÁRQUICA

A metodologia tradicional para análise de fatores associados ao desempenho escolar envolve a análise de regressão, que tem como foco identificar a influência de cada fator na média da distribuição do desempenho. Usualmente os parâmetros da equação de regressão são obtidos por mínimos quadrados ordinários (MQO).1

Muitas vezes existe interesse em verificar se determinado fator afeta mais fortemente os estudantes de baixo ou de alto desempenho. Uma forma de fazer a análise, nesse caso, é por meio da chamada regressão quantílica (KOENKER, 2005). Por esse procedimento, a análise pode ser em termos de quantis (ou percentis) predefinidos, como a mediana, primeiro quartil e terceiro quartil da distribuição de desempenho dos estudantes. Se houver apenas uma variável independente, a regressão quantílica, basicamente, estima várias retas para diferentes quantis de desempenho desejados.

O quantil mais conhecido e a mediana, q(50%), que separa os 50% menores valores dos 50% maiores valores. Numa distribuição de proficiências de avaliados, o k-esimo quantil, aqui denominado de q(k), pode ser entendido como o valor que delimita os k% menores valores dos (100 - k)% maiores valores. A Figura 1 ilustra a posição do quantil 25%, denotado por q(25%), que corresponde ao valor na escala que separa 25% dos estudantes com menor proficiência, numa distribuição hipotética. O quantil q(25%) também e conhecido como primeiro quartil ou quartil inferior.

Fonte: Elaboração dos autores, 2018

FIGURA 1: Ilustração do quantil 25%: ponto que separa 25% dos estudantes com menor proficiência dos 75% com maior proficiência 

Uma vantagem de usar a regressão quantílica para a mediana, em vez da regressão de mínimos quadrados ordinários para a media, e que o seu resultado será mais robusto, em resposta aos outliers.Chen et al. (2014) apontam que a regressão quantílica e mais útil do que a regressão da media quando o termo aleatório não tem distribuição normal. Esse tipo de regressão pode ser visto como uma analogia natural a pratica de usar diferentes medidas de tendência central, dispersão e assimetria para obter uma análise mais abrangente e mais robusta (KOENKER, 2005). Cabe ainda ressaltar que na regressão quantílica qualquer quantil pode ser analisado.

A Figura 2 ilustra vários quantis da distribuição de proficiência de estudantes na comparação de dois grupos, definidos em termos de professores assíduos e professores que faltam muito, conforme respostas do questionário aplicado aos alunos. Nessa figura, os quantis são apresentados por diagramas em caixas - o que constitui uma representação usual de medianas, quartis e extremos - e por regressões quantilicas com a variável independente indicadora do atributo em questão (0 = professores assíduos; 1 = professores que faltam muito).

Fonte: Elaboração dos autores, 2018

FIGURA 2: Representação gráfica da distribuição das proficiências em Língua Portuguesa de estudantes do 8º ano do ensino fundamental que foram considerados segundo a assiduidade (ou não) de seus professores, vista em termos de quantis 

Com regressões quantílicas, como ilustrado na Figura 2, além de se avaliarem possíveis diferenças na posição central da distribuição, é possível também avaliar se o efeito do fator de interesse é maior nos estudantes de baixo desempenho ou naqueles de alto desempenho. No exemplo em questão, percebe-se que o desempenho (mediano) esperado de estudantes cujo professor costuma faltar é inferior ao daqueles cujo professor não costuma faltar. No entanto, parece que o efeito do professor faltar é aproximadamente igual nos quantis analisados (retas aproximadamente paralelas). Situações em que as retas nos quantis inferiores são mais inclinadas (tem coeficientes angulares com magnitudes maiores) do que em quantis superiores indicam que o fator e mais influente nos estudantes de baixo desempenho. Martins e Pereira (2004), Davino e Vistocco (2008), Rangvid (2008) e Almeida (2014) apresentam aplicações de regressão quantílica na área da educação.

Outra característica, bastante presente na analise de dados educacionais, e a estrutura hierárquica dos mesmos, ou seja, os estudantes são subunidades de escolas, que podem ser subunidades de diretorias, regionais ou outros agrupamentos. Com isso temos agrupamentos de estudantes dentro de escolas, gerando possivelmente medidas correlacionadas dentro de cada grupo. Temos assim uma fonte de variação interna as escolas e outra que representa a variação entre as escolas. A analise pode ser afetada pelas correlações intergrupos, de tal forma que os modelos hierárquicos retratam bem essa estrutura de dados.

Enfim, com o objetivo de verificar se um fator afeta mais os estudantes com desempenho escolar alto ou aqueles com desempenho escolar baixo, este trabalho foca nos quantis da distribuição de proficiência, considerando a estrutura hierárquica dos dados. As regressões múltiplas com modelagem hierárquica permitem isolar o efeito de cada fator e separar a variação entre escolas e a variação entre estudantes de uma mesma escola.

Nos modelos tradicionais, os efeitos dos fatores são avaliados em termos de diferenças nos valores esperados. O presente trabalho inova no sentido de estudar as diferenças de efeitos em termos de quantis, permitindo avaliar os efeitos em diferentes níveis do desempenho acadêmico.

METODOLOGIA

Em termos teóricos, o k-esimo quantil, q(k), e dado pela solução da equação P{Y ≤ q(k)} = k, sendo Y uma variável aleatória continua. Koenker (2005) e Koenker e Bassett (1978) apresentam uma maneira de se obter a mediana, q(50%), pela técnica dos mínimos quadrados. Com base em um conjunto de valores

(y1, y2, ..., yn), obtém-se o valor de θ que minimiza a soma:

Para os demais quantis, q(k), estende-se a relação considerando pesos diferentes para os resíduos positivos e negativos:

O quantil q(k) é o valor de θ que minimiza a relação (2). Esse método de mínimos erros absolutos é equivalente ao de máxima verossimilhança quando se supõe que os erros têm distribuição de Laplace, conforme descrito em Geraci e Bottai (2014). Segundo Yu e Zhang (2006), a distribuição de Laplace é definida por três parâmetros: um de locação, um de dispersão e um de assimetria, o que permite realizar a análise para situações em que a distribuição da variável em estudo é simétrica ou assimétrica.

Com base em Geraci e Bottai (2014), descreve-se o modelo de regressão quantílica hierárquica, conforme será usado neste trabalho:

Com

sendo:

Y ij a variável dependente (proficiência) do estudante i da escola j;

β oj (k) k-ésimo quantil da escola j, condicionado às demais variáveis do modelo iguais a zero;

β I (k) o efeito da l-ésima variável de estudante no k-ésimo quantil (l = 1, 2, ..., L);

γ 0 (k) ok-ésimo quantil médio das escolas, condicionado às demais variáveis do modelo iguais a zero;

y m (k) efeito da m-esima variável de escola no k-esimo quantil (m = 1, 2, ..., M);

e ij (k) o erro aleatório associado ao i-esimo estudante da escola j, supostamente com distribuição de Laplace com parâmetro de locação igual a zero, de dispersão igual a σ e de assimetria igual a k;

u j (k) o termo aleatório associado a escola j, supostamente com distribuição normal de media zero e variancia σ u 2

Neste trabalho esta se controlando a heterogeneidade das escolas pelo efeito aleatório em β oj (k), ou seja, cada escola pode ter o k-esimo quantil diferente. Num contexto geral, poderia haver efeito aleatório em alguns dos efeitos das variáveis de estudantes, ou seja, nos β l (k) (l = 1, 2, ..., L). Por exemplo, poder-se-ia supor que o efeito da reprovação seja diferente, dependendo da escola, já que algumas escolas podem ter tratamentos diferentes para os estudantes que não lograram aprovação.

Os parâmetros do modelo podem ser estimados pelo método da máxima verossimilhança. Para isso será usado o pacote lqmm (GERACI, 2016) do software livre R (R FOUNDATION FOR STATISTICAL COMPUTING, 2017).2

A literatura sobre o assunto não e muito extensa, mas ha outras propostas para introduzir estrutura hierárquica na regressão quantílica, como em Chen et al. (2014) e Hassan (2014). Vale destaque a abordagem de Galarza, Lachos e Bandyopadhyay (2017), que propõem melhorias no algoritmo para obtenção das estimativas por máxima verossimilhança em regressão quantílica hierárquica, oferecendo novo pacote no R, qrLMM, em estudo pelos autores do presente trabalho.

DADOS E VARIÁVEIS DO ESTUDO

A metodologia proposta é aplicada no sistema de avaliação em larga escala do estado do Pará (SisPAE), iniciado em 2013, que avalia os estudantes nas áreas de Língua Portuguesa e Matemática. Na edição 2016 foram avaliados alunos do 4º e 8º anos do ensino fundamental, bem como as 3as séries do ensino médio. A avaliação envolveu a participação de alunos, professores e diretores de 3.534 escolas, distribuídas nos 144 municípios paraenses. São 814 escolas estaduais, 2.714 municipais e seis casas familiares rurais. Da previsão inicial de 563.413 alunos matriculados, participaram efetivamente da avaliação 376.830 em Língua Portuguesa e 376.684 em Matemática.

A edição 2016 do SisPAE incluiu coleta de informações sobre as características dos alunos de todos os anos/series avaliados, bem como dos professores, orientadores pedagógicos, especialistas em educação, diretores e escolas, com o objetivo de traçar o perfil dos respondentes e coletar dados para uma análise mais detalhada dos fatores associados ao desempenho escolar. Para tanto, foram aplicados questionários nos seguintes quantitativos: 270.424 alunos; 15.250 professores; 3.094 orientadores pedagógicos; 19.769 especialistas em educação; 3.509 diretores; e 3.509 escolas.

No estudo de fatores associados do SisPAE (PARA, 2017), são descritas várias medidas e indicadores construídos com base nos questionários contextuais, especialmente naqueles respondidos pelos estudantes. A escolha das medidas e indicadores baseou-se na literatura de fatores associados ao desempenho escolar, como em Alves e Soares (2008, 2013) e Laros, Marciano e Andrade (2010), bem como em relatórios técnicos de avaliações de larga escala efetuadas em outras unidades da federação. No presente artigo, foram selecionados os indicadores que apresentaram significância estatística, aqueles mais fortemente associados com a proficiência, conforme a análise de SisPAE (PARA, 2017). Como o objetivo central deste trabalho e mostrar uma nova abordagem de análise, optou-se por não usar número excessivo de fatores.

Em SisPAE 2016 (PARA, 2017) foram construídas várias medidas pela Teoria da Resposta ao Item (TRI) com modelo de escala gradual (ANDRADE; TAVARES; VALLE, 2000; AYALA, 2009), das quais três foram usadas neste artigo:

  • Nível Socioeconômico da família do estudante (NSE);

  • Nível de Relacionamento Escolar na percepção do estudante (NRE);

  • Nível do Clima Escolar na percepção do estudante (NCE).

As medidas também foram agregadas, em termos de medias, para a(s) turma(s) do ano escolar do estudante, em sua escola. Neste artigo, tais medidas foram padronizadas com media zero e desvio-padrão um, relativo ao grupo de estudantes em estudo. No caso da medida agregada, a padronização foi em relação ao grupo de escolas pesquisadas.

Também foram consideradas variáveis indicadoras da presença de fatores associados ao desempenho escolar: sexo do estudante; indicador de reprovação; indicador de realização de dever de casa; dentre outros. A lista completa dos fatores aqui analisados encontra-se na primeira coluna da Tabela 1.

RESULTADOS E DISCUSSÃO

Nesta seção são apresentados e discutidos os resultados de regressões quantílicas hierárquicas aplicadas nas provas de Língua Portuguesa e Matemática do 8o ano do ensino fundamental do estado do Para, em 2016.

A obtenção das estimativas teve por base um conjunto de 1.808 escolas e mais de 66.000 estudantes, que correspondem as unidades observacionais com respostas nas variáveis em estudo.

Para melhor ilustrar as informações que podem ser extraídas com a abordagem proposta, será apresentada, inicialmente, uma análise pela regressão hierárquica usual, baseada no valor médio da proficiência. A Tabela 1 traz a estimativa do efeito esperado por cada fator incluído na análise. O método de estimação foi o de máxima verossimilhança restrita, usando o pacote lme4 (BATES et al., 2015).

TABELA 1: Estimativas dos efeitos esperados pelos fatores em análise, ajustando-se um modelo hierárquico aos dados do 8º ano do ensino fundamental do SisPAE 2016, por disciplina 

Fonte: Elaboração dos autores, 2018.

Todas as estimativas apresentadas na Tabela 1 são significantes estatisticamente (p < 0,05).3 Analisando as estimativas dos efeitos, chega-se a conclusão de que, na população estudada, os níveis de clima e de relacionamento escolar (NCE e NRE, respectivamente) tem efeitos positivos no desempenho escolar. Em números, a cada desvio-padrão a mais em que os estudantes percebem clima escolar da escola, a proficiência media em Língua Portuguesa tende a ser duas unidades superior.

Em geral, as meninas foram melhores em Língua Portuguesa e os meninos em Matemática: estimativa do efeito nas medias de meninas em relação aos meninos e de 10,6 em Língua Portuguesa e -5,0 em Matemática. O grupo de estudantes que tiveram reprovação obteve proficiência media bem inferior aos outros: estimativas de -12,8 para Língua Portuguesa e -10,5 para Matemática, ou seja, a retenção do estudante devido ao seu mal desempenho (ou outros motivos) não tende a fazer com que este chegue ao nível dos demais estudantes nos anos seguintes.

Os resultados citados no parágrafo anterior são compatíveis com outros estudos de fatores associados, como em Laros, Marciano e Andrade (2010) e Alves e Soares (2008). O que se coloca e que esses efeitos são observados no nível médio de proficiência, deixando de responder questões tais como: será que o clima escolar pode influenciar mais os estudantes de baixa proficiência? Será que a diferença entre o sexo feminino e o masculino acontece com maior ênfase em estudantes de baixa ou de alta proficiência? E o efeito do professor se preocupar com os deveres de casa dos estudantes e maior entre aqueles de baixo ou de alto desempenho escolar? De modo geral, o que se tenta responder neste artigo e se determinado efeito e maior em estudantes de alto desempenho ou de baixo desempenho. Para tanto, a análise que segue baseia-se nos quantias da distribuição das proficiências.

A Tabela 2 apresenta vários quantis dos resultados das provas do SisPAE 2016, na escala Saeb. Considerando a prova de Lingua Portuguesa, ao analisar o quantil 10%, igual a 147,4, diz-se que 10% dos estudantes tem proficiência em Língua Portuguesa igual ou inferior a 147,4 pontos. Em termos do quantil 90%, pode-se afirmar que 90% dos estudantes tem proficiência em Língua Portuguesa igual ou inferior a 256,1 pontos, ou, equivalentemente, 10% dos estudantes tem proficiência superior a 256,1 pontos. Ou seja, enquanto q(10%) separa os 10% de menor proficiência, q(90%) separa os 10% de maior proficiência.

TABELA 2: Proficiência dos alunos do 8º ano do ensino fundamental do SisPAE 2016, por disciplina, considerando-se alguns quantis de interesse 

Fonte: Elaboração dos autores, 2018.

A discussão nesta seção envolve o quanto diferenças de valores nas variáveis explicativas - ou da presença de fatores que costumam afetar o desempenho - alteram os valores dos quantis e, mais ainda, se o efeito é maior (ou menor) nos quantis que separam os estudantes de desempenho mais baixo ou nos quantis que separam aqueles de desempenho mais alto.

A Tabela 3 traz as estimativas dos efeitos dos fatores em análise sobre alguns quantis da distribuição de proficiência em Língua Portuguesa. No geral, serão apresentadas apenas as estimativas de máxima verossimilhança que registraram significância estatística ao nível de 0,05. Tabelas com erros- -padrão e testes de significância desses quantis encontram-se no Apêndice (tabelas A1 a A5).

TABELA 3: Coeficientes dos modelos de regressão quantílica hierárquica ajustados aos resultados da prova de Língua Portuguesa do 8º ano do ensino fundamental do SisPAE 2016 

Fonte: Elaboração dos autores, 2018.

As tabelas A1 a A5 apresentam os valores estimados dos coeficientes das regressões hierárquicas quantificas, acompanhados dos respectivos erros-padrão e os valores-p do teste estatístico associado a hipótese nula de o coeficiente ser nulo, ou seja, não haver efeito significante da referida variável ou do fator em análise.

Cabe observar que alguns coeficientes que não apresentaram significância estatística (valor-p maior que 0,05) não foram explicitados nas tabelas 3 e 4 do corpo do trabalho, porem nas tabelas A1 a A5 estão relacionados todos os resultados obtidos no ajuste dos modelos.

TABELA A1: Coeficientes, erros-padrão e valores-p para o quantil 10% - q(10%) do modelo de regressão quantílica hierárquica ajustado aos resultados do 8º ano do ensino fundamental do SisPAE 2016, por disciplina 

Fonte: Elaboração dos autores, 2018.

TABELA A2: Coeficientes, erros-padrão e valores-p para o primeiro quartil - q(25%) do modelo de regressão quantílica hierárquica ajustado aos resultados do 8º ano do ensino fundamental do SisPAE 2016, por disciplina 

Fonte: Elaboração dos autores, 2018.

TABELA A3: Coeficientes, erros-padrão e valores-p para a mediana - q(50%) do modelo de regressão quantílica hierárquica ajustado aos resultados do 8º ano do ensino fundamental do SisPAE 2016, por disciplina 

Fonte: Elaboração dos autores, 2018.

TABELA A4: Coeficientes, erros-padrão e valores-p para o terceiro quartil - q(75%) do modelo de regressão quantílica hierárquica ajustado aos resultados do 8º ano do ensino fundamental do SisPAE 2016, por disciplina 

Fonte: Elaboração dos autores, 2018.

TABELA A5: Coeficientes, erros-padrão e valores-p para o quantil 90% - q(90%) do modelo de regressão quantílica hierárquica ajustado aos resultados do 8º ano do ensino fundamental do SisPAE 2016, por disciplina 

Fonte: Elaboração dos autores, 2018.

O efeito do nível socioeconômico familiar (NSE) no desempenho escolar é deveras conhecido. Pela Tabela 3, verifica- se que o aumento de um desvio-padrão do NSE da família do estudante leva a um aumento de 3,7 pontos na proficiência mediana, estimativa parecida com o que foi obtido com o modelo para a média (Tabela 1), o que é razoável, já que ambas as medidas são de tendência central da distribuição de proficiência. Porém, com as regressões quantílicas, observa- se que o efeito do NSE é mais forte em estudantes com proficiências mais altas: enquanto no quantil 10% (ponto que separa 10% dos estudantes com menor proficiência) o efeito estimado de um desvio-padrão no NSE foi de 2,5 pontos a mais na prova; no quantil 90%, que separa 10% dos estudantes com maior proficiência, o efeito estimado foi de 4,6 pontos. Analisando os valores do NSE ano/escola, verifica-se que a relação é similar ao que ocorre com o NSE da família do estudante. A Tabela 4 mostra os quantis da distribuição das proficiências de Matemática. As relações são bastante parecidas com Língua Portuguesa para a maioria das variáveis/fatores analisados.

TABELA 4: Coeficientes dos modelos de regressão quantílica hierárquica ajustados aos resultados da prova de Matemática do 8º ano do ensino fundamental do SisPAE 2016 

Fonte: Elaboração dos autores, 2018.

Nota: Os fatores relacionados à leitura (incentivo dos pais e se o próprio estudante costuma ler) foram excluídos por não apresentarem efeitos significantes e nem terem muito sentido para a prova de Matemática.

As figuras 3 a 7 reproduzem as estimativas dos efeitos em cada quantil para os fatores em que foram observadas diferenças importantes, Língua Portuguesa e Matemática, incluindo intervalos de 95% de confiança.

A Figura 3 mostra os efeitos do nível socioeconômico familiar. Observa-se que, em ambas as áreas, os intervalos nos quantis 10% e 90% são disjuntos, indicando diferença significante; o mesmo ocorre entre os quartis inferior, q(25%), e superior, q(75%). Ou seja, o efeito do NSE é significativamente mais forte em estudantes com proficiências mais altas.

Fonte: Elaboração dos autores, 2018

FIGURA 3: Efeito do NSE nos quantis analisados 

Um fator bastante estudado nas avaliações de larga escala é o da reprovação. Em ambas as provas se verifica efeito negativo do estudante que já teve reprovação, com redução de mais de 10 pontos na mediana, quando comparado ao grupo que não teve reprovação. Percebe-se, ainda, que esse efeito é mais forte dentre os estudantes com maior desempenho. No quantil 90%, que separa 10% dos estudantes com maior desempenho, a diferença entre os dois grupos foi de 15,1 pontos em Língua Portuguesa e 14,3 pontos em Matemática (Figura 4). Cabe ressaltar que há bem menos casos de estudantes de alto desempenho com reprovação, mas se deve considerar, também, a influência de algum outro fator não controlado, tal como doença do estudante ou em sua família em anos anteriores, levando à retenção.

Fonte: Elaboração dos autores, 2018

FIGURA 4: Efeito da reprovação nos quantis analisados 

São identificados efeitos negativos associados ao “professor que costuma faltar” e ao “professor que dá mais atenção aos estudantes bons” (tabelas 3 e 4), na percepção do estudante respondente. Não há uma tendência clara de a magnitude do efeito aumentar ou diminuir à medida que se caminha para quantis maiores, ou seja, os efeitos desses indicadores são igualmente ruins entre os estudantes de melhor e de pior desempenho.

O efeito positivo do “professor que se preocupa com o dever de casa” é ligeiramente maior nos estudantes com melhor proficiência. Isso sugere que os estudantes de melhor desempenho aproveitam melhor os deveres de casa e as correções feitas pelo professor (Figura 5).

Fonte: Elaboração dos autores, 2018

FIGURA 5: Efeito de o “professor se preocupar com o dever de casa” nos quantis analisados 

Um aspecto interessante é o forte efeito negativo dos “estudantes que consideram que o aprendizado depende mais do professor do que do estudante”. Com as regressões quantílicas pode-se perceber que esse efeito é mais forte dentre os estudantes de desempenho maior. Em Língua Portuguesa, para estudantes que estão no quantil 90%, a diferença é em torno de 12 pontos. Já para aqueles que estão no quantil 10%, o efeito negativo é em torno de 6 pontos. Talvez esse comportamento seja característico de alunos de menor desempenho, cuja homogeneidade dos grupos (concordantes e discordantes da pergunta) leve a uma menor diferença de desempenho, ocorrendo o oposto para os estudantes de maior desempenho (Figura 6).

Fonte: Elaboração dos autores, 2018

FIGURA 6: Efeito da concordância pelos estudantes de que “o aprendizado depende mais do professor do que dele próprio” nos quantis analisados 

Um aspecto interessante, verificado em vários estudos de avaliação de larga escala, é que em Matemática os meninos têm desempenho melhor, enquanto em Língua Portuguesa são as meninas que mostram maior desempenho. A Figura 7 apresenta os efeitos do fator sexo em diferentes quantis, tanto em Língua Portuguesa quanto em Matemática.

Fonte: Elaboração dos autores, 2018

FIGURA 7: Efeito do sexo feminino nos quantis analisados 

A novidade observada neste trabalho e que em Matemática a diferença entre os sexos e maior entre os estudantes de mais alto desempenho, com os meninos tendo desempenho bem superior ao das meninas (quase 10 pontos no quantil 90%). Por outro lado, em Língua Portuguesa, em que as meninas sobressaem, a diferença e maior entre os estudantes de baixo desempenho (mais de 10 pontos nos quantis inferiores). Pensando conjuntamente em Língua Portuguesa e Matemática, a análise sugere que os meninos estão em posição mais extrema do que as meninas, já que em Língua Portuguesa, disciplina em que eles usualmente tem desempenho pior, a diferença e maior dentre aqueles de pior desempenho; em Matemática, em que eles normalmente tem desempenho superior, a diferença acentua entre os de maior desempenho.

CONCLUSÃO

Ha poucos trabalhos sobre estudos de fatores associados ao desempenho escolar usando regressão quantílica, e em especial regressão quantílica hierárquica. De certa forma isso e justificável, porque regressão quantílica hierárquica ainda não e um método suficientemente conhecido e consagrado. Outro fator que justifica os poucos trabalhos com esse método e que ele não está implementado nos principais softwares comerciais da área de estatística. Contudo, as análises aqui realizadas mostraram boas evidencias de fatores que exercem influência mais expressiva na comparação de estudantes de alto e baixo desempenhos, resultando num importante subsidio para a gestão escolar.

Neste trabalho foi mostrado, por exemplo, que o nível socioeconômico em que o estudante está inserido provoca maiores diferenças em estudantes de alto desempenho, o que também ocorre com o efeito positivo de o professor se preocupar com os deveres de casa. Estudantes com desempenho baixo parecem mais dependentes do professor, pois a concordância de que o aprendizado depende mais do professor do que do aluno tem alto efeito negativo nos vários quantis da distribuição. Com a abordagem da regressão quantílica, verificou-se que esse efeito negativo e mais forte nos grupos de desempenho mais alto, ou seja, estudantes com bom desempenho que concordam com essa afirmação tendem a ficar bem abaixo daqueles com bom desempenho que discordam.

Os resultados devem encorajar novos estudos em outras populações que possam corroborar várias relações discutidas neste trabalho. Mais ainda, há políticas públicas realizadas com o objetivo de atenuar as diferenças de desempenho entre os estudantes, tentando melhorar o desempenho especialmente daqueles com maior dificuldade de aprendizado. A regressão quantílica hierárquica torna-se um bom instrumento para avaliar de forma objetiva o efeito dessas políticas, porque mede o efeito dos fatores de interesse em diferentes níveis do desempenho educacional, não só em seu valor esperado.

AGRADECIMENTOS

À Fundação para o Vestibular da Unesp (Vunesp), pela cessão dos dados e pelo incentivo no desenvolvimento de pesquisas em avaliação educacional.

REFERÊNCIAS

ALMEIDA, A. T. C. Determinante dos piores e melhores resultados educacionais dos alunos da rede pública de ensino fundamental no Brasil. Planejamento de Políticas Públicas, Brasília, DF, n. 42, p. 147-187, jan./jun. 2014. [ Links ]

ALVES, M. T. G.; SOARES, J. F. O efeito das escolas no aprendizado dos alunos: um estudo com dados longitudinais no ensino fundamental. Educação e Pesquisa, São Paulo, v. 34, n. 3, p. 527-544, set./dez. 2008. [ Links ]

ALVES, M. T. G.; SOARES, J. F. Effects of schools and municipalities in the quality of basic education. Cadernos de Pesquisa, São Paulo, v. 43, n. 149, p. 492-517, maio/ago. 2013. [ Links ]

ANDRADE, R. J.; SOARES, J. F. O efeito da escola básica brasileira. Estudos em Avaliação Educacional, São Paulo, v. 19, n. 41, p. 379-406, set./dez. 2008. [ Links ]

ANDRADE, D. F.; TAVARES, H. R.; VALLE, R. C. Teoria da resposta ao item: conceitos e aplicações. São Paulo: Associação Brasileira de Estatística, 2000. [ Links ]

AYALA, R. J. The theory and practice of item response theory. New York: The Guilford, 2009. [ Links ]

BATES, D.; MAECHLER, M.; BOLKER, B.; WALKER, S. Fitting linear mixed- -effects models using lme4. Journal of Statistical Software, Innsbruck, Austria, v. 67, n. 1, p. 1-48, Oct. 2015. [ Links ]

BOTTAI, M.; ORSINI, N.; GERACI, M. A gradient search maximization algorithm for the asymmetric Laplace likelihood. Journal of Statistical Computation and Simulation, London, v. 85, n. 10, p. 1919-1925, 2015. [ Links ]

CHEN, Y. L.; TIAN, M. Z.; YU, K. M.; PAN, J. X. Composite hierachical linear quantile regression. Acta Mathematicae Applicatae Sinica, London, v. 30, n. 1, p. 49-64, 2014. [ Links ]

DAVINO, C.; VISTOCCO, D. Quantile regression for the evaluation of student satisfaction. Statistica Applicata, London, v. 20, n. 3-4, p. 179-196, 2008. [ Links ]

GALARZA, C. E.; LACHOS, V. H.; BANDYOPADHYAY, D. Quantile regression in linear mixed models: a stochastic approximation EM approach. Statistics and Its Interface, London, v. 10, n. 3, p. 471-482, 2017. [ Links ]

GERACI, M. Linear quantile mixed models: the lqmm package for Laplace quantile regression. Journal of Statistical Software , Innsbruck, Austria, v. 57, n. 13, p. 1-29, Mayo 2014. [ Links ]

GERACI, M.; BOTTAI, M. Quantile regression for longitudinal data using the asymmetric Laplace distribution. Biostatistics, Oxford, UK, v. 8, n. 1, p. 140-154, 2007. [ Links ]

GERACI, M.; BOTTAI, M. Linear quantile mixed models. Statistics and Computing, London, v. 24, n. 3, p. 461-479, 2014. [ Links ]

GIMENES, N. Avaliação em larga escala no Brasil: tensões e desafios. Estudos em Avaliação Educacional , São Paulo, v. 26, n. 62, p. 254-261, maio/ago. 2015. [ Links ]

HASSAN, I. Hierarchical quantile regression. 2014. 34f. Thesis (Master of Science in Biostatistics ) - University of Alberta, Canada, 2014. Disponível em: <Disponível em: https://era.library.ualberta.ca/files/m326m3245/Hassan_Imran_201408_ MSc.pdf >. Acesso em: 05/09/2017. [ Links ]

KOENKER, R. Quantile regression. Cambridge, UK: Cambridge University, 2005. [ Links ]

LAROS, A. J.; MARCIANO, J. L.; ANDRADE, M. J. Fatores que afetam o desempenho na prova de Matemática do Saeb: um estudo multinível. Avaliação Psicológica, Porto Alegre, v. 9, n. 2, p. 173-186, ago. 2010. [ Links ]

MARTINS, P. S.; PEREIRA, P. T. Does education reduce wage inequality? Quantile regression evidence from 16 countries. Labour Economics, New York, v. 11, n. 3, p. 355-371, June 2004. [ Links ]

MORICONI, G. M.; NASCIMENTO, P. A. M. M. Fatores associados ao desempenho dos concluintes de engenharia no Enade 2011. Estudos em Avaliação Educacional , São Paulo, v. 25, n. 57, p. 248-278, jan./abr. 2014. [ Links ]

NASCIMENTO, P. A. M. M. Fatores associados ao desempenho escolar: resultado de um modelo multinível de valor adicionado. Estudos em Avaliação Educacional , São Paulo, v. 23, n. 51, p. 16-39, jan./abr. 2012. [ Links ]

NETER, J.; KUTNER, M.; WASSERMAN, W.; NACHTSHEIM. C. Applied linear statistical models. Boston: McGraw-Hill/Irwin, 1996. 1415p. [ Links ]

PARÁ. Secretaria da Educação. Estudos do SisPAE 2016 - Perfil dos participantes e fatores associados ao desempenho escolar. Belém do Pará, fevereiro 2017. Disponível em: <Disponível em: https://sispae.vunesp.com.br/Revistas2016.aspx >. Acesso em: 7 mar. 2018. [ Links ]

PONTES, L. A. F; SOARES, T. M. As metas escolares do Ideb: uma proposta alternativa de cálculo. Estudos em Avaliação Educacional , São Paulo, v. 27, n. 66, p. 690-715, set./dez. 2016. [ Links ]

RANGVID, B. S. Educational peer effects quantile regression evidence from Denmark with PISA 2000 data. The economics of education and training. Germany: Physica-Verlag, 2008. [ Links ]

R FOUNDATION FOR STATISTICAL COMPUTING. R Core Team. R: a language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing, 2017. Disponível em: <Disponível em: www.R-project.org >. Acesso em: 05/09/2017. [ Links ]

YU, K.; ZHANG, J. A three-parameter asymmetric Laplace distribution and its extension. Communications in Statistics: Theory and Methods, London, v. 34, n. 9/10, p. 1867-1879, Sept. 2006. [ Links ]

Notas

1 Para detalhes, ver, por exemplo, Neter et al. (1996)

2 Mais referências sobre esse método podem ser obtidas em Geraci e Bottai (2007, 2014), Geraci (2014) e Bottai, Orsini e Geraci (2015).

3 Todos os valores da estatística t apresentados na tabela têm magnitudes maiores do que dois. Como as quantidades de estudantes e de escolas são bastante grandes, o valor p pode ser obtido por áreas nas caudas da distribuição normal. A área agregada acima de 2 e abaixo de -2 é inferior a 5%, ou seja, p < 0,05

Recebido: 20 de Setembro de 2017; Aceito: 10 de Maio de 2018

Creative Commons License Este é um artigo publicado em acesso aberto sob uma licença Creative Commons