1 Introdução
O desempenho escolar está relacionado às estruturas educacionais construídas em torno de grupos de indivíduos, formem eles famílias, escolas, bairros ou grupos de amigos. A partir desses agrupamentos, os indivíduos compartilham opiniões, atitudes ou realizações (Laros e Marciano, 2010). Nesse contexto, o desempenho escolar é influenciado por diversos fatores: pelo que o aluno traz consigo e por aquilo que a escola oferece em termos de ensino, instalações e ambiente e, ainda, pela percepção dos docentes quanto ao desempenho dos alunos (Vidal e Vieira, 2017). A literatura de Psicologia e Educação aponta que as chances de sucesso no desempenho escolar estão diretamente relacionadas com as expectativas dos docentes sobre os alunos (Alvidrez; Weinstein, 1999; Palardy, 1969; Rosenthal; Jacobson, 1968; Teixeira, 2020; Vidal et al., 2019; Xavier; Oliveira, 2020).
O famoso estudo de Rosenthal e Jacobson (1968) conhecido como Pygmalion in the Classroom é pioneiro na análise da relação entre as expectativas docentes e o desempenho escolar. Os autores investigaram os efeitos da manipulação das expectativas dos professores sobre a capacidade e a aptidão dos alunos. Para isso, forneceram informações falsas acerca do desempenho dos alunos em um teste fictício, induzindo assim a formação de elevadas expectativas. Estudantes rotulados como mais capazes acabaram apresentando melhores desempenhos, corroborando a expectativa positiva dos professores. Tais descobertas indicam que expectativas docentes imprecisas podem levar à formação de “profecias autorrealizáveis” (Vidal et al., 2019).
A literatura especializada identifica diversas variáveis contextuais que afetam o desempenho escolar (Jesus e Laros, 2004). Para entender a complexidade desses fatores, é preciso dispor de instrumentos de modelagem à altura dessa complexidade. O presente estudo pretende avançar nessa direção, ao propor uma abordagem estatística não convencional para avaliar a relação entre expectativas docentes e desempenho educacional.
Assim, o objetivo é relacionar a percepção e a expectativa dos docentes da educação básica ao desempenho escolar em nível agregado nos munícipios brasileiros, seguindo a abordagem da econometria espacial. Para isso, foram utilizados dados secundários extraídos das respostas dos docentes ao questionário do Sistema de Avaliação da Educação Básica (Saeb), de 2013 a 2017, e os resultados dos testes padronizados dos alunos do 9º ano do Ensino Fundamental em Matemática e Língua Portuguesa. O foco no 9º ano do Ensino Fundamental se justifica pela disponibilidade de dados e por ser essa a etapa crucial para o progresso em direção ao Ensino Superior.
É importante ressaltar que a literatura já oferece evidências favoráveis à modelagem espacial, que justificam este estudo e dão suporte à sua viabilidade. Nesse sentido, Fujita et al. (2021) e Vernier (2016) encontraram forte dependência espacial, sugerindo que a estrutura espacial influencia o desempenho escolar: o desempenho de um município está positivamente associado ao desempenho de municípios vizinhos.
A proposta deste trabalho é, portanto, ajustar modelos econométricos espaciais tendo como variável dependente (Y) a variação da proficiência em Língua Portuguesa e Matemática dos alunos do 9º ano do Ensino Fundamental entre 2013 e 2017 e como variável independente de interesse (X) a variação das expectativas docentes no mesmo período, conforme propostas de mensuração sugeridas em Teixeira (2020) e Vidal et al. (2019).
Dessa forma, busca-se especificar, estimar e testar modelos teóricos influenciados pelos efeitos espaciais (dependência espacial), com base nos dados agregados do Saeb. Tais modelos procuram entender o papel da proximidade na formação da interação espacial entre fenômenos estudados (Almeida, 2012).
Antes de se avançar na modelagem, será realizada uma análise exploratória de dados espacial (AEDE), conforme Almeida (2012), para manipular dados espaciais de diversas formas e extrair informações adicionais, como padrões e relações entre variáveis. Essa análise inclui a investigação de padrões, agrupamentos e relações de dados na região de estudo, visando um melhor entendimento do fenômeno.
A partir do tema e do objeto deste trabalho e do conceito geral da AEDE, propõe-se a investigação da distribuição espacial da percepção e da expectativa docentes em relação ao desempenho dos estudantes, tendo por conjectura que fatores associados ao desempenho, como infraestrutura das escolas, sobrecarga de trabalho dos professores e características dos alunos, entre outros, podem apresentar aspectos de dependência espacial entre municípios passíveis de ser captados pela AEDE.
Tendo em vista que as técnicas estatísticas da AEDE permitem descrever a distribuição das variáveis e identificar observações não só em relação ao tipo de distribuição, mas também em relação aos vizinhos, além de buscar a existência de padrões na distribuição espacial, estima-se ser possível estabelecer hipóteses sobre as observações, de forma a selecionar o modelo inferencial mais bem suportado pelos dados.
Considerando os problemas acumulados na educação básica brasileira, especialmente os relativos à aprendizagem dos alunos do final da segunda etapa de escolarização (9º ano), o tema aqui proposto se justifica, na medida em que os resultados podem ajudar a esclarecer novas facetas da complexa relação entre a percepção e a expectativa docentes e o desempenho escolar.
Estruturalmente, o presente trabalho está organizado em cinco partes: esta introdução e mais quatro seções. Na próxima seção, são apresentadas algumas evidências empíricas anteriores, alinhadas à proposta deste estudo. Em seguida, os principais pontos da metodologia empregada são discutidos, com especial atenção à construção das variáveis de percepções e expectativas docentes. Isso se dá devido à necessidade de empregar uma análise de componentes principais (PCA, na sigla em inglês) para estimação dessas variáveis independentes de interesse. Na quarta seção, os resultados são discutidos à luz dos referenciais teórico e metodológico utilizados, destacando-se tanto a AEDE quanto os modelos espaciais. Finalmente, são apresentadas as considerações finais, as limitações do estudo e as perspectivas futuras.
2 Evidências empíricas
Meyer (1997) informa que os resultados dos testes educacionais podem estar contaminados pela mobilidade dos alunos entre escolas e por fatores extraescolares. Nesse sentido, Thieme et al. (2016) abordam variáveis contextuais e socioeconômicas que estão além do controle da escola. Concluem, assim como Wodtke et al. (2011), que discentes que vivem em bairros de baixa renda – caracterizados por grande pobreza, altos índices de desemprego, recebimento de benefícios sociais, famílias numerosas chefiadas por mulheres e poucos adultos com nível escolar médio ou superior – sofrem, ao longo de toda a infância, um impacto significativo nas chances de concluir o Ensino Médio. Em consonância, Tekwe et al. (2004) questionam se as escolas podem ser responsabilizadas pelos efeitos significativos dos fatores sociodemográficos sobre os resultados obtidos por seus alunos em testes de avaliação.
No Brasil, poucos estudos se dedicaram a avaliar a relação entre o desempenho escolar e as características socioeconômicas. Merecem destaque as pesquisas de Torres et al. (2003), na Região Metropolitana de São Paulo, e o de Cunha et al. (2009), que abordaram a relação entre os resultados obtidos pelo Sistema de Avaliação de Rendimento Escolar do Estado de São Paulo (SARESP) e as condições socioeconômicas e de moradia dos alunos, além das questões estruturais das escolas de Campinas.
Como já ressaltado, uma das constatações da literatura de Psicologia e Educação (Alvidrez e Weinstein, 1999; Palardy, 1969; Rosenthal e Jacobson, 1968; Teixeira, 2020; Vidal et al., 2019; Xavier e Oliveira, 2020) é que as chances de sucesso no desempenho escolar também estão diretamente relacionadas às expectativas docentes sobre os alunos. Segundo Vidal et al. (2019), isso pode ser visto como um tipo de “profecia autorrealizadora”.
Por exemplo, Teixeira (2020) e Xavier e Oliveira (2020) constataram essa relação em escolares do Ensino Fundamental no Brasil. De acordo com os autores, as expectativas docentes têm um efeito direto (grande influência) sobre o desempenho dos alunos, contrabalançando, muitas vezes, os efeitos negativos da estrutura familiar sobre a qualidade da aprendizagem. Vidal et al. (2019) acrescentam que os problemas de aprendizagem dos alunos podem estar associados ao meio social, ao nível cultural e à falta de assistência dos pais na vida escolar. Adicionalmente, segundo Xavier e Oliveira (2020), fatores relacionados à composição das turmas podem afetar a formação das expectativas.
O presente estudo tem a intenção de avançar nessa temática, propondo uma abordagem estatística para avaliar essa relação. Até o momento, a literatura sobre o desempenho escolar tem se concentrado na utilização de microdados e na avaliação da aprendizagem no nível individual (Jesus e Laros, 2004; Laros e Marciano, 2010; Teixeira, 2020; Vidal et al., 2019; Xavier e Oliveira, 2020). Pretende-se, aqui, relacionar a expectativa docente com o desempenho escolar no nível agregado dos munícipios brasileiros, seguindo uma abordagem espacial, cuja literatura forneceu evidências favoráveis a esse tipo de modelagem (Cavalcanti; André; Araújo, 2020; Fujita; Bagolin; Fochezatto, 2021; Vernier, 2016).
Por exemplo, Fujita et al. (2021) encontraram fortes evidências de que a presença e a qualidade do Ensino Superior nos municípios têm impacto sobre o desempenho de alunos do Ensino Fundamental. Cavalcanti et al. (2020) observaram a predominância de clusters espaciais (dentro dos 5.570 munícipios brasileiros), indicando a presença de autocorrelação espacial positiva no desempenho escolar (proficiência média em Português e Matemática) para alunos do 9º ano do Ensino Fundamental. Segundo os autores, o desempenho escolar de um município está condicionado a: 1) desempenho anterior do próprio município; 2) desempenho anterior dos municípios vizinhos; 3) características sociodemográficas do município e dos seus vizinhos.
Vernier (2016) também encontrou forte dependência espacial, sugerindo que a estrutura espacial tem influência no desempenho escolar: o desempenho de um município está positivamente associado ao desempenho dos municípios vizinhos. Adicionalmente, Vernier (2016) relata que a formação dos professores também apresenta forte associação com o resultado escolar. Os resultados indicaram que o status sociodemográfico do estudante (escolaridade dos pais e cor do aluno) e as características dos professores (conceito da universidade de formação e grau de pós-graduação) também influenciam o resultado do município – e principalmente a heterogeneidade e a autocorrelação espacial mostraram-se importantes na educação nos municípios brasileiros.
3 Metodologia
Para atingir os objetivos propostos, o percurso metodológico deste trabalho se organiza em duas partes: 1) variáveis do estudo; 2) análise de componentes principais.
3.1 Variáveis do estudo
Antes da modelagem espacial, necessitou-se criar as variáveis de percepções e expectativas docentes a partir das perguntas do questionário Problemas de Aprendizagem, aplicado aos professores pelo Sistema de Avaliação da Educação Básica (Saeb) em 2013 e 2017. Os professores eram solicitados a opinar sobre sua percepção de possíveis problemas de aprendizagem dos alunos devido aos itens Q70 a Q82. A descrição desses itens e as outras variáveis utilizadas na pesquisa encontram-se resumidas no Quadro 1
Quadro 1 Resumo das variáveis do estudo.
| Categoria | Código | Descrição |
|---|---|---|
| Identificação | COD_MUN | Código do município |
| NOME_MUN | Nome do município | |
| COD_UF | Código do estado | |
| SG_UF | Sigla do estado | |
| LATITUDE | Latitude | |
| LONGITUDE | Longitude | |
| RESP_M | Nº de respondentes / nº de matrículas | |
| Desempenho dos alunos | MAT | Proficiência em Matemática no 9º ano |
| POR | Proficiência em Língua Portuguesa no 9º ano | |
| Adequação da formação docente | AFD1 | Docentes com formação superior de licenciatura na mesma disciplina que lecionam ou bacharelado na mesma disciplina com curso de complementação pedagógica concluído |
| AFD2 | Docentes com bacharelado na disciplina correspondente, mas sem licenciatura ou complementação pedagógica | |
| AFD3 | Docentes com licenciatura em área diferente daquela em que lecionam ou com bacharelado nas disciplinas da base curricular comum e complementação pedagógica concluída em área diferente daquela em que lecionam | |
| AFD4 | Docentes com formação superior não considerada nas categorias anteriores | |
| AFD5 | Docentes que não possuem curso superior completo | |
| Indicador da complexidade da gestão | ICG1 | Porte inferior a 50 matrículas, operando em turno e etapa únicos e com Educação Infantil ou Anos Iniciais como etapa mais elevada |
| ICG2 | Porte entre 50 e 300 matrículas, operando em 2 turnos, com oferta de até 2 etapas e Educação Infantil ou Anos Iniciais como etapa mais elevada | |
| ICG3 | Porte entre 50 e 500 matrículas, operando em 2 turnos, com 2 ou 3 etapas e Anos Finais como etapa mais elevada | |
| ICG4 | Porte entre 150 e 1.000 matrículas, operando em 2 ou 3 turnos, com 2 ou 3 etapas e Ensino Médio/profissional ou Educação de Jovens e Adultos (EJA) como etapa mais elevada | |
| ICG5 | Porte entre 150 e 1.000 matrículas, operando em 3 turnos, com 2 ou 3 etapas e EJA como etapa mais elevada | |
| ICG6 | Porte superior a 500 matrículas, operando em 3 turnos, com 4 ou mais etapas e EJA como etapa mais elevada | |
| Índice de esforço docente | IED1 | Docentes que têm até 25 alunos e atuam em turno, escola e etapa únicos |
| IED2 | Docentes que têm entre 25 e 150 alunos e atuam em turno, escola e etapa únicos | |
| IED3 | Docentes que têm entre 25 e 300 alunos e atuam em 1 ou 2 turnos em escola e etapa únicos | |
| IED4 | Docentes que têm entre 50 e 400 alunos e atuam em 2 turnos, em 1 ou 2 escolas e em 2 etapas | |
| IED5 | Docentes que têm mais de 300 alunos e atuam nos 3 turnos, em 2 ou 3 escolas e em 2 ou 3 etapas | |
| IED6 | Docentes que têm mais de 400 alunos e atuam nos 3 turnos, em duas ou 3 escolas e em 2 ou 3 etapas | |
| Variáveis intraescolares | Q70 | Carência de infraestrutura física |
| Q71 | Carência ou ineficiência de supervisão, coordenação e orientação pedagógica | |
| Q72 | Conteúdos curriculares inadequados às necessidades dos alunos | |
| Q73 | Não cumprimento dos conteúdos curriculares ao longo da trajetória escolar do aluno | |
| Q74 | Sobrecarga de trabalho dos professores, dificultando o planejamento e o preparo das aulas | |
| Q75 | Insatisfação e desestímulo dos professores em relação à carreira docente | |
| Variáveis extraescolares | Q76 | Meio social em que os alunos vivem |
| Q77 | Nível cultural dos pais dos alunos | |
| Q78 | Falta de assistência e acompanhamento dos pais na vida escolar dos alunos | |
| Variáveis dependentes dos alunos | Q79 | Baixa autoestima dos alunos |
| Q80 | Desinteresse e falta de esforço do alunos | |
| Q81 | Indisciplina dos alunos em sala de aula | |
| Q82 | Alto índice de faltas por parte dos alunos |
Nota: As duas variáveis de desempenho (MAT e POR) são escores com média = 250 e desvio padrão = 50. As variáveis AFD1 a Q82 são frequências entre 0 e 1. As categorias das variáveis/perguntas de expectativas docentes da Prova Brasil (Q70 a Q82) foram baseadas, a priori, no trabalho de Vidal et al. (2019). Têm-se informações das variáveis disponíveis para 2013 e 2017, sendo que, quando necessário, os subscritos _13 e _17 indicam os respectivos anos. Sem nenhum subscrito, os códigos indicam variações de 2013 para 2017 (vide Tabela 4).
Fonte: Elaborado pelos autores.
3.2 Análise de componentes principais
Para criar as variáveis de percepções e expectativas docentes a partir dos itens Q70 a Q82 do questionário Problemas de Aprendizagem, aplicado aos professores pelo Saeb, conforme sugerido por Vidal et al. (2019), utilizou-se a análise de componentes principais.
Nesta pesquisa, a PCA foi utilizada para obtenção de estimativas dos fatores (componentes) com fins confirmatórios, para que eles fossem utilizados como substitutos dos itens Q70 a Q82, visando a uma redução da quantidade de itens do estudo (Aranha; Zambaldi, 2008). O intuito confirmatório se baseia no fato de partirmos do trabalho de Vidal et al. (2019), que propuseram uma agregação teoricamente justificável dos itens Q70 a Q82 do questionário Problemas de Aprendizagem, do Saeb. Esses autores, no entanto, não avançaram em nenhuma análise estatística. Dessa forma, aplicou-se a PCA com o objetivo de simplificar o estudo, e relegaram-se outros aspectos, como: 1) mecanismo de construção e validação de escala; e 2) exploração de dados (Aranha; Zambaldi, 2008).
Para o ajuste do modelo PCA, este estudo seguiu as recomendações de Ferreira (2018) e Hair et al. (2014) sobre as seguintes estatísticas de ajuste: 1) teste de esfericidade de Bartlett significativo; 2) medida Kaiser-Meyer-Olkin (KMO) > 0,70; 3) medidas de adequação de amostragem (MSA, na sigla em inglês) > 0,50 (no conjunto e para as variáveis individualmente); 4) comunalidades > 0,50 (ressalta-se que comunalidades superiores a 0,30 já são adequadas para efeito deste estudo, em virtude do tamanho da amostra); 5) porcentagem da variância explicada ao redor de 50%. Esses critérios buscam considerar o equilíbrio entre a obtenção de um modelo parcimonioso e o total de explicação da variação retida por esse modelo (Ferreira, 2018). Para rotação dos fatores, considerou-se um método oblíquo (oblimin), pois espera-se que os fatores estejam correlacionados (Hair et al., 2019).
Hair et al. (2014, p.107) apontam que nas ciências sociais, em que as informações são menos precisas, é comum considerar satisfatória uma solução com no máximo 60% de variância explicada (às vezes, até menos) . Henson e Roberts (2006), por exemplo, fizeram uma revisão de 267 estudos na área de educação e relataram que as soluções, em média, explicavam 52,03% da variância. No mesmo sentido, Izquierdo et al. (2014), no levantamento que fizeram de 117 estudos que utilizaram PCA nos principais periódicos de psicologia, indicaram que a variância explicada média foi de 54%, sendo que alguns trabalhos relataram 20% de variância explicada.
3.3 Resultados da PCA
A descrição dos itens utilizados nos modelos PCA para a percepção e a expectativa docentes encontra-se na Tabela 1. Os valores representam a frequência de respostas “sim” às perguntas do questionário. Por exemplo, em 2017, 81,4% dos professores acreditavam que os problemas de aprendizagem de seus alunos estavam relacionados ao item Q76 (“Meio social em que os alunos vivem”). Essa percepção era de 78,1% em 2013, ou seja, houve um aumento da percepção dos problemas de aprendizagem como advindos do meio social em que os alunos viviam.
Tabela 1 Descrição dos itens das expectativas docentes.
| 2017 (n = 5.108) | 2013 (n = 5.071) | |||
|---|---|---|---|---|
| Média | Desvio padrão | Média | Desvio padrão | |
| Q70 | 0,349 | 0,331 | 0,320 | 0,332 |
| Q71 | 0,160 | 0,254 | 0,189 | 0,279 |
| Q72 | 0,135 | 0,225 | 0,137 | 0,227 |
| Q73 | 0,264 | 0,294 | 0,258 | 0,296 |
| Q74 | 0,290 | 0,308 | 0,320 | 0,323 |
| Q75 | 0,268 | 0,298 | 0,315 | 0,321 |
| Q76 | 0,814 | 0,264 | 0,781 | 0,289 |
| Q77 | 0,810 | 0,261 | 0,785 | 0,285 |
| Q78 | 0,933 | 0,162 | 0,914 | 0,195 |
| Q79 | 0,772 | 0,287 | 0,753 | 0,299 |
| Q80 | 0,942 | 0,148 | 0,923 | 0,181 |
| Q81 | 0,702 | 0,310 | 0,694 | 0,320 |
| Q82 | 0,416 | 0,333 | 0,423 | 0,345 |
Fonte: Elaborada pelos autores.
Para estimação dos componentes, buscou-se ajustar dois modelos independentes, um para cada ano (2013 e 2017). Todos os itens (Q70 a Q82) foram considerados simultaneamente em um mesmo modelo. Inicialmente, optou-se por estimar o modelo com os dados de 2017. O primeiro modelo, ajustado conforme os critérios indicados na seção anterior, apresentou bons índices de ajustes (MSAs > 0,65; KMO = 0,74; Bartlett [χ2] = 9,570 [p-valor < 0,001]; variância explicada = 45%; cargas > 0,40), exceto por uma carga cruzada do item Q80.
Na sequência, com a opção de exclusão do item Q80, o modelo resultante também se mostrou adequado (MSAs > 0,65; KMO = 0,73; Bartlett [χ2] = 8,538 [p-valor < 0,000]; variância explicada = 47%; cargas > 0,50), principalmente por terem sido encontrados três componentes teoricamente justificáveis. Conforme se esperava a priori (Vidal et al., 2019): 1) os itens Q70 a Q75 se aglutinaram em um componente que se denominou Intraescolar (Intra), por ele se referir às variáveis da própria escola, ou seja, poder ser “descrito por meio dos professores, diretores, projeto pedagógico, insumos, instalações, estrutura institucional, ‘clima’ da escola e relações intersubjetivas no cotidiano escolar” (Vidal et al., 2019); 2) os itens Q76 a Q79 se aglutinaram em outro componente, a que se chamou Extraescolar (Extra), que diz respeito às condições de vida dos alunos e de suas famílias e aos seus contextos social, cultural e econômico (Vidal et al., 2019); 3) os itens Q81 e Q82 se aglutinaram em um componente que se denominou Aluno, por se referir às variáveis relacionadas ao próprio aluno, associadas a comportamentos e atitudes em relação ao ambiente escolar e ao processo de ensino-aprendizagem (Vidal et al., 2019).
Basicamente, as únicas diferenças entre as expectativas de Vidal et al. (2019) sobre a percepção docente das possíveis causas dos problemas de aprendizagem nas turmas são: 1) exclusão do item Q80 das análises; 2) o item Q79 ficou carregado no fator Extraescolar, em vez do fator Aluno. Cabe ressaltar que Vidal et al. (2019) não executaram nenhuma análise estatística para a proposta de categorização dos itens Q70 a Q82. Eles avaliaram os itens apenas em termos descritivos, a partir de uma análise qualitativa.
Em seguida, aplicaram-se as mesmas condições aos dados de 2013, sem, entretanto, considerar o item Q80 e fixando o número de componentes em três. A intenção era que os componentes, nos diferentes anos, fossem o mais comparáveis possível. O modelo PCA resultante para 2013 apresentou medidas de ajustes similares às do modelo de 2017 (MSAs > 0,65; KMO = 0,74; Bartlett [χ2] = 9,105 [p-valor < 0,001]; variância explicada = 48%; cargas > 0,50). Com esses resultados (Tabela 2 e Tabela 3), os escores fatoriais padronizados (média = 0; desvio padrão = 1) para cada município com observação em 2013 e 2017 foram gerados por meio do método de regressão.
Tabela 2 Matriz de componentes rotacionados (cargas fatoriais).
| 2017 | 2013 | |||||
|---|---|---|---|---|---|---|
| Extraescolar | Intraescolar | Aluno | Extraescolar | Intraescolar | Aluno | |
| Q70 | 0,544 | 0,539 | ||||
| Q71 | 0,608 | 0,619 | ||||
| Q72 | 0,621 | 0,596 | ||||
| Q73 | 0,578 | 0,567 | ||||
| Q74 | 0,610 | 0,634 | ||||
| Q75 | 0,646 | 0,632 | ||||
| Q76 | 0,781 | 0,792 | ||||
| Q77 | 0,806 | 0,815 | ||||
| Q78 | 0,642 | 0,700 | ||||
| Q79 | 0,518 | 0,549 | ||||
| Q81 | 0,738 | 0,716 | ||||
| Q82 | 0,714 | 0,727 | ||||
Nota: Extração por componentes principais e rotação varimax com normalização de Kaiser.
Fonte: Elaborada pelos autores.
Tabela 3 Matriz de pesos dos escores fatoriais.
| 2017 | 2013 | |||||
|---|---|---|---|---|---|---|
| Extraescolar | Intraescolar | Aluno | Extraescolar | Intraescolar | Aluno | |
| Q70 | 0,255 | 0,045 | - 0,097 | 0,252 | 0,049 | - 0,109 |
| Q71 | 0,299 | 0,018 | - 0,162 | 0,303 | 0,020 | - 0,194 |
| Q72 | 0,297 | - 0,003 | - 0,089 | 0,283 | - 0,058 | 0,008 |
| Q73 | 0,273 | 0,020 | - 0,086 | 0,269 | 0,030 | - 0,125 |
| Q74 | 0,261 | - 0,120 | 0,218 | 0,285 | - 0,098 | 0,205 |
| Q75 | 0,280 | - 0,114 | 0,195 | 0,285 | - 0,094 | 0,195 |
| Q76 | - 0,014 | 0,404 | - 0,081 | - 0,023 | 0,396 | - 0,130 |
| Q77 | 0,011 | 0,429 | - 0,159 | - 0,007 | 0,406 | - 0,136 |
| Q78 | - 0,048 | 0,320 | 0,022 | - 0,043 | 0,324 | 0,018 |
| Q79 | - 0,019 | 0,229 | 0,139 | - 0,023 | 0,227 | 0,128 |
| Q81 | - 0,085 | - 0,020 | 0,555 | - 0,043 | - 0,008 | 0,530 |
| Q82 | - 0,071 | - 0,036 | 0,539 | - 0,061 | - 0,074 | 0,564 |
Nota: Extração por componentes principais e rotação varimax com normalização de Kaiser.
Fonte: Elaborada pelos autores.
Como os valores dos componentes Extraescolar, Intraescolar e Aluno representam o número do desvio padrão do município em relação à média (escore padronizado), a variação (ou diferenciação) de 2013 para 2017 em cada um dos referidos componentes indica o quanto o município se aproximou ou se distanciou da média global (Brasil).
O aumento dos escores fatoriais em cada ano é condizente com o aumento da frequência de respostas “sim” para a percepção docente de possíveis problemas de aprendizagem dos alunos no referido município. Sendo assim, espera-se que variações positivas impactem negativamente o desempenho do aluno. Espera-se, portanto, que os componentes Extraescolar, Intraescolar e Aluno tenham efeito negativo sobre a proficiência em Matemática ou Língua Portuguesa.
4 Resultados
A seguir, os resultados deste trabalho são apresentados sob duas perspectivas analíticas: 1) análise descritiva das variáveis; 2) análise espacial.
4.1 Análise descritiva das variáveis
Após a extração dos componentes/variáveis Intra, Extra e Aluno para os anos de 2013 e 2017, calculou-se a variação (2017-2013) para todas as variáveis utilizadas na pesquisa. Ou seja, nas análises que se seguem, utilizam-se as primeiras diferenças das variáveis.
As estatísticas descritivas de todas as variáveis usadas na AEDE e nos modelos espaciais estão dispostas na Tabela 4, que traz informação das observações disponíveis para cada uma das variáveis. Nas análises que se seguem (AEDE e modelos espaciais), no entanto, faz-se uso da matriz completa, sem valores ausentes (n = 4,661).
Em termos médios, pode-se constatar que houve um aumento da proficiência em Matemática e Língua Portuguesa de 2013 para 2017. A proficiência em Matemática aumentou, em termos médios, em sete pontos, e a proficiência em Língua Portuguesa, quase o dobro, em 13 pontos. Adicionalmente, a oscilação para cima ou para baixo também foi alta. Por exemplo, houve municípios nos quais o escore de proficiência em Matemática variou 101 pontos para cima ou 55 pontos para baixo. A amplitude da proficiência em Língua Portuguesa foi menor, variando entre - 43 e 67 pontos.
Como as variáveis AFD, ICG e IED são proporções/frequências, os valores da Tabela 4 indicam variações em pontos percentuais. Por exemplo, no caso da variável ICG2, a média de 0,0306 indica que, de 2013 para 2017, os municípios com escolas de “porte entre 50 e 300 matrículas, operando em dois turnos, com oferta de até duas etapas e Educação Infantil ou Anos Iniciais como etapa mais elevada” aumentaram em 3,06 pontos percentuais.
Tabela 4 Estatística descritiva das variações (2017-2013) das variáveis utilizadas na pesquisa.
| n | Mínimo | Máximo | Média | Desvio padrão | |
|---|---|---|---|---|---|
| RESP_M | 4.741 | - 0,09 | 0,12 | 0,0069 | 0,01443 |
| MAT | 5.295 | - 55,64 | 101,62 | 7,0578 | 13,53147 |
| POR | 5.295 | - 42,89 | 66,97 | 13,2209 | 13,34891 |
| AFD1 | 5.570 | - 0,42 | 0,52 | 0,0383 | 0,09776 |
| AFD2 | 5.570 | - 0,38 | 0,38 | - 0,0046 | 0,03901 |
| AFD3 | 5.570 | - 0,78 | 0,46 | 0,0016 | 0,10539 |
| AFD4 | 5.570 | - 0,32 | 0,50 | - 0,0032 | 0,04573 |
| AFD5 | 5.570 | - 0,88 | 0,74 | - 0,0321 | 0,10807 |
| ICG1 | 5.570 | - 0,70 | 0,67 | - 0,0133 | 0,14127 |
| ICG2 | 5.570 | - 0,75 | 1,00 | 0,0306 | 0,14652 |
| ICG3 | 5.570 | - 1,00 | 0,67 | 0,0128 | 0,12139 |
| ICG4 | 5.570 | - 0,75 | 1,00 | - 0,0084 | 0,12120 |
| ICG5 | 5.570 | - 0,67 | 0,78 | - 0,0108 | 0,11982 |
| ICG6 | 5.570 | - 0,67 | 0,67 | - 0,0109 | 0,05871 |
| IED1 | 5.570 | - 0,63 | 0,32 | - 0,0080 | 0,06238 |
| IED2 | 5.570 | - 0,46 | 1,00 | 0,0032 | 0,08542 |
| IED3 | 5.570 | - 0,63 | 0,80 | 0,0064 | 0,10431 |
| IED4 | 5.570 | - 0,90 | 0,80 | - 0,0019 | 0,12898 |
| IED5 | 5.570 | - 0,69 | 0,78 | - 0,0001 | 0,09256 |
| IED6 | 5.570 | - 0,28 | 0,33 | 0,0005 | 0,05033 |
| INTRA | 4.741 | - 5,14 | 6,26 | 0,0054 | 1,23644 |
| EXTRA | 4.741 | - 6,28 | 5,32 | - 0,0048 | 1,29443 |
| ALUNO | 4.741 | - 5,39 | 5,20 | 0,0176 | 1,26351 |
| n válido (listwise) | 4.661 |
Nota: A descrição das variáveis RESP_M a IED6 é apresentada no Quadro 1; INTRA, EXTRA e ALUNO são variáveis que representam as variações dos componentes estimados na seção anterior.
Fonte: Elaborada pelos autores.
No caso das variáveis Intra, Extra e Aluno, que possuem escores de média = 0 e desvio padrão = 1, construídos independentemente para cada um dos anos, suas variações indicam mudanças relativas dos municípios na percepção docente sobre os problemas de aprendizagem. Por exemplo, a média de 0,0176 para a variável Aluno traduz que, em termos gerais, a percepção do professor associada ao próprio aluno – concernente a comportamentos e atitudes em relação ao ambiente escolar e ao processo de ensino-aprendizagem – piorou levemente de 2013 para 2017.
As perguntas Q81 e Q82 são negativas: “Na sua percepção, os possíveis problemas de aprendizagem dos alunos das séries ou anos avaliados ocorrem, nesta escola, devido a: i) indisciplina dos alunos em sala de aula? (1 – Sim/0 – Não); e ii) alto índice de faltas por parte dos alunos? (1 – Sim/0 – Não)”. Como os pesos dos escores fatoriais são positivos, um aumento nas respostas “sim” (indicadas como 1) sinaliza uma piora no sentido pedagógico.
4.2 Análise espacial
Tendo em vista se tratar do foco principal deste trabalho, a análise espacial percorreu os seguintes aspectos: 1) especificação dos pesos espaciais; 2) mapas descritivos das variáveis dependentes; 3) mapas Lisa das variáveis dependentes; 4) modelos espaciais; 5) proficiência em Matemática; 6) proficiência em Língua Portuguesa.
4.2.1 Especificação dos pesos espaciais
Apesar de algumas análises exploratórias no espaço não exigirem a matriz W de vizinhança (matriz de pesos espaciais), optou-se inicialmente por especificá-la. Embora se trate de um processo ad hoc, foram seguidos os procedimentos recomendados pela literatura (Almeida, 2012; Anselin; Rey, 2014; Golgher, 2015), como a busca pelo tipo de matriz que maximiza a autocorrelação espacial (evidência de interação) presente nos dados (Vieira, 2009). Para isso, para cada uma das duas variáveis dependentes (MAT e POR), os modelos descritos na Tabela 6 e na Tabela 8 foram estimados por Mínimos Quadrados Ordinários (OLS). A partir dos resíduos obtidos, calcularam-se e avaliaram-se os índices de Moran globais para diversas matrizes de pesos espaciais.
Iniciou-se pelas matrizes contíguas mais simples, Rainha e Torre. Os resultados foram similares e indicaram evidências de autocorrelação espacial positiva para as duas variáveis dependentes (Tabela 5). Essas duas matrizes geraram número irrelevantes de ilhas e um número parcimonioso de vizinhos. Com base na média de vizinhos desses dois tipos de matrizes espaciais (5,27 e 5,14, respectivamente), foram simulados três outros tipos de matrizes, com base nos quatro, cinco e seis vizinhos mais próximos (K-nearest neighbors [KNN]). Nessa abordagem, não se geram ilhas, mas o número de vizinhos é fixo. Nessas três matrizes, os valores do índice de Moran foram similares, indicando a estabilidade dos resultados. Adicionalmente, foram simulados três cenários extremos, com 10, 15 e 20 vizinhos mais próximos, e os valores do índice de Moran caíram ligeiramente.
Tabela 5 Especificação da matriz W.
| Tipo | Variável dependente | I de Moran | Z | Média de vizinhos | n de ilhas | Máximo de vizinhos |
|---|---|---|---|---|---|---|
| Rainha | MAT | 0,221 | 23,168 | 5,27 | 2 | 23 |
| POR | 0,179 | 18,628 | ||||
| Torre | MAT | 0,222 | 22,850 | 5,14 | 2 | 21 |
| POR | 0,180 | 18,417 | ||||
| KNN-4 | MAT | 0,220 | 22,618 | 4,00 | 0 | 4 |
| POR | 0,183 | 18,358 | ||||
| KNN-5 | MAT | 0,216 | 24,818 | 5,00 | 0 | 5 |
| POR | 0,176 | 19,791 | ||||
| KNN-6 | MAT | 0,216 | 27,269 | 6,00 | 0 | 6 |
| POR | 0,173 | 21,302 | ||||
| KNN-10 | MAT | 0,210 | 33,014 | 10,00 | 0 | 10 |
| POR | 0,175 | 27,340 | ||||
| KNN-15 | MAT | 0,208 | 39,304 | 15,00 | 0 | 15 |
| POR | 0,173 | 33,321 | ||||
| KNN-20 | MAT | 0,209 | 45,918 | 20,00 | 0 | 20 |
| POR | 0,173 | 38,703 | ||||
| KM-282 | MAT | 0,151 | 83,924 | 290,65 | 2 | 584 |
| POR | 0,126 | 69,730 | ||||
| KM-80 | MAT | 0,198 | 35,257 | 32,62 | 49 | 105 |
| POR | 0,165 | 29,178 | ||||
| KM-40 | MAT | 0,206 | 21,314 | 8,78 | 312 | 39 |
| POR | 0,170 | 17,630 |
Nota: KNN = K-nearest neighbors, onde o valor após o hífen indica o número de vizinhos considerados; KM = quilômetros, onde o valor após o hífen indica a distância máxima entre os centroides dos municípios para ser considerados vizinhos; I de Moran univariado global, calculado a partir dos resíduos OLS dos modelos da Tabela 4 e da Tabela 6, com inferência (z-valor e pseudo p-valor = 0,001) calculada a partir de 999 permutações (randomização).
Fonte: Elaborada pelos autores.
Para complementar a busca simulamos três outros tipos de matrizes baseados em vizinhos situados a até 282, 80 e 40 km de distância. O primeiro tipo, KM-282, representa a distância mínima necessária para evitar a formação de ilhas. Esse valor foi sugerido pelo próprio software GeoDa, com base nas variáveis de latitude e longitude, e está alinhado com outras evidências empíricas sobre a mesma variável dependente (Fujita, Bagolin e Fochezatto, 2021). Os dois outros tipos, KM-80 e KM-40, foram considerados com base na inspeção do correlograma espacial. Na primeira matriz (KM-282), os valores do índice de Moran diminuíram substancialmente. Nas duas últimas (KM-80 e KM-40), apesar de isso não ocorrer, os números médio e máximo de vizinhos aumentaram significativamente. No caso da matriz KM-40, o número de ilhas tornou-se inaceitável.
Com base nessas análises, optou-se pela matriz W mais parcimoniosa: Rainha. Golgher (2015) sugere que, em casos de dúvida, deve-se escolher uma matriz simples, como a de contiguidade. O autor também relata que, em trabalhos empíricos em estudos regionais, o número de conexões (vizinhos) varia entre 3,8 e 6,0 (Golgher, 2015). Há algumas evidências empíricas favoráveis às estimações com matrizes menos conectadas, como as de contiguidade ou aquelas com os cinco ou sete vizinhos mais próximos (Golgher, 2015). Em trabalho semelhante, Cavalcanti et al. (2020) consideraram uma matriz com os cinco vizinhos mais próximos, valor que é praticamente o mesmo da média de vizinhos (5,27) da matriz W considerada neste estudo.
4.2.2 Mapas descritivos das variáveis dependentes
Dado que o objetivo do trabalho é realizar uma análise espacial, focada principalmente na variação da proficiência em Matemática e Língua Portuguesa entre os ciclos de avaliação do Saeb de 2013 e 2017, as análises descritivas se concentram em ilustrações cartográficas das variáveis dependentes. A Figura 1 e a Figura 2 apresentam a distribuição das variações da proficiência em Matemática e em Língua Portuguesa, respectivamente. Ambas estão divididas em seis classes uniformes, representando os valores observados da variável (a) e seu desvio padrão (b).

Fonte: Elaborada pelos autores.
Figura 1 Mapa quantílico (a) e de desvio padrão (b) da variação da proficiência em Matemática.

Fonte: Elaborada pelos autores.
Figura 2 Mapa quantílico (a) e de desvio padrão (b) da variação da proficiência em Língua Portuguesa.
Sem a intenção de identificar padrões nos mapas apresentados na Figura 1 e na Figura 2, alguns fatos estilizados se destacam e até fazem sentido à luz da percepção empírica (Cavalcanti, André e Araújo, 2020; Fujita, Bagolin e Fochezatto, 2021). Entre eles, estão:
Menores variações da proficiência em Matemática no Noroeste de Minas Gerais e na Bahia;
Maiores variações da proficiência em Matemática na Região Sul, especificamente nos estados de Paraná e Santa Catarina;
As proficiências em Matemática e em Língua Portuguesa parecem seguir um padrão semelhante de variação. Nos municípios onde houve variação positiva em Língua Portuguesa, isso geralmente também ocorreu em Matemática;
O padrão de variabilidade (desvio padrão) aparenta ser o mesmo tanto para a variação da proficiência em Matemática quanto para a da proficiência em Língua Portuguesa;
Os municípios da Região Norte exibem maior homogeneidade (menor variabilidade) nas variações das proficiências, tanto para Língua Portuguesa quanto para Matemática.
4.2.3 Mapas Lisa das variáveis dependentes
Para inferências mais contundentes sobre padrões ou clusters espaciais, deve-se avaliar o indicador de correlação espacial de Moran local, que é materializado nos mapas Lisa. A Figura 3 e a Figura 4 apresentam o mapa Lisa dos regimes espaciais (a) e das indicações de significâncias (p-valor < 0,01) para os indicadores de Moran local (b) relacionados às variações da proficiência em Matemática (Figura 3) e em Língua Portuguesa (Figura 4). Os valores em vermelho no mapa Lisa (a) são os hot spots (high-high), onde altas variações da proficiência em Matemática ou em Língua Portuguesa são acompanhadas por altas variações nos vizinhos. Já os valores em azul representam os cold spots (low-low), onde baixas variações da proficiência em Matemática ou em Língua Portuguesa são acompanhadas por baixas variações dos vizinhos. Geralmente, os regimes low-high ou high-low são considerados outliers espaciais, conforme descrito por Anselin e Rey (2014).

Fonte: Elaborada pelos autores.
Figura 3 Mapa Lisa (a) e de significância (p < 0,01) (b) da variação em Matemática.

Fonte: Elaborada pelos autores.
Figura 4 Mapa Lisa (a) e de significância (p < 0,01) (b) da variação em Português.
De forma geral, percebem-se mais pontos de cold spots do que de hot spots. Isso é mais evidente para a variação da proficiência em Matemática (n = 211 vs. n = 125) do que para a da proficiência em Língua Portuguesa (n = 173 vs. n = 130). A maior concentração de pontos low-low, no caso da proficiência em Língua Portuguesa (Figura 4), parece ocorrer no Noroeste de Minas Gerais e na Bahia. Quanto à variação da proficiência em Matemática, além dos clusters espaciais nessas mesmas localidades, também parece haver outro na Região Norte (Figura 3). Em relação aos hot spots, percebe-se que há uma concentração de pontos high-high no Ceará, tanto para a variação da proficiência em Matemática como para a da proficiência em Língua Portuguesa. No caso da variação da proficiência em Matemática, também existe um cluster espacial em Rondônia (Figura 3).
4.2.4 Modelos espaciais
Cabe ressaltar que, para a estimação dos modelos, utilizaram-se as variações das variáveis entre 2017 e 2013. Esse procedimento, que é recomendado quando se têm dados longitudinais com apenas dois pontos no tempo, visa eliminar as influências de fatores não observados que não mudam com o tempo, para melhor controle das variáveis omitidas. Com isso, utiliza-se, de fato, um tipo de estimador de efeito fixo, especificamente o método de primeiras diferenças para dados em painel (Almeida, 2012). O resultado, por se ter apenas dois pontos no tempo, gera dados cross-section e, assim, podem-se aplicar os procedimentos usuais (clássicos) para a modelagem de dados espaciais (Almeida, 2012; Golgher, 2015).
Os componentes espaciais do modelo podem aparecer basicamente em três formas: 1) na forma de defasagem espacial na variável dependente (ρWy); 2) na forma de defasagem nas variáveis explicativas (θWx); 3) ou como defasagem no termo de erro (λWu). Tais componentes podem aparecer de forma isolada ou em conjunto (Vieira, 2009). Foram considerados para as análises espaciais apenas modelos que levassem em conta a variável dependente espacialmente defasada (ρWy) e/ou o erro espacialmente defasado (λWu). Isso porque estima-se, e as evidências sugerem, que as variáveis independentes consideradas – principalmente aquelas relacionadas com a percepção docente sobre a escola e as condições extraescolares e do aluno – não exercem influência espacial (spillover) na proficiência em Língua Portuguesa ou em Matemática do município.
A partir dessa decisão, temos menor risco ao excluir modelos espaciais mais complexos para estimar (SDM, SLX etc.) e ficamos restritos aos modelos SAR, SEM e SAC. Assim, seguindo o procedimento clássico (Almeida, 2012) de especificação de modelos espaciais ou, em outros termos, a estratégica específica geral (Golgher, 2015), começando pelo modelo OLS básico, estimamos os outros três modelos espaciais (SAR, SEM e SAC), um para cada variável dependente (MAT e POR). A partir dos testes diagnósticos dos resíduos do modelo OLS e de medidas de ajuste recomendadas, tomamos as decisões sobre os estimadores utilizados e os modelos finais para interpretação.
De forma geral, algumas evidências foram comuns e contundentes em todas as análises (modelos) realizadas: 1) rejeita-se veemente a hipótese de normalidade dos resíduos, conforme apontado pelo teste Jarque-Bera; 2) rejeita-se a hipótese de homogeneidade dos resíduos, conforme evidenciado pelo teste Koenker-Basset; 3) há evidências de algum tipo de dependência espacial, como apontado pelos outros testes diagnósticos (I de Moran dos resíduos e testes LM). O primeiro e o segundo pontos levam à decisão de considerar os métodos 2SLS/GMM, em detrimento do método ML, para estimar os parâmetros dos modelos. Isso se dá pelo fato de o método ML requerer normalidade e pela evidência de heterogeneidade, que só poderia ser tratada nos métodos 2SLS/GMM, a partir das correções dos erros padrão HAC e do procedimento de Kelejian e Prucha. Optou-se por seguir o caminho sugerido por Anselin (1988): tratar os problemas gerados pela heterogeneidade espacial com o emprego de instrumentos fornecidos pela economia clássica, como o uso de erros padrão robustos (Vieira, 2009), em detrimento de um modelo de heterogeneidade espacial. O terceiro ponto indica a pertinência dos modelos espaciais em relação aos dados, em detrimento de um modelo OLS básico.
4.2.5 Proficiência em Matemática
Partindo do modelo específico, estimado por OLS, e diagnosticando seus resíduos, podem-se constatar, conforme a Tabela 6, alguns direcionamentos para ajustar o modelo espacial da variação da proficiência em Matemática: 1) o teste difuso I de Moran dos resíduos indicou algum tipo de dependência espacial (I = 0,22; Z = 23,51; p-valor < 0,001); 2) os testes focados LM direcionaram para um SAR ou SAC.
Essa última conclusão surgiu porque todos os testes LM, inclusive os robustos, foram altamente significativos. Os testes LMρ e LMρ robusto foram, no entanto, mais significativos (maior valor da estatística χ2), direcionando assim para um modelo SAR. Como, entretanto, também os testes LMλ e LMλ robusto – bem como o teste LM (Sarma), que testa, conjuntamente, ρ = 0 e λ = 0 – foram significativos, isso poderia direcionar para um modelo de ordem superior do tipo SAC. Esse último deve ser considerado apenas se houver ganhos efetivos em eliminar a dependência espacial que ficou nos resíduos (Anselin e Rey, 2014).
Tabela 6 Modelo OLS com erros padrão HAC para proficiência em Matemática.
| MAT | Coeficiente | Erro padrão | t | p-valor | |||
|---|---|---|---|---|---|---|---|
| Constante | 6,595 | 0,347 | 19,023 | 0,001 | |||
| AFD2 | - 2,625 | 5,287 | - 0,497 | 0,620 | |||
| AFD3 | - 14,245 | 2,784 | - 5,116 | 0,001 | |||
| AFD4 | - 18,749 | 5,093 | - 3,681 | 0,001 | |||
| AFD5 | - 10,191 | 2,633 | - 3,870 | 0,001 | |||
| ICG2 | - 0,748 | 1,740 | - 0,430 | 0,668 | |||
| ICG3 | 1,782 | 2,417 | 0,737 | 0,461 | |||
| ICG4 | - 3,407 | 2,676 | - 1,273 | 0,203 | |||
| ICG5 | 0,487 | 2,533 | 0,192 | 0,848 | |||
| ICG6 | 5,589 | 4,189 | 1,334 | 0,182 | |||
| IED2 | - 2,625 | 4,541 | - 0,578 | 0,563 | |||
| IED3 | 5,891 | 4,515 | 1,305 | 0,192 | |||
| IED4 | - 4,148 | 4,238 | - 0,979 | 0,328 | |||
| IED5 | - 11,878 | 4,766 | - 2,492 | 0,013 | |||
| IED6 | - 7,242 | 6,071 | - 1,193 | 0,233 | |||
| ALUNO | - 0,352 | 0,172 | - 2,045 | 0,041 | |||
| EXTRA | - 0,288 | 0,163 | - 1,766 | 0,077 | |||
| INTRA | 0,135 | 0,162 | 0,832 | 0,405 | |||
| RESP_M | 24,890 | 15,400 | 1,616 | 0,106 | |||
| Nº observações: | 4.661 | LL: | - 18.526,666 | ||||
| Adj. R2 (%): | 0,018% | AIC: | 37.091,331 | ||||
| Estatística F: | 5,748*** | SIC: | 37.213,824 | ||||
| Teste diagnóstico | Valor/DF | Estatística | Valor de p | ||||
| I de Moran | 0,2211 | 23,511 | 0,001 | ||||
| LMρ | 1 | 597,32 | 0,001 | ||||
| LMρ robusto | 1 | 101,79 | 0,001 | ||||
| LMλ | 1 | 549,01 | 0,001 | ||||
| LMλ robusto | 1 | 53,484 | 0,001 | ||||
| LM (Sarma) | 2 | 650,804 | 0,001 | ||||
| Jarque-Bera | 2 | 947,574 | 0,001 | ||||
| 18 | 108,118 | 0,001 | |||||
*p-valor < 0,1; **p-valor < 0,05;
***p-valor < 0,01;
Multicolinearidade = 4,963; Adj. R2 = coeficiente de determinação ajustado; LL = log da razão de verossimilhança; AIC = critério de informação de Akaike; BIC = critério de informação de Schwarz; LM = multiplicador de Lagrange; DF = graus de liberdade. Modelo estimado por mínimos quadrados ordinários (OLS) com erros padrão ajustados para heterocedasticidade e autocorrelação (HAC), considerando uma função kernel uniforme e distância euclidiana, e matriz de pesos espaciais Rainha, selecionada conforme especificação observada na Tabela 5.
Fonte: Elaborada pelos autores.
Os testes Jarque-Bera e Koenker-Basset rejeitaram as hipóteses de normalidade e homogeneidade dos resíduos, respectivamente. De acordo com os valores da estatística χ2, a falta de normalidade e a presença de heterogeneidade parecem ser exacerbadas, corroborando o uso de estimadores que não levem em conta a normalidade dos dados e cujos erros padrão possam ser corrigidos para a presença de heterogeneidade. Assim, os modelos espaciais estimados por 2SLS são apesentados na Tabela 7, inclusive o modelo SEM para comparabilidade.
Os erros padrão de todos os modelos, para as devidas inferências, foram ajustados em relação à heterogeneidade, seja pelo método HAC, seja pelo método de Kelejian e Prucha. A única medida de ajuste existente quando se usam estimadores 2SLS/GMM, o pseudo R2, ratifica as suspeitas iniciais: os modelos SAR e SAC são os que melhor se ajustam aos dados.
Tabela 7 Modelos espaciais 2SLS com erros padrão robustos para proficiência em Matemática.
| MAT | SAR | SEM | SAC |
|---|---|---|---|
| Constante | 0,591 | 6,853*** | 0,297 |
| AFD2 | - 0,598 | - 0,926 | - 0,695 |
| AFD3 | - 6,467** | - 9,734*** | - 3,903 |
| AFD4 | - 6,789 | - 11,965** | - 4,145 |
| AFD5 | - 4,436* | - 6,792*** | - 2,277 |
| ICG2 | 0,947 | 0,350 | 0,198 |
| ICG3 | 1,258 | 1,184 | 1,417 |
| ICG4 | - 0,431 | - 1,303 | - 1,566 |
| ICG5 | 1,871 | 1,574 | 0,803 |
| ICG6 | 5,645 | 5,359 | 4,153 |
| IED2 | - 5,451 | - 4,907 | - 2,543 |
| IED3 | 2,414 | 3,194 | 3,390 |
| IED4 | - 4,162 | - 4,690 | - 1,866 |
| IED5 | - 5,900 | - 8,555** | - 3,405 |
| IED6 | - 4,412 | - 5,630 | - 1,772 |
| ALUNO | - 0,248 | - 0,255* | - 0,281** |
| EXTRA | - 0,022 | - 0,110 | - 0,041 |
| INTRA | 0,085 | 0,106 | 0,011 |
| RESP_M | 7,477 | 14,098 | 6,206 |
| ρ | 0,898*** | 0,944*** | |
| λ | 0,456*** | - 0,712*** | |
| Nº observações | 4.661 | 4.661 | 4.661 |
| Pseudo R2 (%) | 15,840% | 2,060% | 15,700% |
| Teste diagnóstico | Valor/DF | Estatística | p-valor |
*p-valor < 0,1;
**p-valor < 0,05;
***p-valor < 0,01;
SAR = modelo de defasagem espacial estimado por mínimos quadrados ordinários em dois estágios (2SLS) com erros padrão ajustados para heterocedasticidade e autocorrelação (HAC); SEM = modelo de erro autorregressivo espacial estimado pelo método 2SLS espacial generalizado de Kelejian e Prucha; SAC = modelo de defasagem espacial com erro autorregressivo espacial estimado pelo método 2SLS espacial generalizado de Kelejian e Prucha. Para o ajuste da heterocedasticidade nos modelos 2SLS, considerou-se uma função kernel uniforme e distância euclidiana. A matriz de pesos espaciais utilizada foi do tipo Rainha, conforme especificação observada na Tabela 5.
Fonte: Elaborada pelos autores.
Vale lembrar que, para as medidas AFD, ICG e IED, não foram consideradas as variáveis dummies AFD1, ICG1 e IED1, a fim de evitar colinearidade perfeita. Assim, essas variáveis servem como categorias base. Desse modo, tomando o modelo SAR como o modelo final, preferido em detrimento do modelo SAC, observa-se que, em municípios com maior proporção de “docentes com licenciatura em área diferente daquela em que leciona, ou com bacharelado nas disciplinas da base curricular comum e complementação pedagógica concluída em área diferente daquela em que leciona” (AFD3), em relação a “docentes com formação superior de licenciatura na mesma disciplina que lecionam, ou bacharelado na mesma disciplina com curso de complementação pedagógica concluído” (AFD1), a variação da proficiência em Matemática foi menor.
No mesmo sentido, em municípios com maior proporção de “docentes que não possuem curso superior completo” (AFD5), em comparação com “docentes com formação superior de licenciatura na mesma disciplina que lecionam, ou bacharelado na mesma disciplina com curso de complementação pedagógica concluído” (AFD1), a variação da proficiência em Matemática também foi menor. Isso ocorreu tanto para AFD3 quanto para AFD5 no modelo SAR, devido aos coeficientes significativos e negativos. Esses achados estão em consonância com Fujita et al. (2021) e Vernier (2016), que relataram que uma maior proporção de docentes pós-graduados nos municípios se relacionou positivamente com a performance dos alunos na escola. Vale ressaltar que o valor dos coeficientes em modelos SAR não é interpretado em termos de variações marginais (derivadas parciais), como nos modelos OLS ou SEM, devido aos efeitos de spillovers de realimentação dos vizinhos, materializados no coeficiente ρ. Por essa razão, optou-se por realizar esse tipo de análise somente na seção seguinte.
4.2.6 Proficiência em Língua Portuguesa
No caso da variação da proficiência em Língua Portuguesa, o modelo preferido também foi do tipo SAR, pelos mesmos motivos e argumentos discutidos na seção anterior: 1) os testes Jarque-Bera e Koenker-Basset rejeitaram as hipóteses de normalidade e homogeneidade dos resíduos (Tabela 7), respectivamente, e todos os modelos espaciais foram estimados por 2SLS, conforme Tabela 8; 2) os erros padrão de todos os modelos foram ajustados quanto à heterogeneidade; 3) o teste I de Moran dos resíduos, os testes focados LM e a medida de ajuste pseudo R2 direcionaram para os modelos SAR e SAC, sendo avaliado o primeiro (modelo final), porque, apesar da significância de λ no modelo SAC, o erro espacialmente defasado não melhorou a explicação da variação da proficiência em Língua Portuguesa. Por esse motivo, escolheu-se o modelo mais parcimonioso.
Tabela 8 Modelo OLS com erros padrão HAC para proficiência em Língua Portuguesa.
| POR | Coeficiente | Erro padrão | t | p-valor | |||
|---|---|---|---|---|---|---|---|
| Constante | 12,731 | 0,336 | 37,903 | 0,001 | |||
| AFD2 | - 7,447 | 4,746 | - 1,569 | 0,117 | |||
| AFD3 | - 12,991 | 2,755 | - 4,715 | 0,001 | |||
| AFD4 | - 17,902 | 5,258 | - 3,405 | 0,001 | |||
| AFD5 | - 7,425 | 2,675 | - 2,776 | 0,006 | |||
| ICG2 | - 1,350 | 1,738 | - 0,777 | 0,437 | |||
| ICG3 | 1,829 | 2,397 | 0,763 | 0,445 | |||
| ICG4 | - 2,334 | 2,457 | - 0,950 | 0,342 | |||
| ICG5 | - 2,042 | 2,338 | - 0,874 | 0,382 | |||
| ICG6 | 1,968 | 4,007 | 0,491 | 0,623 | |||
| IED2 | 2,293 | 4,314 | 0,532 | 0,595 | |||
| IED3 | 9,482 | 4,252 | 2,230 | 0,026 | |||
| IED4 | 0,543 | 4,009 | 0,135 | 0,892 | |||
| IED5 | - 3,030 | 4,633 | - 0,654 | 0,513 | |||
| IED6 | 0,710 | 5,963 | 0,119 | 0,905 | |||
| ALUNO | - 0,446 | 0,164 | - 2,716 | 0,007 | |||
| EXTRA | - 0,349 | 0,160 | - 2,182 | 0,029 | |||
| INTRA | 0,023 | 0,163 | 0,141 | 0,888 | |||
| RESP_M | 31,394 | 15,434 | 2,034 | 0,042 | |||
| Nº observações: | 4.661 | LL: | - 18.441,973 | ||||
| Adj. R2 (%): | 0,016% | AIC: | 36.921,946 | ||||
| Estatística F: | 5,085*** | SIC: | 37.044,439 | ||||
| Teste diagnóstico | Valor/DF | Estatística | Valor de p | ||||
| I de Moran | 0,1791 | 19,052 | 0,001 | ||||
| LMρ | 1 | 393,73 | 0,001 | ||||
| LMρ robusto | 1 | 77,41 | 0,001 | ||||
| LMλ | 1 | 360,15 | 0,001 | ||||
| LMλ robusto | 1 | 43,827 | 0,001 | ||||
| LM (Sarma) | 2 | 437,556 | 0,001 | ||||
| Jarque-Bera | 2 | 142,703 | 0,001 | ||||
| 18 | 140,665 | 0,001 | |||||
*p-valor < 0,1; **p-valor < 0,05;
***p-valor < 0,01;
Multicolinearidade = 4,963; Adj. R2 = coeficiente de determinação ajustado; LL = log da razão de verossimilhança; AIC = critério de informação de Akaike; BIC = critério de informação de Schwarz; LM = multiplicador de Lagrange; DF = graus de liberdade. Modelo estimado por mínimos quadrados ordinários (OLS) com erros padrão ajustados para heterocedasticidade e autocorrelação (HAC), considerando uma função kernel uniforme e distância euclidiana, e matriz de pesos espaciais Rainha, selecionada conforme especificação observada na Tabela 5.
Fonte: Elaborada pelos autores.
A interpretação do resultado significativo da variável AFD3 é feita da mesma forma que na seção anterior. No caso da variável AFD4, que também é significativa, observa-se que, em municípios com maior proporção de “docentes com formação superior não considerada nas categorias anteriores” (AFD4), em relação a “docentes com formação superior de licenciatura na mesma disciplina que lecionam, ou bacharelado na mesma disciplina com curso de complementação pedagógica concluído” (AFD1), a variação da proficiência em Língua Portuguesa foi menor. Parece-nos que esse achado não tem muita relevância prática, devido à definição da variável AFD4.
Tabela 9 Modelos 2SLS com erros padrão robustos para proficiência em Língua Portuguesa.
| POR | SAR | SEM | SAC |
|---|---|---|---|
| Constante | 1,473 | 12,964*** | 0,939 |
| AFD2 | - 0,771 | - 3,585 | - 2,303 |
| AFD3 | - 6,295** | - 9,589*** | - 4,538** |
| AFD4 | - 9,094* | - 13,577*** | - 6,197 |
| AFD5 | - 3,363 | - 5,253** | - 2,614 |
| ICG2 | - 0,130 | - 0,726 | 0,088 |
| ICG3 | 1,601 | 1,488 | 1,603 |
| ICG4 | 0,588 | - 0,684 | - 0,761 |
| ICG5 | - 0,931 | - 1,414 | - 0,311 |
| ICG6 | 2,630 | 2,098 | 1,667 |
| IED2 | - 2,339 | - 1,159 | 1,433 |
| IED3 | 4,445 | 5,987 | 5,819 |
| IED4 | - 0,626 | - 0,670 | 0,243 |
| IED5 | - 0,514 | - 2,174 | 1,023 |
| IED6 | 1,272 | 0,993 | 1,950 |
| ALUNO | - 0,382** | - 0,389** | - 0,344*** |
| EXTRA | - 0,196 | - 0,252 | - 0,147 |
| INTRA | 0,024 | 0,008 | 0,014 |
| RESP_M | 10,031 | 19,083 | 13,238 |
| ρ | 0,875*** | 0,912*** | |
| λ | 0,389*** | - 0,689*** | |
| Nº observações: | 4.661 | 4.661 | 4.661 |
| Pseudo R2 (%): | 11,680% | 1,860% | 11,570% |
| Teste diagnóstico | Valor/DF | Estatística | p-valor |
| Anselin-Kelejian | 1 | 83,865 | 0,001 |
*p-valor < 0,1;
**p-valor < 0,05;
***p-valor < 0,01;
SAR = modelo de defasagem espacial estimado por mínimos quadrados ordinários em dois estágios (2SLS) com erros padrão ajustados para heterocedasticidade e autocorrelação (HAC); SEM = modelo de erro autorregressivo espacial estimado pelo método 2SLS espacial generalizado de Kelejian e Prucha; SAC = modelo de defasagem espacial com erro autorregressivo espacial estimado pelo método 2SLS espacial generalizado de Kelejian e Prucha. Para o ajuste da heterocedasticidade nos modelos 2SLS, considerou-se uma função kernel uniforme e distância euclidiana. A matriz de pesos espaciais utilizadas foi do tipo Rainha, conforme especificação observada na Tabela 5.
Fonte: Elaborada pelo autores.
A significância, no entanto, da variável Aluno no modelo SAR (Tabela 9) – e, diga-se de passagem, em todos os outros modelos, inclusive nos modelos SEM e SAC de proficiência em Matemática (Tabela 7) –, com significância marginal (p-valor < 0,15) no modelo SAR (Tabela 7), traz implicações práticas interessantes. Em todos os modelos, o coeficiente da variável Aluno foi negativo e teve valores similares, indicando estabilidade dos resultados. Assim, conclui-se inicialmente que, em municípios onde a percepção docente sobre a indisciplina dos alunos (Q81) e o alto nível de faltas (Q82) é maior, a proficiência em Língua Portuguesa é menor. Isso também ocorre no caso da proficiência em Matemática, mas essa avaliação é marginalmente significativa. Esses achados sobre a percepção docente são consistentes com os de Vidal e Vieira (2017), que argumentam que os fatores externos à escola são mais relevantes do que os internos para as deficiências de aprendizagem.
Devido aos spillovers de realimentação, o valor de - 0,382 do parâmetro da variável Aluno no modelo SAR deve ser avaliado em termos de efeito direto (ED), efeito indireto (EI) ou efeito total (ET), como propõe Golgher (2015). Assim, obtiveram-se os efeitos ED = - 1,630, EI = - 1,426 e ET = - 3,056. Ao se considerar apenas o ET, observa-se que, em municípios com desvio padrão acima da média em relação aos outros municípios no escore do componente Aluno – indicando aumento da percepção docente sobre a indisciplina e o nível de faltas dos alunos –, a proficiência em Língua Portuguesa diminuiu aproximadamente três pontos.
5 Considerações finais
Estudos recentes (Teixeira, 2020; Vidal et al., 2019; Vidal e Vieira, 2017; Xavier e Oliveira, 2020) apresentam evidências sobre a importância das expectativas docentes para os resultados sociopsicológicos e comportamentais e, sobretudo, para o desempenho escolar dos alunos. Alguns autores, como Teixeira (2020), apontam que, além de as expectativas desempenharem um papel eficaz no processo escolar, elas são o processo com maiores potencial e relevância frente a todos os outros, possuindo alto poder para contrabalançar influências externas negativas sobre a qualidade do aprendizado discente, como, por exemplo, características relacionadas ao background familiar e ao nível socioeconômico dos alunos.
Nessa medida, outras evidências empíricas (Tekwe et al., 2004; Thieme et al., 2016; Wodtke; Harding; Elwert, 2011) indicam que os fatores extraescolares, como variáveis contextuais além do controle da escola e condições socioeconômicas (baixa renda, alta pobreza, desemprego e famílias numerosas, chefiadas por mulheres e com poucos adultos com nível escolar médio ou superior), figuram como a principal influência nos resultados obtidos pelos alunos em testes de avaliação. Assim, ao conciliar essas duas perspectivas, outras evidências empíricas (Vidal et al., 2019; Vidal e Vieira, 2017) levam à conclusão de que as percepções docentes sobre os problemas de aprendizagem dos alunos estão mais relacionadas a fatores externos à escola, como o meio social e as situações familiar e econômica.
O presente estudo buscou contribuir para essa discussão ao propor uma abordagem espacial (ecológica), com o intuito de expurgar a influência dos fatores externos à escola, que não mudam (ou mudam lentamente) com o tempo (efeitos fixos), sobre o desempenho em Matemática e Língua Portuguesa de escolares do 9º ano no Brasil. Nesse sentido, avança-se nessa temática, tendo em vista que, até o momento, a literatura sobre o desempenho escolar vem utilizando microdados de avaliação da aprendizagem ao nível individual (Jesus e Laros, 2004; Laros e Marciano, 2010; Teixeira, 2020; Vidal et al., 2019; Xavier e Oliveira, 2020). Quando a pretensão foi relacionar a expectativa docente com o desempenho escolar no nível agregado dos munícipios (Cavalcanti, André e Araújo, 2020; Fujita, Bagolin e Fochezatto, 2021; Vernier, 2016), mesmo seguindo uma abordagem espacial, não houve controle efetivo dos efeitos fixos que não mudam com tempo e que, em grande medida, podem explicar o desempenho escolar (Teixeira, 2020).
Assim como outros estudos espaciais (Cavalcanti, André e Araújo, 2020; Fujita, Bagolin e Fochezatto, 2021; Vernier, 2016), que encontraram forte dependência espacial nos resultados das proficiências em Matemática e em Língua Portuguesa do Saeb, também se sugere nesta pesquisa que a dimensão espacial influencia o desempenho escolar. Pontualmente, nossos achados indicam que municípios com maior proporção de docentes com formação superior na mesma disciplina que lecionam possuem escores médios maiores nas proficiências em Matemática e em Língua Portuguesa. Além disso, em municípios onde a percepção docente sobre a indisciplina e o alto nível de faltas dos alunos é maior, o desempenho discente é menor.
Frente às novas evidências encontradas, é importante destacar algumas constatações da literatura de Psicologia e Educação (Alvidrez e Weinstein, 1999; Palardy, 1969; Rosenthal e Jacobson, 1968; Teixeira, 2020; Vidal et al., 2019; Xavier e Oliveira, 2020), de que as chances de sucesso no desempenho escolar também podem estar diretamente relacionadas com as expectativas docentes sobre os alunos (profecia autorrealizadora). Gestores escolares e formuladores de políticas públicas devem, portanto, ficar atentos a um processo de isenção profissional na função última e primordial da escola, que é zelar pelo ensino-aprendizagem (Vidal e Vieira, 2017).
Uma visão pessimista sobre o aluno, por exemplo, pode estar arraigada na percepção docente e repercutir em sua prática, conduzindo a um baixo desempenho escolar (Vidal e Vieira, 2017). Assim, a melhoria do desempenho dos escolares brasileiros pode estar vinculada a uma nova postura dos professores diante do processo de ensino e aprendizagem. Manifestar comportamentos (mesmo que involuntários) que serão absorvidos por seus alunos pode influenciar a capacidade de desempenho dos estudantes (Teixeira, 2020). Se os docentes brasileiros percebem o desempenho dos alunos como dependente de variáveis extraescolares, sendo irrelevantes ou de menor impacto as variáveis intraescolares (nos âmbitos da gestão escolar e da ação docente), prevalece a visão de que as variáveis extraescolares definem o destino da trajetória escolar do aluno – e de que, sobre isso, não há muito o que fazer. É essa postura que os gestores escolares e os formuladores de políticas públicas devem combater.














