OS ÍNDICES DE DESIGUALDADE DE THEIL
Nenhuma das medidas de desigualdade criadas por Theil (1967) “é um caso particular da divergência de Kullback-Leibler”, como afirmam Soares e Ernica (2025, p. 10). O próprio Theil (1967) explica que a criação das duas medidas de desigualdade (T e L), inspiradas na teoria da informação, envolveu a mudança conceitual em uma variável. Lembremos que, no caso de duas distribuições discretas de uma variável com valores xi (i = 1, ..., n) com probabilidades Q(xi) e P(xi) para cada um dos diferentes valores de xi, a divergência de Kullback-Leibler de Q para P ou ganho de informação quando se passa da distribuição Q para a distribuição P, é dada por
Note-se que xi pode até ser uma variável nominal, isto é, ser uma classificação em n categorias. Podemos calcular, por exemplo, a divergência de Kullback-Leibler da distribuição dos brasileiros, conforme sua cor, de 2004 para 2024. Para calcular (1), precisamos das proporções de pessoas de cada cor nos dois anos.
Para criar uma medida da desigualdade da distribuição da renda (ou de qualquer outra variável quantitativa) entre n pessoas, Theil percebeu que a proporção da renda total apropriada por cada pessoa (yi, com i = 1, 2, ..., n) tem propriedades matemáticas iguais a uma probabilidade P(xi). Após outras etapas,1 ele chegou à medida de desigualdade da distribuição da renda
Há uma grande analogia formal entre (1) e (2). A probabilidade P(xi) é substituída pela participação (yi) de cada pessoa na renda total,2 e a probabilidade Q(xi) é substituída pela participação de cada pessoa na população. Mas é claro que (2) não é um “caso particular” de (1).
Diferentemente do que afirmam Soares e Ernica (2025, p. 10), a minha recomendação foi abandonar o uso da divergência de Kullback-Leibler apenas na análise de notas ou proficiências, mas não em outras aplicações. E a recomendação de abandonar o uso da divergência de Kullback-Leibler na análise de proficiências se deve à minha convicção de que os problemas relevantes podem ser analisados de maneira mais simples e clara usando medidas tradicionais de tendência central (média e mediana), dispersão (variância e desvio padrão), desigualdade (coeficiente de variação, índice de Gini e medidas T e L de Theil) e assimetria. Procurei justificar essa convicção com a análise dos exemplos numéricos artificiais apresentados nas tabelas 1 e 2 de Hoffmann (2025), não comentada por Soares e Ernica (2025).
DESIGUALDADE DE OPORTUNIDADES
Tanto na distribuição da renda como na distribuição de proficiências, é importante distinguir a desigualdade total da desigualdade de oportunidades. O conceito de desigualdade de oportunidades está bem discutido em Ernica et al. (2025, p. 13). Trata-se da desigualdade que pode ser atribuída a circunstâncias da vida da pessoa as quais ela não teve possibilidade de escolher (interferir). Diferenças de renda ou proficiências devidas a maior ou menor esforço pessoal podem ser defendidas como incentivos válidos, mas diferenças associadas àquelas circunstâncias são injustas e precisam ser evitadas.
Se, além das proficiências, tivermos informações sobre as circunstâncias a que cada aluno é submetido (incluindo status socioeconômico da família, cor, sexo, região de residência e características da escola), podemos fazer uma classificação pormenorizada com base nessas circunstâncias e calcular uma medida da desigualdade (como o T de Theil) das proficiências entre as categorias. Essa seria uma estimativa da desigualdade de oportunidades na obtenção dessas proficiências sintética bem mais apropriada do que o conjunto das divergências de Kullback-Leibler referentes às
. . . distâncias entre a distribuição das proficiências de pessoas de nível socioeconômico mais baixo e a de pessoas de nível socioeconômico mais alto, entre a distribuição das proficiências das pessoas autodeclaradas pretas e a das pessoas autodeclaradas brancas, entre a distribuição das proficiências das meninas e a dos meninos. (Ernica et al., 2025, p. 19).
Com base em dados do Sistema de Avaliação da Educação Básica (Saeb), disponibilizados pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), Alves (2025) calculou a média e o índice de Gini das distribuições das proficiências nas disciplinas de língua portuguesa e matemática para alunos do 5o ano do ensino fundamental, de 1995 a 2021, distinguindo escolas públicas e escolas privadas (Alves, 2025, pp. 63-64, figuras 16 e 17). A média nas escolas privadas é sempre maior do que nas escolas públicas, e o índice de Gini é quase sempre maior nas escolas públicas. Essas diferenças indicam a existência de desigualdade de oportunidades, pois os alunos das escolas públicas pertencem a famílias que são, em geral, mais pobres, e as condições de aprendizagem nessas escolas são, em média, piores do que nas escolas privadas.
Pode-se constatar que há uma tendência decrescente no índice de Gini para os alunos de escolas privadas, mas não para os alunos de escolas públicas. Observa- -se que as proficiências médias nas duas disciplinas mostram tendência crescente de 2001 a 2019 e estabilidade ou queda de 2019 a 2021, sendo a queda mais acentuada nas escolas públicas. Nota-se, ainda, aumento do índice de Gini de 2019 a 2021. O comportamento desses indicadores de 2019 a 2021 certamente está relacionado com a pandemia de covid-19 a partir de 2020, inclusive com interrupção das aulas, sendo que o aumento da desigualdade e da diferença entre proficiências médias de escolas públicas e privadas se deve ao fato de que os mais pobres ficaram mais limitados no acesso a sistemas de ensino a distância.
O uso da divergência de Kullback-Leibler permitiria mostrar esses fenômenos com mais clareza?
Considero importante comparar diferentes grupos ou categorias de alunos e me parece relevante comparar diversas características das respectivas distribuições de proficiências, como tendência central, dispersão, desigualdade e assimetria. E não vejo razão para desconsiderar que tais comparações integram uma análise da desigualdade geral. Para medidas de desigualdade como o T e o L de Theil, quando a população é dividida em categorias mutuamente exclusivas e exaustivas, a desigualdade total é igual à soma da desigualdade entre categorias com a desigualdade dentro das categorias.
Vamos admitir que estejam sendo consideradas categorias para as quais a desigualdade entre elas represente desigualdade de oportunidades. Se for constatado que a desigualdade global está crescendo e for razoável admitir que a desigualdade dentro das categorias seja estável, podemos considerar, só com base na desigualdade global, que há indicação de crescimento de desigualdade de oportunidades. De qualquer maneira, não é a comparação da distribuição de proficiências no Brasil com uma distribuição baseada em dados médios de um conjunto de países desenvolvidos que vai garantir que se esteja medindo a desigualdade de oportunidades, pois certamente tal tipo de desigualdade também existe naqueles países.
A DISTRIBUIÇÃO RELATIVA
Soares e Ernica (2025, p. 9) explicitam que a opção pela metodologia utilizada “se estrutura em torno do conceito de distribuição relativa, descrito completamente em Handcock e Morris (1998)”. Conforme está explicado em Handcock e Morris (1999), dadas duas distribuições contínuas com funções de densidade de probabilidade q(x) e p(x) e funções de distribuição acumulada Q(x) e P(x), respectivamente, a distribuição relativa (com base na distribuição Q(x)) é obtida atribuindo a r = Q(x) a função de distribuição acumulada
com Q-1 ( ) indicando a inversa da função Q ( ). Deduz-se, então, que a função de densidade de probabilidade de r é
Pode-se verificar que a divergência de Kullback-Leibler de Q para P, definida por
é igual ao negativo da entropia da distribuição relativa, que é dado por
A distribuição relativa tem muitas aplicações na análise de variáveis socioeconômicas, mas cabe advertir a existência de questões relacionadas ao rigor estatístico no livro de Handcock e Morris (1999). Falta clareza na distinção entre os conceitos de desigualdade e polarização e propõe-se o uso de uma medida de polarização que é uma medida de desigualdade entre as duas metades da distribuição. Isso levou a diversos artigos com resultados errados sobre a evolução da polarização da distribuição da renda em muitos países, inclusive o Brasil (ver Hoffmann & Kassouf, 2025).
A DIVERGÊNCIA EM RELAÇÃO A UMA REFERÊNCIA
Não contesto a validade e a relevância de comparar uma distribuição de proficiências com uma distribuição de referência previamente definida. Mas essa comparação não deve se basear exclusivamente no cálculo da divergência de Kullback-Leibler.
Para ilustrar meu argumento, vamos admitir que temos uma distribuição de referência normal com média 70 e variância 16.
A divergência de Kullback-Leibler de uma distribuição normal com média 65,4 e variância 16 para aquela referência3 é 0,66 (arredondando na segunda decimal). Note- -se que nessa comparação a divergência se deve apenas à diferença no valor da média.
A divergência de Kullback-Leibler de uma distribuição normal com média 70 e variância 146 para aquela referência também é 0,66 (arredondando na segunda decimal). Note-se que nessa comparação a divergência se deve apenas à diferença no valor da variância.
A divergência de Kullback-Leibler de uma distribuição normal com média 63,38 e variância 64 para aquela referência também é 0,66 (arredondando na segunda decimal). Note-se que nessa comparação a divergência se deve a mudanças tanto na média como na variância.
Esse exemplo deixa claro que, quando comparamos uma distribuição com uma referência e obtemos o valor da divergência de Kullback-Leibler, não sabemos se tal valor se deve a diferenças na tendência central, na dispersão ou uma combinação dos dois fenômenos. Para esclarecer a questão, teríamos que, em seguida, calcular as médias e variâncias. Não seria melhor, então, calcular diretamente as medidas de tendência central e dispersão das duas distribuições?














