INTRODUÇÃO
A segunda metade do século XX foi prodigiosa para os estudos linguísticos e sobretudo para aqueles cujo interesse voltava-se para a linguagem das crianças, campo oportuno para se observar a linguagem em seu estado nascente1. O desenvolvimento da Psicolinguística, disciplina que tem suas origens no século XVIII (LEVELT, 2012), foi incrementado pelas raízes mentalistas dos estudos chomskianos e consolidou a relação necessária entre psicologia e linguística para a compreensão de fenômenos que envolvem a aquisição e o processamento cognitivo da linguagem.
A aquisição de um sistema de escrita alfabética é etapa importante do desenvolvimento da linguagem, porque propicia a retomada dos conhecimentos linguísticos adquiridos de forma natural e espontânea, especialmente aqueles referentes à camada fônica, também denominada segunda articulação da linguagem2. Textos como os de Charles Read sobre escritas inventadas (1971, 1975), os de Carol Chomsky a respeito de aspectos dos conhecimentos linguísticos subjacentes à escrita (1970, 1975), os de Isabelle Liberman (1971, 1973) acerca dos efeitos da fonologia na escrita, além de tantos outros, abriram uma linha de investigação vigorosa que produz ainda hoje enorme interesse àqueles que se preocupam com a aquisição da leitura e da escrita, possivelmente, por sua base linguística e pelo seu vínculo com a alfabetização.
Esta linha de investigação, que no Brasil repercutiu também nos textos de Abaurre (1988, 1991, 2001), encontrou continuidade nas pesquisas do Grupo de Estudos sobre Aquisição da Linguagem Escrita (GEALE) as quais têm como escopo o estudo do erro (orto)gráfico produzido pelas crianças após a conquista da base alfabética. As ideias que estão na base das investigações do grupo filiam-se a uma perspectiva desenvolvimental segundo a qual a aquisição da linguagem é uma descoberta orientada, guiada pela capacidade das crianças para construir gramáticas (KIPARSKY; MENN, 1977). É essa gramática, ou conhecimento internalizado, o manancial primeiro a que recorre o aprendiz para produzir suas escritas iniciais. Nesse sentido, considera-se que o conhecimento linguístico é o insumo mais potente, disponível à criança, para a formulação de hipóteses sobre o sistema de escrita.
Importante ressaltar, no entanto, que o foco no conhecimento fonológico não exclui a ideia de que as crianças operam desde muito cedo com informações advindas do seu trânsito por práticas de letramento (SOARES, 1986, 2016), posto que vivem em uma sociedade grafocêntrica e estão expostas às formas escritas de sua língua, visualizando-as e experimentando-as, em maior ou menor escala, constituindo assim seu léxico ortográfico inicial (SEYMOUR, 1997). Tampouco se exclui a ideia de que a criança precisa dominar conhecimentos relacionados ao alfabeto, os quais englobam o traçado e o nome das letras, bem como aqueles relacionados à grafotática (TREIMAN, 1993).
O pressuposto de que a escrita não é uma representação da fala, contrário à visão aristotélica, orienta os estudos do GEALE que interpretam a fala e a escrita como atualizações da língua, isto é, como substâncias distintas para um mesmo plano da expressão. A ideia, ilustrada em (1), é a de que língua pode ser expressa nas formas da fala e da escrita, as quais guardam relação de dependência e independência tanto do ponto de vista do léxico como da gramática.
Em (1) pode-se observar, na perspectiva adotada, relações de correspondência entre fala e escrita, ambas formas de atualização da língua, independentes, mas relacionadas entre si. Abercombrie (1949/1965) caracteriza a fala e a escrita como duas realizações da língua, uma audível e outra visível. Para o autor a “letra” possui três atributos: nomen, figura e potestas. O primeiro diz respeito ao nome da letra, o segundo tem a ver com a forma e, por fim, potestas, o valor em determinado contexto, em última instância, o poder de distinguir uma forma linguística de outra.
Miranda (2013, 2017a) tem abordado os erros (orto)gráficos3 a partir de duas grandes categorias que visam captar a natureza do erro: uma fonológica e outra ortográfica. O desenvolvimento das análises, porém, tem apontado para uma terceira categoria denominada fonográfica, a qual será explorada, juntamente com as duas antes mencionadas. O foco da reflexão incide sobre a criança que escreve e não sobre o receptor/leitor e três perguntas servem de guia para o desenvolvimento do estudo: O que a criança sabe? Que hipóteses formula? Qual a natureza do erro? Neste artigo,4 são apresentadas em detalhe as três grandes categorias, a partir das quais se pretende caracterizar a natureza dos erros produzidos pelas crianças no início da escolarização bem como mostrar os resultados obtidos da análise de, aproximadamente, dois mil textos de estudantes da primeira à quarta série do Ensino Fundamental. Antes, porém, são tecidas algumas considerações sobre aspectos do sistema de escrita e da fonologia do português.
O SISTEMA DE ESCRITA DO PORTUGUÊS E A FONOLOGIA
A motivação fonêmica dos sistemas alfabéticos é ressaltada por Coulmas quando diz que segmentos, mais especificamente segmentos fonêmicos, são, e isso é largamente aceito, aquilo que as letras do alfabeto codificam (2003, p.89). Ortografias, por seu turno, são próprias de cada língua e diferem quanto ao grau de transparência/opacidade. Nas mais transparentes a relação fonema-grafema ocorre de forma mais direta, isto é, um fonema corresponde a um grafema; nas opacas o efeito da morfologia se sobrepõe ao da fonologia e, de acordo com Seymour, em uma ortografia profunda, as diferentes formas de escrever podem servir para indicar identidades lexicais ou informações morfológicas (2013, p. 318-19).
Na escala referente à opacidade/transparência, o português é classificado por Seymour e colaboradores (2003) como grau médio em se considerando os dois extremos. Nosso sistema apresenta relações biunívocas e também múltiplas (LEMLE, 1987) e, embora haja casos de homofonia (conserto/concerto e comprido/cumprido, por exemplo) e de efeito morfológico responsável por assimetrias fala/escrita (-r do infinitivo e desinência de plural -s), as relações com a fonologia se sobrepõem àquelas de ordem morfológica e lexical.
O quadro em (2) apresenta o conjunto de fonemas consonantais do português, representados por barras, / /, e seus respectivos grafemas, representados por colchetes angulados, < >. Nas células com hachuras estão ilustrados os principais casos de alofonia observados no funcionamento fonológico da língua, sendo os alofones 5representados por [ ] e suas respectivas formas gráficas por letras que estão entre aspas, ‘ ’. As africadas, por exemplo, correspondem aos fonemas /t/ e /d/ e têm sua manifestação fonética limitada, em dialetos do português, ao contexto de [i], por efeito da palatalização. A nasal velar, corresponde ao arquifonema /N/6 e ocorre na pronúncia de palavras nas quais a nasal pós-vocálica precede consoantes velares como em manca e manga, por exemplo. Já os glides, ou semivogais, dizem respeito às vogais altas dos ditongos, as quais são resultantes de processos de silabação, ou ainda à consoante lateral alveolar que, em posição pós-vocálica, é pronunciada como glide velar, em palavras como sol e 7delta, por exemplo.
Em (2), tem-se uma síntese das relações fonema-grafema observadas em português. Os 19 fonemas consonantais são representados por 34 grafemas distribuídos conforme o quadro. Nota-se que as relações biunívocas, no caso das obstruintes, restringem-se às plosivas labiais e alveolares e às fricativas labiodentais. Já no que se refere às soantes, as relações são biunívocas na posição de onset8 silábico, como se observa para as nasais labiais, alveolares e palatais e para as líquidas alveolares. Já no caso da líquida palatal, há competição entre os grafemas <lh>, <li> e <le>, referente a um pequeno grupo de palavras, nas quais a palatal é pronunciada, mas a grafia é <li> e <le>, como em família, italiano, auxílio e óleo, por exemplo.
Nos demais casos, relações múltiplas são observadas (LEMLE, 1987). Um fonema que pode ser representado por vários grafemas, como é o caso mais complexo do português, relativo ao fonema /s/, em que há uma gama de dez grafemas disponíveis no sistema. Um grafema que pode representar mais de um fonema, como é o caso do <r> e do <x>. Podendo o <r> grafar ‘r-forte’/‘r-fraco’, em rato, tora e prato; e o <x> as fricativas coronal surda/coronal sonora/palato-alveolar surda, em expresso, exame e xadrez, por exemplo.
Neste universo de possibilidades derivadas das relações múltiplas o sistema ortográfico opera com regras contextuais9, isto é, aquelas que podem ser inferidas pela observação do funcionamento do sistema; e com regras arbitrárias, ou seja, aquelas que têm base etimológica e, portanto, não estão sujeitas a um princípio gerador, definindo-se por estipulação.
No que se refere aos segmentos vocálicos, é importante fazer referência ao funcionamento fonológico do português cujo inventário dispõe de sete vogais, como mostra a figura em (3):
Câmara Jr. (1970) traz uma exaustiva e definitiva descrição da relação entre a tonicidade e a distintividade das vogais, traço marcante da fonologia do português. Na figura (2), estão apresentadas as vogais portuguesas capazes de produzir contrastes na língua quando na posição tônica. Nos casos de nasalização das vogais, o autor assevera que no português do Brasil, a posição de vogal tônica diante de consoante nasal na sílaba seguinte (ex. amo lenha e sono) elimina as vogais médias de 1º grau e torna a vogal baixa central, levemente posterior, o que auditivamente lhe imprime um som abafado (CÂMARA Jr. 1970, p.42).
As setas da figura em (3) indicam os movimentos observáveis no sistema vocálico por efeito da neutralização, processo que tem como consequência a perda de funcionalidade dos fonemas em determinadas condições. Vogais médias baixas e medias altas, na posição pretônica, perdem distintividade (pé - pedal e pó - poeira); na pós-tônica não final, correspondente às proparoxítonas, observa-se alternância [e]~[i] [o]~[u] sem prejuízo no significado (núm[e]ro ~ núm[i]ro e pér[o]la ~ pér[u]la); na postônica final as médias10 perdem seu papel contrastivo e o sistema fica reduzido a apenas três vogais, duas altas e uma baixa, a saber, [i], [u] e [a].
Por ser alvo de neutralização em todas as posições, exceto na tônica, as vogais estão sujeitas a processos variáveis característicos da fala e presentes nos diversos dialetos brasileiros. No Sul, por exemplo, são observadas variações como as que estão exemplificadas no quadro em (4):
No que diz respeito às relações entre fala e escrita, a assimetria entre os planos gráfico e fônico está em uma proporção de sete fonemas para cinco grafemas. Os efeitos da neutralização, no entanto, produzem impacto ainda maior no sentido de aumento dessa assimetria, se levados em conta processos de harmonia vocálica e de alçamento, como os que estão exemplificados em (4), os quais têm alta incidência nos distintos dialetos do português. Em (5), a figura mostra a relação grafema-fonema-fone nas vogais médias pretônicas.
O grafema <e> de palavras como s e lo e f e ra, no primeiro exemplo uma vogal média alta e no segundo, média baixa, é o mesmo utilizado para a pretônica de palavras pronunciadas com o alçamento da média, como s[i]nhora e m[i]nina. Os estudos de Miranda sobre a grafia das vogais átonas finais (2008) e das pretônicas (2011 e 2013b) focalizam a relação entre fonologia e ortografia com base em dados de escrita inicial. Sobre a pretônica, a autora mostra indícios de que a altura da vogal, se alta ou média, somente se consolida a partir da aquisição da escrita alfabética. Sobre as átonas finais, os resultados da análise de dados espontâneos e de ditados com pseudo-palavras, apresentados por Miranda (2008), mostram que a informação morfológica associada à regularidade ortográfica inibe grafias das vogais átonas finais com o grafema <u>, cuja grafia convencional é produzida muito precocemente, enquanto a grafia da coronal, /e/, é de aquisição mais tardia.
Consoantes e vogais, do ponto de vista fonológico, correspondem a unidades segmentais que integram o inventário da língua, no português 19 e 7, respectivamente. Tais unidades combinadas entre si compõem estruturas prosódicas básicas sobre as quais atuam processos fonológicos, as sílabas. A sílaba é a unidade da fonologia a que se atribui realidade psicológica nos estudos linguísticos em geral, à medida que, diferentemente do fonema, é pronunciável e facilmente percebida, ainda que não seja portadora de significado. É importante notar que sílaba fonológica é diferente de sílaba gráfica, ambas pertencem a universos conceituais diversos, o fônico e o gráfico.
Cada sistema linguístico define as estruturas possíveis, bem como as combinações de consoantes e vogais que podem ou não ocorrer. Na figura em (6), estão apresentados os templates silábicos do português.
Embora sejam encontradas diferentes propostas para a modelagem desta unidade prosódica, os modelos não-lineares compartilham, em alguma medida, a visão de que a sílaba é uma unidade linguística com estrutura interna, entre cujos constituintes está estabelecida uma relação hierárquica. Selkirk (1982) propõe dois constituintes imediatos básicos para a sílaba, o onset (O)11 e a rima R, os quais formam a estrutura canônica CV. O onset não é obrigatório e pode ser ramificado, e a rima constitui-se obrigatoriamente de um núcleo N, o pico de soância, e de uma coda (C), que é opcional.
Uma estrutura do tipo CVC, seguindo este esquema, teria a representação em (7):
Os templates apresentados em (6) correspondem às formações silábicas licenciadas pela fonologia do português. De acordo com a Escala de Soância12, é possível definir as classes de segmentos que podem ocupar as posições de C no esqueleto silábico, conforme exemplificado em (7). A segunda posição de onset, nos encontros consonantais tautossilábicos, só pode ser ocupada pelas soantes líquidas /l/ e /ɾ/, como em pr a.to e pl a.ca; a primeira posição da coda, pelas soantes - /ɾ/, /l/, /N/, [j] e [w] - e pela fricativa coronal /S/, como nas primeiras sílabas das palavras ba r .co, bol.sa, pan.da, pei.to, pau.ta e pa s. ta; e, nos casos em que há o preenchimento da segunda posição de coda, somente é licenciado o /S/, como em mo ns. tro (BISOL, 1999).
Três aspectos a respeito da sílaba em português suscitam alguma controvérsia entre os estudiosos, a saber, a nasal pós-vocálica, a posição dos glides e da fricativa em estruturas que contêm duas consoantes pós-vocálicas, VCC. Com relação ao status da nasal pós-vocálica, Bisol (1999) argumenta que a nasalidade fonológica decorre de uma sequência CVC[nasal]; Mateus e Andrade (2000), por seu turno, entendem que não se trata de uma coda, mas sim de um autossegmento nasal flutuante, sem lugar no esqueleto silábico, diretamente ligado ao núcleo; já Costa e Freitas (2001) consideram a existência de vogais nasais no sistema. No que tange aos glides, Bisol (1999) sustenta que estão em posição de coda (VC), mas Mateus e Andrade (2000) consideram que eles pertencem ao núcleo ramificado. Bisol (1999:704), ao tratar do /S/ que segue a coda, sugere que ele esteja ligado diretamente à rima e não à coda, com o argumento de que a frequência desse tipo de estrutura é muito baixa.
As considerações recém feitas sobre o funcionamento fonológico do português têm o objetivo de subsidiar as categorias propostas para análise dos erros bem como as reflexões acerca do conhecimento fonológico de que dispõem as crianças quando adquirem a escrita alfabética. Importante ainda fazer menção a aspectos do funcionamento ortográfico, brevemente esboçado no quadro em (2), no qual as relações fonema-grafema são apresentadas. Dois tipos de relações podem ser observados no quadro (2): biunívocas, um fonema para um grafema e vice-versa; e múltiplas, um fonema para vários grafemas ou um grafema para vários fonemas (LEMLE, 1987), conforme ilustra (8):
As relações biunívocas, ou diretas como as nomeia Morais (2002), caso prevalecessem no sistema ortográfico produziriam uma simetria entre os planos fônico e gráfico, que resultaria em um efeito de transparência total, não atestado nos sistemas de escrita em geral. As relações múltiplas, por seu turno, são aquelas que produzem assimetrias entre os planos e são responsáveis pelo efeito de opacidade. É importante, porém, que sejam definidos os casos em que o sistema permite ao usuário, se não definir, pelo menos constranger o número de opções para a grafia de determinados fonemas. As regras contextuais são as que permitem ao usuário reduzir o impacto sobre a memória e, ao mesmo tempo, ter uma visão da forma como o sistema funciona, no sentido de definir os valores de uso de cada grafema envolvido, formulando regras que expressam o funcionamento do sistema ortográfico em aquisição.
Exemplos de regras contextuais envolvem o uso dos grafemas <r> e <rr>, <c> e <ç>, <c> e <qu>, cujas formulações estão em (9):
Com este tipo de exercício, de busca de regularidades do funcionamento do sistema, resta dar conta das grafias condicionadas por regras arbitrárias, para as quais a memorização se faz necessária. No caso das grafias disponíveis para o fonema /s/, pode-se pensar em uma redução drástica de opções, a partir da observação de contextos, como sugerido em (10) e sintetizado em (11):
Há exceções (algumas mencionadas em 10), mas ainda assim, prevalecem as regularidades e, de modo geral, há uma redução significativa das opções, como mostra (11), uma vez que os grafemas disponíveis para a grafia do /s/, reduzem-se a dois ou três. Outros casos, no entanto, não permitem que sejam elencados contextos de distribuição. No caso das fricativas palatais, /ʃ/ e /ʒ/, para as quais os grafemas <x>/<ch> e <j>/<g>, respectivamente, estão disponíveis no sistema, a concorrência pode ser minimizada apenas pela regra contextual, que define o uso de <g> com valor de /ʒ/, antes de vogal coronal [-posterior] /e/, /ɛ/ e /i/.
AS CATEGORIAS PARA ANÁLISE DOS ERROS (ORTO)GRÁFICOS
Com base nessas breves considerações sobre o funcionamento do sistema fonológico e ortográfico e na premissa de que o principal insumo para a produção das escritas alfabéticas iniciais é o conhecimento fonológico, entende-se que é possível, após a exposição das categorias para classificação dos erros, proceder à apresentação dos dados. O quadro em (12) explicita os critérios utilizados na pesquisa para que fosse possível chegar à proposição de três grandes categorias capazes de refletir a natureza do erro.
As três grandes categorias caracterizadas em (12) são desdobradas em subcategorias, conforme mostram os quadros a seguir, em (13), (14) e (15). Note-se que os quadros não são exaustivos, mas trazem os principais tipos para cada categoria.
Os tipos de erros fonológicos e seus respectivos exemplos ilustram a proposta para categorização. Os asteriscos correspondem àqueles tipos de erros interpretados como decorrentes de aspectos fonológicos, mas que, pela própria natureza do processo, isto é, por efeito das diversas forças em interação no sistema de escrita, revelam também efeitos de outros fatores.
As soantes palatais, /ʎ/ e /ɲ/, são consoantes que não faziam parte do sistema consonantal latino e foram introduzidas no português durante o período arcaico, a partir de mudanças fônicas ocorridas na passagem do latim para o português. Para Silva (1996), a lateral palatal derivou de sequências tais como ‘li’, ‘lli’, ‘cl’, ‘gl’, e ‘pl’, por processos amplos de palatalização; e a nasal, da sequência ‘ni’. Todos os metaplasmos observados em relação às soantes palatais ocorreram exclusivamente na posição intervocálica, o que explica a restrição posicional observada, uma vez que essas consoantes somente são produzidas dentro das palavras. Formas iniciadas por <nh> e <lh> são verdadeiras exceções, verificadas apenas em alguns poucos empréstimos que, de modo geral, recebem uma vogal epentética, como ilustram os exemplos [i]nhoque e [li]ama, para nhoque e lhama, respectivamente.
Soantes palatais são de aquisição mais tardia, em se considerando o desenvolvimento da fala e estão sujeitas a processos fonológicos que se assemelham àqueles observados na diacronia (MATZENAUER, 2000). Miranda (2012 e 2014), ao estudar as escritas iniciais, também verificou erros nas grafias das crianças, os quais corroboraram a ideia de que soantes palatais são segmentos complexos13 e que este é motivo por que as grafias são tão variadas nas escritas iniciais, apesar de o sistema ortográfico apresentar uma relação biunívoca entre as soantes palatais e os respectivos grafemas, <lh> e <nh>. Assim, o complicador ortográfico, neste caso, parece ser o uso do dígrafo com ‘h’ e não as relações múltiplas características do sistema. Portanto, ao mesmo tempo que erros como palaso ou paliaso para palhaço, refletem processos da diacronia e da aquisição da fonologia, grafias como miha para minha e finho para filho revelam, além da complexidade fonológica, uma dificuldade em relação ao uso desse tipo de dígrafo.
No caso dos erros envolvendo as vogais tônicas, a interpretação é a de que, do ponto de vista fonológico, tais grafias teriam estabilidade uma vez que a atuação de processos fonológicos, à exceção dos casos de nasalidade, é nula. No entanto, considera-se que o usuário tem uma percepção de que processos atuam sobre o sistema vocálico e de que há uma assimetria entre os planos gráfico e fônico no que concerne às vogais, uma vez que produz vogais altas nas posições pretônicas e postônicas (p[i]rigo, pér[u]la e part[i], por exemplo), mas utiliza os grafemas que correspondem às médias para grafá-los (p<e>rigo, pér<o>]la e part<e>). Logo, estende esta regra para contextos nos quais ela não se aplica. Trata-se, pois, de uma supergeneralização14 que acaba por produzir erros, especialmente nos momentos mais iniciais do desenvolvimento da escrita ortográfica. Já os erros na grafia dos ditongos fonológicos que, diferentemente dos fonéticos, apresentam relação estável entre o gráfico e o fônico, uma vez que o ditongo de palavras como peito e baile é produzido na fala, [‘pejtu] e [‘bajli], pode-se pensar que motivação para erros que envolvem a omissão dos grafemas referentes aos glides destes ditongos é a mesma postulada para os erros na grafia das vogais tônicas, ou seja, os usuários estendem a percepção dos ditongos fonéticos aos fonológicos como o fazem com as vogais átonas e tônicas.
Os erros de acento e de segmentação, por sua característica híbrida, também merecem atenção especial. Considerando a estreita relação entre as regras ortográficas e o funcionamento prosódico do acento na língua, Ney (2012 e 2018) analisou dados referentes à utilização do acento gráfico por crianças dos anos iniciais, a fim de estudar a relação entre o conhecimento prosódico das crianças e os usos que elas fazem do acento gráfico. 15Os resultados obtidos mostram que a utilização do acento pelas crianças é coerente com o funcionamento fonológico, mas, ao mesmo tempo, pôde ser observado o efeito de informações visuais (léxico ortográfico) em algumas escolhas gráficas, promovendo assim uma condição de hibridez aos dados referentes ao acento. Para este mesmo sentido, apontam os estudos de Cunha (2004 e 2010) que ao tratarem dos erros de segmentação, hipo e hipersegmentação, nos dados de escrita inicial mostrou o impacto incontestável da hierarquia prosódica nos casos de hipossegmentação, em que predominam as junções de clíticos com palavras lexicais (ugalho para o galho e dinovo para de novo), e seu efeito menos robusto, ainda que consistente, nos casos de hipersegmentação, uma vez que aí se pode observar o efeito do reconhecimento das formas clíticas por efeito das práticas escolares (com prou para comprou e a cho para achou).
A categoria ortográfica refere-se os erros que são motivados por complexidades que emanam do próprio sistema, sendo que, do ponto de vista fonológico, não haveria, em princípio, motivos para os erros, uma vez que não há complexidade fonológica envolvida, seja no que diz respeito ao segmento e tampouco à sílaba. Os exemplos e as subcategorias então no quadro em (14):
O quadro, em (14), está organizado em consonância com aspectos da ortografia já mencionados anteriormente. No caso específico da fricativa coronal, está sendo levada em conta a redução de opções explicitada nos quadros (10) e (11). Assim, caso a grafia fosse acim para assim ou fisero para fizeram, tais exemplos seriam caracterizados como decorrentes da não observância de regras arbitrárias. No que se refere às nasais, a posição de coda medial, é claramente regulada por regra contextual, <m> antes de <p> e <b> e nos demais caso <n>. Já em posição final, aspectos 16da morfologia flexional associados ao funcionamento do acento são fundamentais para a definição da regra, o uso de <ão> associado ao futuro do presente e à posição tônica. O estudo de Miranda (2018) sobre a grafia da nasalidade verificou que as estratégias utilizadas pelas crianças para registrar a nasalidade final ocorrem na seguinte ordem:
<am> grafado como <ão>, considerada uma troca motivada pela fonologia, uma vez que o que se produz na fala é um ditongo nasal;
<m> grafado como <n>; por não observância de regra contextual;
omissão da nasal, por efeito de padrões observados na fala;
<ão> grafado como <am>, considerada uma supergeneralização, pois há alta incidência nas formas gráficas da língua de grafia do <m> no final de palavras, visto que as formas do futuro do presente são escassas na fala dos brasileiros, sendo largamente substituídas pela locução ir + infinitivo (cf. CASTILHO, 1998).
O uso do <ão>, no corpus estudado, restringe-se às formas do presente (vão, estão e são), aos advérbios (tão, então) e algumas formas nominais (galpão, porão). Quanto às plosivas dorsais e às róticas, as regras contextuais podem ser inferidas com facilidade.
As grafias regidas por regras arbitrárias envolvem, além dos casos de concorrência entre grafemas para o registro das fricativas coronais, aquelas referentes às fricativas palato-alveolares com a competição entre <j> e <g> antes de vogais coronais ([-posterior]), <e> e <i>, ou ainda o uso do <h> em início de palavra.
A categoria fonográfica encerra os erros em que complexidades fonológica tampouco ortográfica são observadas. As subcategorias e os exemplos estão em (15):
A categoria fonográfica engloba erros em que parece haver alguma dificuldade com o traçado da letra ou com o mapeamento fonema-grafema que pode ocasionar problemas de sequenciamento, inserções ou omissões de letras e sílabas. Em todos esses casos não se encontram dificuldades de ordem fonológica ou ortográfica. Os casos referentes ao traçado estão relacionados especialmente às nasais em onset, ‘m’ e ‘n’, consoantes cujo desenho é muito similar, seja na letra cursiva seja na de forma, ou ainda aos pares ‘t’- ‘l’ e ‘b’- ‘d’.
No que diz respeito às metáteses, isto é, casos em que há mudança de posição de um segmento ou sílaba na cadeia linear, o estudo de Pachalski e Miranda (2019) mostra que existe motivação fonológica na maioria dos casos. Observa-se, no entanto, um conjunto residual de grafias com metátese nas quais não há justificativa fonológica para sua ocorrência, o que leva à proposta de que este tipo de erro esteja relacionado a uma falha relativa ao sequenciamento durante o processamento fonema- grafema. As inserções e omissões, assim como as metáteses desse tipo, estão sendo consideradas do mesmo modo.
OS DADOS DE ESCRITA: ASPECTOS METODOLÓGICOS
Os textos de que foram extraídos os erros (orto)gráficos analisados neste artigo integram o primeiro estrato do Banco de Textos de Aquisição da Linguagem Escrita, o BATALE (MIRANDA, 2001). O primeiro estrato do BATALE é composto por 2024 textos coletados entre os anos de 2001 a 2004, em duas escolas de Ensino Fundamental de Pelotas - RS: uma pública e outra particular. As escolas que participaram das coletas foram escolhidas porque ambas quiseram fazer parte do projeto de pesquisa. As duas instituições estavam localizadas na área central da cidade e apresentavam projeto pedagógico semelhante para os anos iniciais. Diferenciavam-se pelas características instrucionais dos pais ou responsáveis, sendo predominante, na escola particular, o nível médio completo ou a formação universitária e, na pública, o ensino fundamental (MIRANDA, 2017).
As coletas foram realizadas por integrantes do Grupo de Estudos sobre Aquisição da Linguagem Escrita (GEALE) na sala de aula, a partir de oficinas de produção textual criadas exclusivamente para a pesquisa. As crianças participantes cursavam, à época das coletas, os anos iniciais do ensino fundamental. Após a coleta de dados, os textos foram digitados, exatamente como haviam sido escritos pelas crianças, e digitalizados. O procedimento seguinte foi a extração de todas as grafias não convencionais, as quais foram inseridas em um programa criado no Access17, especificamente para a pesquisa.
Neste estudo, serão apresentados os dados referentes às quatro primeiras séries. 18O total de textos coletados está explicitado em (16).
Em (16) tem-se uma informação sobre a distribuição do número de textos por série e observa-se que a distribuição no estrato é de 55% na pública e 45% na particular. Miranda (2017: 43) mostra o resultado da distribuição dos erros por escola e por série, levando em conta o número de palavras grafadas nos 2024 textos e o resultado mostra que há um aumento significativo de palavras grafadas na segunda série, em se comparando à primeira, e que em todas as séries o percentual de erros da escola pública é maior, mas em ambas as escolas este percentual decresce na medida em que avança a escolaridade. A tabela com essas informações está em (17).
A seguir serão presentados os resultados obtidos tendo como guia as categorias antes apresentadas.
UM OLHAR PARA OS DADOS COM BASE NAS CATEGORIAS PROPOSTAS
Nesta seção, a computação dos erros será apresentada por série e por escola, de acordo com as três grandes categorias propostas: erros fonológicos, mostrando em separado aqueles referentes à segmentação não convencional e à acentuação, erros ortográficos e erros fonográficos. Em (18), tem-se uma distribuição geral por escola.
No Gráfico em (18), referente à computação de aproximadamente 24 mil dados, 69% dos erros foram produzidos pelas crianças da escola pública e 31%, da particular, conforme mostram resultados expressos em Miranda (2017). A distribuição do tipo de erro, no entanto, é muito similar em ambas as escolas, tendência que já vinha sendo observada em estudos anteriores desenvolvidos a partir de amostras do mesmo estrato (MIRANDA, 2013a, 2017 e 2018). Nota-se que há pequena variação entre as escolas, especialmente no que diz respeito aos erros de segmentação não convencional, com índices menores na escola particular, e aos erros de acentuação, com índices menores na pública.
A seguir são apresentados, em maior detalhe, os resultados dos erros de base fonológica. Ainda que em (13) segmentação e acento sejam apresentados como motivados pela fonologia, pelas justificativas ali apresentadas, os gráficos seguintes fazem menção apenas aos erros que dizem respeito ao segmento, à sílaba e às marcas próprias da fala observadas. O tratamento dos casos de segmentação e acento excederiam o escopo deste artigo.
Em (19) e (20), os gráficos mostram a distribuição dos erros fonológicos por série e por escola. Nesta computação foram levadas em conta as três categorias principais, a saber, segmental (vogais, consoante e semivogais), prosódica (encontros consonantais, codas e nasalidade) e aqueles dados relacionados à fala (apagamento do -s final, marcador de plural; apagamento do -r de infinitivo; e epêntese de ‘i’ em antes da fricativa de final de palavra, como em feiz, por exemplo). No caso dos erros fonológicos, os números absolutos mostram uma relação 65% para a pública e 35% para a particular, mas, quando analisados internamente, a mesma tendência observada em (18) se mantém.
O primeiro aspecto que chama atenção nestes resultados é a similaridade entre os dados das duas primeiras séries das escolas estudadas. Da segunda série da escola pública em diante, nota-se um índice maior de erros relacionados à fala, mas vale a pena ressaltar que se trata do mesmo tipo de erro (-s de plural, -r de infinitivo e inserção de ‘i’). A diferença principal é que não se observa, na escola pública, a diminuição dos erros na medida em que as séries avançam. O predomínio nas duas amostras é de erros segmentais, seguidos daqueles referentes às sílabas complexas e, por último, em menor quantidade os erros relacionados à fala. No grupo dos erros segmentais o predomínio, em ambas as escolas, é de erros envolvendo as vogais. A maior incidência recai sobre as grafias das vogais átonas, dados que são ilustrados em (21):
O texto escrito por um aluno de 1ª série da escola pública traz vários casos de alçamento da vogal átona final (se, fosse) e também da pretônica (seria, comida). Dados como este são encontrados em todas as séries estudadas. No exemplo a seguir, em (22), produzido por uma aluna da segunda série, outros exemplos de erros referentes às grafias das vogais, podem ser observados.
Observa-se em (22) a ocorrência de abaixamento da vogal tônica e da pretônica (perfume e fugiu), tipo de erro encontrado em menor escala em se comparando aos alçamentos. Tais dados são interpretados como casos de supergeneralização de regra ortográfica, mas derivam de uma motivação fonológica à medida que estão sendo associados ao tipo de fenômeno que atua sobre as vogais átonas, por efeito da neutralização. Ainda no exemplo tem-se um caso de grafia da soante palatal na qual o grafema utilizado é o <li> para registrar a consoante /ʎ/. Estudos sobre a grafia das soantes palatais desenvolvidos por Miranda (2012 e 2014) discutem a complexidade interna deste segmento em termos fonológicos como a possível causa para a ocorrência de erros.
Quanto aos erros motivados por aspectos da prosódia, a nasalidade e os encontros consonantais têm sido foco de análise, pois claramente oferecem obstáculos às crianças uma vez que a segmentação do sinal acústico, conforme mostraram A.M. Liberman et alii (1967), não corresponde diretamente ou de modo facilmente determinado à segmentação do nível fonêmico, em vez disso as unidades fonêmicas são codificadas em unidades maiores, aproximadamente do tamanho da sílaba. Os estudos referentes às grafias de estruturas CVC, na aquisição da escrita têm enfocado especialmente a nasalidade, uma vez que é notória a dificuldade das crianças nas suas escritas alfabéticas iniciais para registrá-la. Abaurre (1988) chama atenção para a incidência de erros nas escritas iniciais e aponta para uma relação entre este tipo de erro e a representação fonológica da nasalidade, uma vez que se trata de tema que suscita discussões do ponto de vista da fonologia22. Os exemplos em (20), referentes à palavra mãe escrita como mei ilustram a complexidade da grafia.
Nos dados, o tipo de erro que predomina em todas as séries e nas duas escolas para a estrutura CVC é, justamente, referente ao registro CVN, que por sua complexidade, apresenta uma grande variedade de formas. Em (23) tem-se uma amostra das soluções encontradas pelas crianças quando se deparam com a tarefa de representar a nasalidade.
A segunda categoria proposta é referente às complexidades inerentes ao sistema ortográfico, conforme referidos em (14). A não observância de regras contextuais e arbitrárias são responsáveis por uma quantidade grande de erros que, se não forem adequadamente trabalhados nas práticas escolares, continuarão presentes nas escritas produzidas posteriormente. A distribuição em (23) mostra os resultados obtidos a partir da análise de pouco mais de cinco mil dados desta categoria extraídos dos textos que constituem o corpus deste estudo.
Na mesma direção do que já foi dito a respeito dos erros fonológicos, os ortográficos se distribuem, em termos de número de ocorrências, também em uma proporção de 2 para 1 em se comparando as escolas pública e particular. O movimento na distribuição observado nas três primeiras séries mostra que na primeira, em ambas as escolas, há maior incidência de erros arbitrários e, nas duas séries posteriores, há mais erros contextuais. A presença de erros contextuais mostra que as regras de conversão para leitura (grafema-fonema) não estão sendo observadas pelas crianças, à medida que sua aplicação minimizaria erros deste tipo. Na terceira série da escola pública há uma incidência ainda maior desses erros em se comparando aos arbitrários. A tendência que se mostra similar entre as escolas até o terceiro ano, em termos da distribuição desses tipos de erro, inverte-se na quarta quando se observa uma diminuição na escola particular, mas não na pública.
A expectativa, em termos de avanço nas séries, é a de que os erros contextuais diminuam significativamente em consequência do ensino sistemático da ortografia e das práticas mais constantes de leitura e escrita promovidas pelo processo de escolarização. Para obter uma resposta, a fim de verificar se tal expectativa se confirma, seria necessária a computação de todos os contextos (erros e acertos). Isso, porém não pode ser feito em razão das características das amostras que contêm apenas o levantamento dos erros.
A grafia do /s/, como seria de se esperar por causa da quantidade de possibilidades para o registro e também pela frequência, é a responsável pela maior parte dos erros do tipo ortográfico analisados. Já os erros nas grafias das fricativas palato-alveolares, /ʃ/ e /ʒ/, foram encontrados em menor quantidade na amostra, o que se deve, possivelmente, à baixa frequência desses fonemas na língua. Seria esperada uma incidência maior, uma vez que a complexidade ortográfica se faz presente sendo a escolha do grafema, para esses casos, regulada por regra arbitrária.
De acordo com Viaro e Guimarães-Filho (2007), as consonantes nas sílabas CV apresentam a seguinte ordem em termos de frequência na língua: /t k d m s ɾ n p b z f ʒ g v R ʃ ɲ ʎ/. Esse ordenamento mostra que as fricativas palato -alveolares têm baixa frequência e que a preferência pelas consoantes [-sonoro], ou surdas, em se comparando às suas contrapartes [+sonoro], não se confirma em relação a elas, sendo o /ʒ/ mais frequente que /ʃ/.
A seguir, em (24), são apresentados os dados referentes aos erros na grafia do /s/, considerando-se o funcionamento de regras contextuais e arbitrárias, anteriormente explicitado. Tais dados equivalem a aproximadamente 50% dos erros computados como ortográficos. Se, na distribuição dos erros fonológicos, há um certo equilíbrio entre as escolas comparadas, à exceção daqueles referentes à fala, a análise dos erros para a grafia do /s/ revela diferença entre as escolas, como pode ser observado nos gráficos apresentados a seguir:
Os gráficos apresentam os números absolutos para que se possa observar os movimentos ocorridos à medida que avançam as séries. Antes, porém, é importante fazer referência à tabela (17) que traz informações concernentes ao corpus deste estudo, com resultados acerca da computação do número de palavras grafadas. Os números em (17) mostram que, na primeira série, a quantidade de palavras é semelhante entre as escolas, já nas segunda, terceira e quartas séries há mais palavras escritas na amostra da escola pública, em torno de 10%, 5% e 20% a mais, respectivamente. Ainda assim, tal diferença não minimiza o que se pode observar em (24). Na primeira série o número de erros é muito similar, mas nas séries subsequentes a incidência de erros é sempre maior na escola pública em uma proporção que não se poderia justificar pelo número de palavras grafadas. Nota-se ainda que não há curva de descida para os erros contextuais nos dados da escola pública.
O exame do tipo de erros para a grafia do /s/, no detalhe, mostra novamente que a maior incidência de erros recai, em ambas as escolas, para o mesmo tipo de erro, como mostra o quadro a seguir, em (25).
Dos erros computados, as trocas referidas em (25) correspondem a 64% e 72% dos erros de /s/ nas escolas particular e pública, respectivamente. Chama atenção, em primeiro lugar, a preferência pelo uso do grafema <s> e, especialmente nas duas primeiras situações mencionadas no quadro, observa-se que o trabalho com o exame de contextos poderia auxiliar na superação desse tipo de erro, o que não seria suficiente, no entanto, para dar conta dos casos de troca do <c> pelo <s>, que se verifica no corpus, na maioria dos casos, na posição de início de palavra e que, assim como os dois últimos tipos, <s> por <c> e <ss> por <c>, exigem um trabalho de ampliação e consolidação do léxico ortográfico.
Ainda sobre os erros ortográficos vale mencionar a incidência de erros na grafia da nasal pós-vocálica, isto é, a troca de <m> por <n> e vice-versa em posição de coda. Apesar de se tratar de uma regra claramente definível em termos de contexto, 24% dos dados categorizados como contextuais são relativos a essa grafia, cujos erros se estendem ao longo das quatro séries analisadas. Os erros seguem o padrão já verificado e exposto neste artigo para os outros erros apresentados, ou seja, incidência sempre maior na escola pública, mas com resultados em termos das escolhas gráficas que são muito semelhantes em se comparando as duas amostras. Há uma leve preferência pelo uso do <m> em vez do <n> na escola pública e do <n> em vez do <m>, na particular.
Quanto aos erros fonográficos, os principais tipos encontrados nos dados estudados dizem respeito ao traçado das nasais e à omissão de letras ou sílabas. Esta categoria de erros enquadra aquelas grafias nas quais não se verifica complexidade fonológica e tampouco ortográfica, mas que se justificam por questões relacionadas ao processamento fonema-grafema, ou ainda por dúvidas referentes ao traçado de letra, o que é muito comum nas etapas iniciais do desenvolvimento da escrita alfabética. O exemplo em (26) ilustra esses erros e também os outros que foram discutidos ao longo deste artigo.
As marcações no texto indicam as grafias que, pela proposta apresentada, são interpretadas como fonográficas. Trata-se de um texto de primeira série, mas os erros fonográficos são encontrados em todas as séries estudadas, ainda que, importante salientar, passem a ser mais episódicos. Os estudos desenvolvidos pelo GEALE consideram que cada texto produzido por cada uma das crianças é uma fonte de indícios que se manifestam via erros e que permitem ao pesquisador e ao professor, desde que munidos de teorias sobre a língua e sobre os processos de aprendizagem, reconstruir as possíveis formas de pensamento que engendram as produções heteróclitas próprias do desenvolvimento.
CONSIDERAÇÕES FINAIS
Neste artigo, cujo objetivo foi responder perguntas referentes aos conhecimentos que subsidiam as escritas iniciais, a fim de entender as hipóteses formuladas pelas crianças para que se possa pensar a respeito da natureza dos erros produzidos por elas, foi possível observar a influência de duas fontes principais: o conhecimento linguístico e o conhecimento do sistema de escrita, especificamente fonológico e ortográfico.
O sistema fonológico e ortográfico da língua foram as bases que tornaram possível analisar um grande conjunto de dados extraídos de textos produzidos por crianças em fase inicial de escolarização. Às categorias denominadas fonológica e ortográfica, foi associada mais uma, a fonográfica, que auxiliou na compreensão de erros cuja vinculação não pode ser estabelecida com o sistema fonológico e tampouco com o ortográfico.
Entende-se que um estudo como este, que se propõe a desenvolver uma análise psicolinguística, pode oferecer subsídios para a interpretação não só do conhecimento de língua que emerge dos erros, mas também para que se reflita sobre o próprio funcionamento fonológico da língua alvo. Além disso, oferece subsídios às práticas pedagógicas, à medida que se dispõe a explorar a fundo as relações entre fonemas e grafemas, constitutivas do sistema ortográfico.
Os resultados evidenciaram que, independentemente de a escola ser pública ou particular, as crianças operam a partir de princípios linguísticos e de conhecimentos já desenvolvidos sobre o sistema de escrita. Observou-se o predomínio de erros denominados fonológicos, isto é, relacionados à complexidade segmental ou prosódica, em todas as séries estudadas. Os erros motivados por aspectos da ortografia envolvem principalmente a grafia do /s/, dentre todas a mais complexa em termos ortográficos. O exercício de análise das relações fonema-grafema realizado no artigo aponta caminhos para uma ação didática que priorize a exploração do funcionamento do sistema, a fim de que o trabalho possa ser direcionado na sala de aula para uma aprendizagem significativa e em consonância com as regras da ortografia. A categoria denominada fonográfica mostrou-se importante no estudo, pois chama a atenção para uma dimensão do processo de aquisição da escrita muitas vezes deixada de lado, qual seja, a necessidade de um trabalho sistemático com o alfabeto (nomes e traçados de letras).
De modo geral, os resultados mostram que há diminuição do número de erros com o avanço dos anos escolares e que, embora haja diferença na quantidade de erros em se comparando as escolas, a qualidade dos erros é a mesma para os dois grupos examinados.