Introdução
Durante as últimas décadas, tem siso perceptível a mudança nas estruturas de comunicação e interação social que vivemos, sendo permeadas por avanços científicos e tecnológicos, permitindo o surgimento de um novo estilo de sociedade e uma nova cultura. Essa nova forma de organização social assenta em uma relação em rede, ou seja, é baseada em redes de comunicação digital, nas quais são utilizadas as Tecnologias de Informação e Comunicação (TIC). Para Castells e Cardoso (2002), as redes vão além dos limites históricos e geográficos e estão flexibilizando e descentralizando o compartilhamento de informações e a tomada de decisões, possibilitando a ampla disseminação de informações e de conhecimentos.
Esse movimento faz nascer uma nova cultura, a cultura digital, que tem forte atratividade em todas as classes sociais. Nela, as pessoas passam a interagir nos ciberespaços, e o uso de tecnologias torna-se o novo modelo de comunicação instantânea, onipresente e de representatividade global (NUNES et al., 2014).
A cultura digital encontrou na educação um campo fértil e cheio de possibilidades, principalmente a educação a distância, com o uso dessas tecnologias por meio de Learning Management Systems (LMS). Esses sistemas, além do suporte tecnológico necessário para o ensino a distância, produzem uma grande quantidade de dados por meio dos registros e logs do sistema (PSAROMILIGKOS et al., 2011).
Esse cenário propõe a criação de Big Data, que servem como grandes repositórios de dados, gerados a partir das mais diversas interações, aptos a serem processados, armazenados e analisados (NAJAFABADI et al., 2015). No entanto, é necessário considerar falhas, segurança e controle de acesso e manuseio desses dados (KAMBATLA et al., 2014).
Entre os setores sociais que se alinharam ao Big Data está a educação, cujos sistemas de gestão de informações de aprendizagem tornam-se importantes ferramentas capazes de modelar, prever e aprimorar a tomada de decisões em relação à melhoria dos processos de ensino e de aprendizagem. Dito isso, em 2011 surgiu a Learning Analytics (LA), que, segundo a Society for Learning Analytics Research (SoLAR), “[...] é a medição, coleta, análise e relatório de dados sobre os alunos e seus contextos, para fins de compreensão e otimização da aprendizagem e dos ambientes em que ela ocorre [...]” (SOLAR, 2011, p. 3, tradução nossa).
Nesse campo, nos últimos anos, houve uma expansão de pesquisas e práticas, surgindo a necessidade de estabelecer critérios para análise de dados com rigor científico e metodológico, para garantir o cumprimento dos preceitos éticos da pesquisa. Portanto, este artigo visa esclarecer a imprescindibilidade da conexão entre o campo da Educação, a LA e as normas éticas de pesquisa no Brasil.
Dessa forma, o presente manuscrito caracteriza-se como um ensaio bibliográfico e está organizado da seguinte forma: inicialmente, situamos a abordagem histórica das normas legais de ética em pesquisa no Brasil; na sequência, abordamos o campo da LA, por meio de seu conceito e sua abordagem e a combinação necessária da abordagem ética no tratamento da analítica da aprendizagem.
Normas de ética em pesquisa no Brasil
A “ética” tem origem linguística na Grécia, vinda da palavra grega Ethikos, que significa “aquilo que pertence aos bons costumes” ou aquilo que pertence ao Ethos, que significa “bons costumes” ou “portador de caráter”, e está relacionada com costumes e maneiras dos tempos gregos antigos (GRAMÁTICA, 2021, n.p.). Para uma visão histórica da revisão ética, pretendemos entender os princípios éticos em documentos como o Código de Nuremberg, a Declaração de Helsinque, as Diretrizes Internacionais Propostas para Pesquisa Biomédica em Seres Humanos e o Relatório Belmont (CASTILHO; KALIL, 2005; SARDENBERG et al., 1999). No Brasil, podemos destacar o Código de Ética Médica Brasileiro, a Resolução No 001/1988 (BRASIL, 1988) e a Resolução No 196, de 10 de outubro de 1996, do Conselho Nacional de Saúde - CNS (BRASIL, 1996).
É fundamental ressaltarmos que todas essas normas éticas foram observadas para a pesquisa no campo das ciências biomédicas e que a discussão da ética em pesquisa, relacionada ao modelo biomédico implantado e justificado como viável para outras áreas, está cada vez mais em expansão, porém implicou diferentes olhares sobre a resolução ser direcionada para uma única ciência e não ver as particularidades de outros campos do conhecimento, como as Ciências Humanas e Sociais (CHS), por exemplo.
Nessa perspectiva, surge a Associação Nacional de Pós-Graduação e Pesquisa em Educação (ANPEd), que é uma associação que agrupa os Programas de Pós-Graduação em Educação, pesquisadores, professores e alunos vinculados a esses programas e demais pesquisadores da área, a fim de fortalecer e fomentar a pesquisa na área, afinal, o campo das CHS é amplo e diversificado, exigindo discussões nas quais a grande área é responsável, assim como diversos pesquisadores têm desenvolvido pesquisas com implicações variadas. E a ética em pesquisa entra nesse cenário, com uma ampliação das discussões, tanto na perspectiva prática bem como nos fundamentos e nas suas implicações (MAINARDES; CURY, 2019).
Brooks, Te Riele e Maguire (2017) reforçam esse entendimento ao descrever que mudanças legislativas em alguns países exigiram que os pesquisadores prestassem mais atenção em como gerenciar, armazenar e organizar dados, utilizando novas metodologias de pesquisa, o que criou novos desafios éticos. Dessa maneira, do ponto de vista das CHS, há grande diversidade e complexidade bem como investigações posteriores que vão além do que se encontra nas pesquisas biomédicas.
Internacionalmente, existem associações que já possuem regulamentações específicas para a área da Educação, como o Código de Ética da American Association for Educational Research (AERA, 2017), as normas da British Educational Research Association (BERA, 2018), da Scottish Educational Research Association (SERA, 2020), além do Código de Ética da German Educational Research Association (GERA, 2010). Todas essas entidades visam a conduta ética na área da Educação, bem como buscam a conscientização sobre os problemas éticos que permeiam a pesquisa científica.
No Brasil, em 2012, surgiu a Resolução No 466, de 12 de dezembro de 2012, do CNS (BRASIL, 2013), marcada notadamente pela luta para desvincular a pesquisa em CHS das Ciências Médicas, dada a natureza das pesquisas, porém nem todas as particularidades da área foram plenamente atendidas (BRASIL, 2013) e, mais recentemente, a Resolução No 510, de 7 de abril de 2016, que regulamenta os “[...] procedimentos metodológicos que envolvam a utilização de dados obtidos diretamente dos participantes ou de informações identificáveis ou que possam oferecer riscos aos mesmos” (BRASIL, 2016, p. 44). Apesar dos avanços dessa regulamentação, a centralização, a burocratização e a inadequação da “Plataforma Brasil”, sistema de submissão à análise dos Comitês de Ética em Pesquisa (CEP), vinculados ao Comitê Nacional de Ética em Pesquisa (Conep), ainda se torna um obstáculo para a valorização das pesquisas e dos projetos na área de CHS (DUARTE, 2017).
Diante disso, Amaral Filho (2017) reafirma a necessidade de enfrentar o imperialismo bioético, no qual as CHS são socialmente desacreditadas, devendo seguir os preceitos impostos por outras ciências, negligenciando os conhecimentos e princípios das CHS. Além disso, essa proposta deve ser iniciada durante o próprio processo de formação, nos níveis de Graduação e Pós-Graduação, com o estudo da ética em pesquisa sobre como abordá-la antes, durante e depois da pesquisa (NUNES, 2017). Da mesma forma, a pesquisa científica baseada na LA também é chamada a participar dessa discussão e vincular aspectos éticos em seu processo investigativo, como será discutido na seção a seguir.
Learning Analytics e ética: uma combinação necessária
Muitas vezes, é difícil identificar a ligação entre as informações e concluir sobre quais elementos podem ter afetado de alguma forma a aquisição de conhecimento do aluno. Quando o processo educacional é mediado por tecnologias digitais, essa dificuldade, na maioria das vezes, está relacionada à enorme quantidade de dados disponíveis sobre os alunos por meio de sistemas computacionais. É nesse contexto que surgem as soluções tecnológicas, que permitem escanear grandes quantidades de dados, analisá-los e encontrar conexões entre eles que, em muitos casos, não são identificadas pelas pessoas.
O nome dado a essa solução tecnológica foi Analítico (do inglês Analytics), que permite “[...] avaliar ações passadas e estimar o potencial de ações futuras, de forma a tomar melhores decisões e adotar estratégias mais eficazes como organizações ou indivíduos” (COOPER, 2012, p. 3, tradução nossa). A palavra Analytics tem origem na área empresarial, como Business Analytics ou Business Intelligence, sendo uma técnica para reunir, armazenar e analisar grandes quantidades de dados, para auxiliar a tomada de decisão das organizações, de forma mais eficiente (BALLARD et al., 2006).
Na área educacional, essa expressão foi adaptada para Academic Analytics (AA) e, posteriormente, para Learning Analytics (NUNES; NOBRE; SAMPAIO, 2013). Não apenas a denominação, mas também o conceito foi adaptado à realidade educacional, pois a LA está voltada ao aluno e ao seu aprendizado, avaliando o aluno de forma mais afirmativa, com base nas interações e nos registros de desempenho da sua vida acadêmica (LONG; SIEMENS, 2011). Dito isso, Ali et al. (2012) e Nunes (2016) apontam que a LA combina princípios de diferentes áreas como Computação, Estatística, Ciências Sociais, Pedagogia, Psicologia e Educação. Além do conceito de LA proposto pela SoLAR (2011), demonstrado anteriormente, Johnson, Adams e Cummins (2012, p. 22, tradução nossa) afirmam que esse campo se refere “[...] à interpretação de uma ampla gama de dados coletados de alunos ou produzidos por eles para avaliar o progresso acadêmico, prever o desempenho futuro e identificar problemas potenciais”.
Dentre as áreas de estudo com as quais a LA estabelece vínculo, destaca-se a de avaliação educacional, pois ambas buscam estimar características latentes (variáveis não observadas) por meio de um conjunto de variáveis observadas em um universo de respostas dadas a perguntas (PONTES JUNIOR et al., 2014). Para Elias (2011), no entanto, a LA diverge, principalmente, pela ênfase no uso de sistemas computacionais que permitem diminuir o atraso entre a coleta e o uso da informação, permitindo, por exemplo, que as variáveis observadas em uma disciplina em andamento, juntamente aos dados históricos, podem, por um lado, ser convertidas em benefícios ainda no curso dessa disciplina (ELIAS, 2011). Os processos de avaliação tradicionais, por outro lado, normalmente usam os resultados de um semestre para fazer melhorias no próximo.
As diferenças entre as áreas também exigem um olhar diferenciado quanto aos procedimentos éticos a serem observados em cada uma. Em geral, quando um aluno está sendo analisado pelos processos avaliativos tradicionais, ele sabe que está sendo observado e que suas respostas vão gerar um perfil de análise relacionado aos aspectos respondidos. Na LA, por sua vez, é possível criar esse perfil de aluno por meio de um rastreamento silencioso de suas ações naturais de interação com o ambiente e com outras pessoas envolvidas nos processos de ensino e de aprendizagem. Assim, é importante que sejam criados mecanismos que permitam a todos que estão sendo monitorados saber que estão sendo observados e como está ocorrendo esse rastreamento.
É uma área de pesquisa que tem obtido bons resultados em indicadores educacionais. No entanto, por ser uma área de estudo recente, ainda existe, principalmente na América Latina, incluindo o Brasil, a necessidade de ampliar o volume de pesquisas relacionadas a esse assunto (NUNES, 2015; NUNES; NOBRE; SAMPAIO, 2013). Essa solução tecnológica pode, por conseguinte, trazer colaborações significativas para melhorar os resultados educacionais brasileiros. Junto a isso, há o entendimento de que os envolvidos nos processos de análise são respeitados e informados sobre todos os aspectos envolvidos na análise.
A LA, como dito anteriormente, estuda os dados acadêmicos dos alunos, por isso é necessário embasar essa pesquisa em aspectos éticos, especialmente porque “[...] as instituições têm a obrigação de proteger os dados dos alunos na plataforma institucional e informá-los sobre possíveis riscos quando os dados do levantamento são enviados para fora dos limites da jurisdição nacional” (BELLINI et al., 2019, p. 136, tradução nossa). Além disso, os professores devem conhecer sua responsabilidade se quiserem usar dados para fins específicos (PARDO; SIEMENS, 2014).
Nesse contexto, em 2016, a União Europeia foi a primeira a desenvolver regulamentações específicas para a proteção de dados digitais, por meio do Regulamento Geral de Proteção de Dados (RGPD). Esse regulamento - European Union (EU) 2016/679 - estipula regras sobre a proteção, o tratamento e a livre circulação de dados pessoais de pessoas da União Europeia, sejam de empresas e de organizações, sejam de indivíduos, de forma a defender o direito à proteção de dados pessoais (EUROPEAN UNION, 2022).
No cenário latino-americano, diversos países já possuíam algumas iniciativas de políticas para proteção de dados pessoais antes mesmo da criação da RGPD. Essas medidas, entretanto, foram atualizadas com base nos padrões da lei europeia, com objetivo de aumentar a segurança e a privacidade dos usuários. Nesse sentido, o Chile foi o pioneiro do continente, uma vez que implementou sua primeira Lei de Proteção de Dados Pessoais, em 1999; seguido pela Argentina, em 2000. Uruguai, México, Peru, Costa Rica, Colômbia, Nicarágua e República Dominicana publicaram leis de proteção de dados pessoais entre 2008 e 2013. Outros países (Bolívia, Brasil, Equador, Honduras, Panamá e Paraguai) emitiram suas leis após 2016 ou possuem projetos de legislação em tramitação (SALAS-PILCO; YANG, 2020).
Mais atualmente, no Brasil, a Lei Nº 13.709, de 14 de agosto de 2018, entrou em vigor em agosto de 2020, foi nomeada Lei Geral de Proteção de Dados Pessoais, inspirada na GDPR, e dispõe sobre a regulamentação da política de proteção e privacidade de dados pessoais, inclusive modificando alguns artigos do Marco Civil da internet (BRASIL, 2018). Embora, o tratamento de dados é realizado para fins acadêmicos, os pesquisadores devem observar os princípios, tais como: a necessidade de consentimento para o uso dos dados pelos envolvidos, a transparência, garantir o anonimato das pessoas, resguardar a vida ou a integridade física dos envolvidos, garantir a prevenção de fraudes e a segurança do titular, sempre em prol do desenvolvimento científico (BRASIL, 2018).
Nessa perspectiva, Kay, Korn e Oppenheimer (2012), Rodríguez-Triana, Martínez-Monés e Villagrá-Sobrino (2016), Sclater (2014) e Slade e Prinsloo (2013), por exemplo, preocuparam-se em desenvolver diretrizes sobre ética para a análise da aprendizagem, a fim de permitir um amadurecimento científico desse campo de estudo. Para este momento, ancoramos nossa abordagem nos princípios propostos por Sclater e Bailey (2015), considerando que estes englobam todas as razões mencionadas anteriormente. O documento foi chamado de Code of Practice for Learning Analytics [Código de Prática para Learning Analytics], descrevendo nove princípios que as investigações que usam LA devem seguir, com base em perspectivas legais, éticas e logísticas, como pode ser visto na Figura 1. Cada um dos nove princípios é tratado sob a perspectiva de coleta, de tratamento, de análise e de divulgação dos dados, garantindo integridade e ética nesse processo bem como transparência e privacidade.

Fonte: Elaborada pelos autores com base em Sclater e Bailey (2015).
Figura 1 Os nove princípios do Code of Practice for Learning Analytics, com base nos aspectos legais, éticos da análise de dados
A responsabilidade (responsibility) centra-se no anonimato da análise, da retenção, da administração e da intervenção com base nesses dados bem como na sua utilização legal, ética e eficaz; transparência (transparency) e consentimento (consent) abordam a necessidade de informar os alunos sobre o propósito de usar a análise de aprendizagem onde seus dados são necessários, bem como permitir que eles deem seu consentimento para coleta e análise, e podem até optar por não permitir a divulgação de seus dados; a privacidade (privacy) determina que somente as pessoas envolvidas na pesquisa ou com acesso pela instituição possam ter acesso aos dados, evitando o compartilhamento; o princípio da validade (validity) exige que o pesquisador/professor tenha uma análise confiável, garantindo que ela seja utilizada em benefício dos alunos, a fim de melhorar os processos de ensino e de aprendizagem; o acesso (access) é uma garantia de que o aluno poderá acessar seus dados e corrigir imprecisões; a permissão para intervenção positiva (enabling positive intervention) refere-se às circunstâncias em que, com base na análise dos dados, deve haver intervenção, sempre com o objetivo de melhorar os processos de ensino e de aprendizagem, deixando claro que essa intervenção também pode ser humana e não digital; a minimização de impactos (minimizing impacts) afirma que a instituição deve estar atenta para tomar as medidas necessárias para que as intervenções por meio da LA não classifiquem ou rotulem de forma alguma os alunos, bem como evitem o reforço de atitudes discriminatórias ou mesmo o aumento dos diferenciais de classe social; e gestão de dados (sterwardship of data) trata de como deve ser a análise da aprendizagem de acordo com as políticas institucionais de dados, garantindo a conduta ética na gestão dessas informações, eliminando-as ou anonimizando-as, quando solicitado.
Estabelecendo as relações entre as diretrizes brasileiras (BRASIL, 2016, 2018) e o Code of Practice for Learning Analytics (SCLATER; BAILEY, 2015), podemos ter as seguintes prerrogativas:
A Resolução No 510/2016 (BRASIL, 2016), embora tenha sido uma iniciativa bem fundamentada, por tratar das normas aplicáveis às CHS, diferente do modelo biomédico, ainda apresenta diversas especificidades na área de Educação, cuja discussão nessa perspectiva é rasa, principalmente no que se refere à análise da aprendizagem.
A Lei Geral de Proteção de Dados Pessoais (BRASIL, 2018) tem diretrizes, como já mencionado, que se referem à pesquisa científica e que tem uma relação mais estreita com o Code of Practice for Learning Analytics (SCLATER; BAILEY, 2015), tendo em vista a responsabilidade do anonimato, transparência na forma de informar aos alunos/participantes que os ambientes virtuais nos quais eles podem estar inseridos fornecem dados e que esses dados podem ser utilizados em pesquisas científicas. Assim como a privacidade no acesso e na análise dos dados apenas para aqueles que estão realmente envolvidos no estudo.
É necessário alargar e adequar essas discussões éticas às características das diferentes abordagens de LA aplicadas a contextos educativos de ensino e de aprendizagem, permitindo ao professor tomar consciência da sua responsabilidade na recolha, na análise, na retenção, na administração e na intervenção de dados.
Por fim, os pesquisadores de LA devem ter em mente a complexidade da abordagem dessa técnica, porém as investigações devem ser claras, objetivas, cuja coleta e análise de dados estejam de acordo com as estruturas legais vigentes.
(In)Conclusões
No Brasil, embora exista uma legislação relacionada à ética em pesquisa e uma Lei Geral de Proteção de Dados Pessoais, a primeira ainda é muito voltada à realidade biomédica, enquanto a segunda não explora com profundidade a questão educacional, necessária para a análise da aprendizagem. Assim, fica clara a necessidade de um olhar mais voltado à realidade plural das CHS. Seria importante, portanto, que houvesse considerações na legislação brasileira específicas às necessidades de pesquisa em LA, de modo a garantir maior proteção aos respondentes e mais clareza na orientação aos pesquisadores. Uma boa forma de orientar a construção dessa padronização, portanto, seria tomar como base os princípios presentes no Code of Practice for Learning Analytics (SCLATER; BAILEY, 2015).
Outro aspecto relevante é a necessidade de formação de pesquisadores, principalmente no que diz respeito à Pós-Graduação, estimulando um ambiente de pesquisa e formação ética, permeando os diversos cursos e/ou disciplinas dos programas. Diante do exposto, com base nos conceitos e nas discussões apresentados, evidencia-se a necessidade de ampliar a relação da aprendizagem analítica com a ética em pesquisa, permitindo ao pesquisador atenção e cuidado na coleta, na análise, na intervenção e na divulgação desses dados, estando atento à característica de rastreabilidade presente em LMS, bem como com o crescimento do Big Data e disponibilização de informações.