Introdução
Os desafios àqueles que adentram na seara dos estudos relacionados a bios são enormes. Somos desafiados, constantemente, pois nos debruçamos sobre sistemas extremamente complexos e, por isso, difíceis de serem generalizados. Ao contrário das ciências duras, o status de lei científica ainda não foi alcançado por nenhuma hipótese das ciências biológicas. Tal fato se deve pelas inúmeras facetas dos fenômenos de matiz biológica. Mesmo não tendo alcançado status de lei, a grande área possui uma teoria central que a une e torna as ciências da vida uma área de conhecimento. Sendo assim, podemos considerar a Teoria da Evolução a partir dos pressupostos filosóficos de Thomas Kuhn (2020), como um paradigma central das ciências biológicas. A partir disso, podemos pressupor que, em diferentes campos de pesquisa das ciências biológicas, devemos gerar nossas hipóteses, criar nossos modelos e, acima de tudo, pensar na vida sob a luz da evolução, mas sempre nos preocupando com o rigor dos métodos.
A teoria da evolução tem, como objetivo central, compreender de que forma surgem e se mantêm novas variedades de seres vivos na natureza. Usamos o termo variedade no presente artigo, pois Darwin (1872) afirma que espécies são variedades bem-marcadas. A noção de espécie na obra A origem das espécies perde o caráter fixista e ganha um caráter maleável, pois é através de formas primitivas que podem surgir novas formas. Esse marco traz à luz uma discussão recorrente nas ciências da vida, discussão, essa, que pode ser expressada a partir do seguinte questionamento: Como devemos conceituar o que é uma espécie? O termo conceito tem sua origem no latim conceptus que, etimologicamente, significa conter completamente. Dessa forma, o conceito de espécie deveria abarcar, em sua totalidade, todas as diferentes formas de vida, desde os seres vivos unicelulares até os seres vivos multicelulares.
1 O problema do conceito unívoco de espécie
Partimos de, no mínimo, 20 conceitos distintos para categorizar o que seria uma espécie (QUEIROZ, 2007), e isso ocorre, principalmente, devido à complexidade dos diferentes arranjos dos seres vivos. Dentre os conceitos de espécie, o conceito biológico de espécie (CBE), proposto por Mayr (1977), parece ter uma boa aceitação, principalmente pelos zoólogos. Por definição, o CBE considera que espécies são grupamentos de populações naturais que se intercruzam e estão, reprodutivamente, isoladas de outros grupos. Dentro do CBE, um grupo de uma dada espécie é composto por uma população reprodutiva com potenciais reprodutivos que se intercruzam, assim sendo, compõem uma unidade ecológica em que interagem e dividem o ambiente com outras espécies, bem como possuem um patrimônio gênico que se intercomunica com seu grupo.
O indivíduo torna-se um meio temporário que contém uma pequena porção do patrimônio gênico total (MAYR, 1977). O CBE foi construído por meio de pesquisas que constataram que um recorte que leva em conta somente diferenças e semelhanças morfológicas são insuficientes para definir o que são espécies. Tal conceito ressalta que as espécies consistem em populações que são reais e que estão coesas internamente por intermédio do fluxo gênico.
O CBE delimita as espécies em um recorte temporal e espacial, pois se trata de um conceito horizontal de espécie. Podemos compreender tal conceito como biológico, pois ele tem sentido apenas em um mundo dotado de vida, de movimento, com propriedades de cruzamento, sendo que conceitos anteriores poderiam ser facilmente aplicados em objetos inanimados (QUEIROZ, 2005). Tal definição recebeu respaldo de diversos fundadores da síntese moderna da evolução, dentre eles, Julian Huxley e Theodosius Dobzhansky. O principal limite desse conceito é abarcar somente a reprodução sexuada e limitar a compreensão do surgimento dos híbridos na natureza. Cada grupo de organismos possui uma forma de vida complexa, que pode variar desde a forma de reprodução (assexuada e sexuada) até as relações necessárias com outros organismos. Devido a isso, parece bastante improvável que consigamos conceituar, através de um viés prático, o que é uma espécie.
2 Taxonomia e descrição de espécies: o problema da indução
Historicamente, a taxonomia, que é a área responsável por descrever novas espécies, utilizou, a priori, somente características morfológicas. Darwin (1872), já ressaltava que havia uma divergência muito grande entre os taxonomistas quando classificavam algum organismo como uma espécie. Um grupo deles poderia, segundo Darwin, facilmente classificar um organismo como espécie, enquanto outro poderia agrupá-lo como uma variedade. Caracteristicamente, podemos inferir que a taxonomia tradicional está baseada no método indutivo, pois é herdeira de uma característica descritivista (PEIRCE, 1970). Tal método consiste em uma operação mental, em que é estabelecida uma verdade universal ou uma referência geral que se baseia em dados singulares, seguindo a estrutura: caso – resultado – regra. Exemplificando, o raciocínio indutivo pode ser representado da seguinte forma:
Caso 1 – O Homo sapiens é mamífero.
Caso 2 – O Cephalorhynchus commersonii é mamífero.
Caso 3 – O Deltamys kempi é mamífero.
.... N Casos
Resultado – As espécies são placentárias.
Regra – Logo, todos os mamíferos são placentários.
No exemplo acima, podemos verificar o limite da indução ao chegarmos à conclusão (regra) de que todos os mamíferos são placentários a partir de um raciocínio indutivo que generaliza por meio de casos limitados. O limite do raciocínio indutivo está no fato de que a conclusão (regra) contém informações que as premissas (caso, resultado) não abarcam, sendo que essas informações faltantes podem levar ao falseamento da conclusão (regra). Não importa o quão grande seja nosso “n” amostral, não há como garantir que iremos abarcar a totalidade das variações.
A revisão taxonômica, em diferentes grupos, como, por exemplo, em D’elia et al. (2007), Wang et al. (2015) e Cai et al. (2019) pode advir dos limites do método indutivo. A partir da descrição acima, tomamos consciência de que a taxonomia tradicional se baseia no método indutivo. Dessa forma, podemos inferir que um dos motivos que conduz à incongruência de resultados, possivelmente, esteja relacionado aos limites do método indutivo, pois, por mais que tenhamos um número alto de observações, continuamos extraindo uma conclusão que não está contida nas premissas (dedução).
Podemos concluir, também, que a própria escolha subjetiva de critérios para a parte descritiva dos organismos, assim como a subjetividade do sujeito que descreve, podem levar, de forma conjunta à incongruência. Nesse sentido, podemos verificar os principais limites de um processo metodológico puramente indutivo.
Karl Popper (2013) critica o método indutivo na ciência, pois, segundo ele, o conhecimento adquirido através do referido método não pode ser justificado racionalmente. Dessa maneira, para Popper, uma ocorrência sucessiva de um mesmo evento não garante que, no futuro, tal evento permaneça ocorrendo da mesma forma e dentro de uma mesma periodicidade. O método indutivo é sustentado somente por meio de fatores psicológicos ligados à crença dos sujeitos. A mente humana age, de tal maneira que faz com que pensemos que pelo fato de determinado evento ter transcorrido inúmeras vezes ele continuará a transcorrer ad infinitum. Hume (2009) é quem apresenta a ideia da qual Popper compartilha, ao afirmar não ser possível, através de preposições lógicas e de observações, corroborar a verdade dos enunciados universais tampouco aumentar a probabilidade de os mesmos serem verdadeiros (HILLER; ALLGAYER, 2014).
3 A ascensão do método hipotético nas ciências da vida
À medida que as outras técnicas adentram nas ciências biológicas e, consequentemente, na taxonomia, podemos perceber que o raciocínio hipotético começa a se infiltrar nesse campo de conhecimento em conjunto com o método indutivo. Para Peirce (1878) a hipótese (regra – resultado – caso) surge quando encontramos alguma circunstância curiosa, que seria explicada pela suposição que se tratava de uma regra geral e, por conseguinte, adotamos essa hipótese em nossa investigação ou quando descobrimos que, em alguns aspectos, dois objetos têm uma semelhança marcante e inferimos que eles se assemelham notavelmente em outros aspectos. Por exemplo, a partir do avanço das pesquisas taxonômicas, foi reconhecido um novo tipo de espécie, as espécies crípticas (MORITZ et al. 1992). No tal grupo, caracteristicamente, são indistinguíveis de forma confiável com base somente na morfologia externa, aumentando, assim, a necessidade de pesquisas que perpassem somente pelo método indutivo a partir de caracteres morfológicos.
Quando uma nova espécie é descrita, devido ao peso histórico, os caracteres morfológicos são considerados como o primeiro critério de demarcação de espécie, porém, com o avanço da genética e da biologia molecular, ocorre a adição de novos métodos. A utilização de múltiplos métodos parece ser necessária para desenvolver uma taxonomia contemporânea; em sendo assim, a pouco mais de uma década, surgiu a “taxonomia integrativa”, que se refere a uma taxonomia que tem como objetivo integrar todas as fontes de dados disponíveis para enquadrar os limites das espécies.
A taxonomia integrativa, como área de conhecimento, foi formalmente apresentada no ano de 2005, tendo, como objetivo central, a delimitação e a descrição de novas espécies, integrando, desse modo, informações de distintas metodologias e dados (DAYRAT, 2005; WILL et al., 2005). Tal área de conhecimento ainda é recente, pois possui limitações objetivas quanto à escolha de métodos e caracteres para a delimitação de espécies. Visto isso, há debates acerca da hierarquia dos tipos de caracteres e quais são os critérios que devem ser utilizados para estabelecer os limites de espécies (SCHLICK-STEINER et al., 2009; PADIAL et al., 2010; YEATES et al., 2011). Apesar das limitações, a maioria dos taxonomistas parece concordar que a abordagem mais bem-fundamentada, para inferir hipóteses robustas de espécies, deve estar contida em uma estrutura formalizada, na qual são avaliadas, de forma objetiva, diversas linhas de evidência (SAMADI; BARBEROUSSE, 2006; QUEIROZ, 2007).
3.1 A taxonomia integrativa: uma saída ainda tecnologicamente limitada
Partimos da noção de que a taxonomia integrativa tem como objetivo integrar dados. Esse parece ser o problema central do campo de estudo, visto que intentamos integrar dados que possuam significados e limites distintos. A integração de dados é uma das áreas primordiais das ciências da computação que originou diferentes arquiteturas de bancos de dados. Um dos problemas dessa área é interoperabilizar bancos de dados heterogêneos. Sheth e Larson (1990) classificam a heterogeneidade em: estrutural, sintática e semântica. A heterogeneidade estrutural se refere à ocorrência de fontes de informação em distintas estruturas esquemáticas, ou seja, os dados possuem modelos diferentes. A heterogeneidade sintática se refere a conteúdos iguais com sintaxes diferentes, como, por exemplo, em bancos de dados distintos, o ácido desoxirribonucleico possui dois nomes como DNA em um e ADN em outro. Em contrapartida, a heterogeneidade semântica tem como pressuposto principal considerar o significado dos dados, isto é, em cada uma das bases devem ser verificadas as diferenças e similaridades do significado dos dados. Esses fenômenos, segundo Hakimpour e Geppert (2001), se referem à interpretação que as pessoas dão aos dados. Sendo assim, o dado é relacionado ao entendimento do sujeito sobre o mundo, e são essas interpretações distintas que causam a heterogeneidade semântica.
Dos três tipos de heterogeneidade descritos acima, o mais complexo e o que está fortemente relacionado ao problema da taxonomia integrativa é do tipo semântico. Para tanto, o campo que tem como objetivo solucionar esse tipo de conflito é a ontologia na inteligência artificial (IA). A partir dos anos 90 (GRUBER, 1993, 1995; SOWA,1995), as ontologias tornaram-se uma área de pesquisa bastante atrativa para os pesquisadores de distintos campo como: engenharia do conhecimento, e processamento da linguagem natural. Na IA, segundo Guarino (1998), as ontologias utilizam um artefato da engenharia que consiste em um vocabulário específico que é usado com a finalidade de descrever uma realidade, sendo acrescentado um conjunto de conjecturas que está relacionado ao resultado esperado. Geralmente, essas conjecturas ficam na forma lógica de primeira ordem, cujas expressões do vocabulário apresentam-se como predicados unários ou binários, chamados, respectivamente, de conceitos e relações.
Para que seja possível solucionar o problema da heterogeneidade semântica, devemos partir de ontologias que têm, como função, representar diferentes bases de dados que serão integradas . posteriori em uma ontologia global. Diferentes ontologias deverão ser integradas, gerando uma nova ontologia, havendo uma sobreposição física ou virtual. Dessa forma, as ontologias poderão ser utilizadas separadamente, porém, nos dois casos, elas devem ser alinhadas, consistindo em um acordo mútuo que conduza a dados consistentes e coerentes. Segundo McGuinnes et al. (2000), para que as ontologias sejam integradas, é necessário seguir os seguintes pressupostos:
Buscar, dentro das ontologias, os termos nos quais há sobreposição;
Através de relações de alinhamento (equivalência e classificação), relacionar os conceitos que são semanticamente fechados; e
Verificar a coerência, a consistência e a não redundância dos resultados.
Alinhar os conceitos entre as ontologias se torna extremamente complicado, pois ele exige que haja a compreensão dos significados dos conceitos através do sistema de inferência que foi selecionado. Dados com heterogeneidade semântica são extremamente complexos de serem alinhados em distintas ontologias devido ao modo como serão distinguidos através de uma hierarquia de conceitos, assim como pela necessidade de alta capacidade de processamento para a análise dos dados. O modo como, atualmente, se integram dados é por meio da concatenação de árvores com pressupostos distintos (com caracteres anatômicos e moleculares), porém, tal método é limitado para explicar o fenômeno das espécies, pois não levaria em conta a particularidade de cada um dos conjuntos de dados, tampouco levaria em conta dados descritivos dos organismos.
Através das afirmações acima, constatou-se que ainda não foi desenvolvida uma Inteligência Artificial (IA) que proporcione uma análise racional de distintos dados, ou seja, não temos como abordar os dados de forma integrada computacionalmente, e sim, o sujeito (pesquisador) deverá delimitar os parâmetros, compreender de forma objetiva os resultados das análises cabíveis e, a partir do conjunto de dados, delimitar o limiar das espécies.
3.2 Interagir e não integrar: uma abordagem viável para a descrição das espécies
Uma abordagem que sugere uma forma de tratamento dos dados através de diferentes linhas de evidência é a taxonomia interativa proposta por Yeates et al. (2010), na qual as explicações possuem consequências lógicas e podem ser testadas reduzindo, assim, o subjetivismo do sujeito na descrição.
O processo de taxonomia interativa seguiria os seguintes passos segundo Yeates et al., (2010):
Estabelecer uma estimativa prima facie (H0) dos limites da espécie tendo como fundamento uma fonte de dados (genéticos, etológicos, ecológicos) na qual possa ser usado um protocolo que pode ser repetido.
Testar os limites dos resultados através de um conjunto de dados diferente, com a amostragem baseada em H0 com a finalidade de produzir H1.
Se H0 e H1 produzirem resultados congruentes, os limites de espécies se mantêm, e a iteração entre os dados pode terminar. Caso novos dados estejam disponíveis, deve-se retornar ao passo 2.
Se H0 e H1 resultarem em limites de espécies incongruentes, devem-se buscar explicações biológicas da discordância.
A partir do resultado do passo 4, aprimorar os limites das espécies com a finalidade de produzir uma nova hipótese para os limites da espécie H2. Se os limites da espécie se mantêm nos testes, a interação pode terminar. Quando novos dados forem disponibilizados, retornar ao passo 2.
O sistema de taxonomia interativa parece, em linhas gerais, bastante relacionado ao modo como Peirce (1903) sugere como se daria o fenômeno da descoberta através da abdução, cuja implicação não é uma função da verdade, mas uma relação de causalidade (MAUTNER, 1997). A abdução, caracteristicamente, estipula a probabilidade de conclusão da inferência e não necessariamente a sua verdade. O objetivo geral do processo abdutivo é alcançar uma explicação para um conjunto de fatos ou um determinado acontecimento. Exemplificado: se estivermos na Amazônia e avistarmos a pegada de um grande felino, a abdução mais provável é que essa pegada pertença à Panthera onça (onça-pintada), do que Panthera leo (leão).
Partimos do pressuposto de utilização do fluxo proposto por Yeates et al. (2010). Conjuntamente, utilizamos métodos estatísticos que têm, em seu cerne, características distintas, bem como métodos descritivistas, para, dessa forma, acumular indícios com pressupostos diferentes, tendo, como finalidade, alcançar uma melhor explicação para o fenômeno em questão. Nesse sentido, se pretende adicionar alguns pressupostos à ideia interativa, partindo da visão de Mayr (2005) que afirma que parte das ciências biológicas se comportam como uma ciência histórica, e parte, como uma ciência dura. Em linhas gerais, o sistema corre por um fluxo lógico, de testes contínuos de hipóteses independentes. Sugerem-se algumas intervenções, para que esse sistema possa ser mais eficiente, englobando, desse modo, as espécies crípticas, bem como as distintas formas de pesquisar as ciências biológicas.
4 O desafio metodológico da descoberta das espécies crípticas: a escolha do método
Como referido, a ideia é abarcar, dentro do sistema, o complexo de espécies crípticas. As espécies crípticas são aquelas em que dois ou mais grupos biológicos são morfologicamente indistinguíveis porém incapazes de cruzar e gerar uma prole fértil. A descoberta dessas espécies, utilizando ferramentas moleculares e cariotípicas, tornou-se recorrente em diversos grupos de animais, porém, em muitos casos, não é acompanhada de uma revisão de dados morfológicos, causando sucessivos problemas na taxonomia e na conservação. Visto isso, essas espécies são um grande desafio tanto para a descrição taxonômica quanto para as outras áreas das ciências naturais. Sendo a espécie geralmente o eixo central de qualquer pesquisa dessas áreas, definir a riqueza, ultrapassando as dificuldades impostas pelos grupos crípticos, é condição primordial.
Partindo-se do pressuposto de que as espécies crípticas não possuem características morfológicas bem-marcadas que as distingam de outras espécies, o que poderá diferenciá-las são as características, como as comportamentais, como as encontradas nos estudos de bioacústica, as genéticas advindas de análises de sequência de DNA e cariótipo, bem como alguma especificidade no ciclo de vida, entre outras.
Diante disso, o trabalho inicia com as coletas na natureza. Cabe ressaltar que se pretende trabalhar com informações além da morfologia externa e, portanto, deve-se estar atentos para os seguintes pressupostos quanto às coletas: registrar o ponto geográfico da coleta, fotografar o local, descrever, em caderno de campo, as características do ambiente, acondicionar parte do material em álcool absoluto para uma possível extração de DNA a posteriori e preparar o organismo de forma adequada, de modo que seja preservado o maior número possível de características. Manter esse fluxo é indispensável para que se possa compreender os detalhes que conduzem à explicação desses complexos de espécies. Tendo isso estruturado, o fluxo pode ser facilmente aplicado por todos os pesquisadores que estão em busca de revelar os aspectos importantes que envolvem o processo de especiação, além do reconhecimento de espécies crípticas.
Entende-se que se forem tomadas as devidas precauções citadas acima, será possível aplicar a interação dos dados em um sistema que parta de três métodos gerais gerados independentemente: método descritivo; método hipotético; e método estimativo. Destaca-se a multiplicidade do método, pois cada um deles possui suas peculiaridades e limitações. Essas características não são incorporadas de forma sistêmica na proposta de Yeates et al. (2010), mas são métodos necessários que podem, tranquilamente ser incorporados ao fluxo. A ideia, em termos gerais, é utilizar diferentes métodos em dados distintos, incorporando, dessa maneira, um sistema com pressupostos metodológicos que se diferenciam entre si. A multiplicidade metodológica será descrita e justificada nos parágrafos que seguem.
Dentro dos métodos citados, haverá duas abordagens distintas: a abordagem orientada por hipóteses e a abordagem da descoberta. A abordagem orientada por hipóteses é aquela que contém o teste de hipóteses a partir de dados prévios com a orientação estatística hipotética. Geralmente, os intervalos de confiança serão a forma mais explicativa para apresentar os principais resultados de uma pesquisa (ANDERSON; BURNHAM, 2004). Quando se utiliza o método hipotético, na maioria das vezes, o interesse está em torno de corroborar ou falsear uma hipótese. Alguns exemplos de métodos hipotéticos estatísticos são a Anova, a Manova e a Permanova. Esses métodos podem ser empregados nas métricas da morfometria tradicional (segmentos de reta) e da morfometria geométrica (forma).
A abordagem da descoberta tem por característica que não há uma hipótese prévia na análise dos dados, ou seja, a hipótese parte do dado. E, nesse caso, poderíamos adicionar a conclusão do método descritivo (não estatístico, indícios descritivos, linguagem gramatical) e o método de estimação (estatístico, linguagem matemática). O método descritivo é englobado a um texto descritivo que tem como objetivo descrever algo, cuja função é transmitir para o leitor as propriedades que tem a natureza de um ser e suas impressões (ANDREWS, 2006). É de suma importância, ao se utilizar esse método, acentuar as características que se tem a pretensão de analisar. Em roedores sigmodontíneos, por exemplo, o conjunto de dados foi composto por parte descritiva do cariótipo, descrição dos pelos e dos dentes e, em linhas gerais, acerca do corpo do organismo (CHRISTOFF et al., 2016; PALMA; RODRÍGUEZ-SERRANO, 2018).
O método da estimação consiste em um estimador aleatório que assume valores distintos para cada amostra (ANDREWS, 2006). Nesse sentido, o parâmetro de interesse é estimado por um intervalo de valores que avalia a variação existente na amostra contendo o intervalo de confiança. A fim de que seja possível conceber um intervalo de confiança, é necessário conhecer a distribuição de probabilidades do estimador, sendo que esse é uma variável aleatória singularizada por sua distribuição de probabilidades. Sendo assim, é possível atestar que o que abarca tal método são as análises de dados moleculares como inferência Bayesiana e a máxima verossimilhança.
Considerando que o processo de taxonomia interativa deve ser caracterizado pelo teste de diversos indícios, e que a união desses dados deve transcorrer de forma abdutiva, ou seja, procurando a melhor explicação através dos indícios, para os nossos indícios serem mais consistentes é interessante contar com um maior número de variáveis e de modelos de abordagem, pois, assim, diferentes vieses sobre o mesmo fenômeno podem ser obtidos, construindo um conhecimento mais próximo da realidade.
5 Conclusão
A forma como se dá a interação dos dados pode ir além do processo de descrição taxonômica, visto que os processos de pesquisa de seres vivos contam com diferentes fenômenos e podem conter duas formas de pesquisa como sugerido por Mayr (2005). Nesse sentido, sugere-se a interação de, no mínimo, dois indícios, seguindo o fluxo sugerido por Yeates et al. (2010), adaptando, assim, a metodologia aos mais variados problemas de pesquisa. A interação é uma boa alternativa para ser aplicada, pois, como dito, a integração entre os dados ainda é computacionalmente inviável, e a interação por meio de um processo abdutivo, contendo indícios que possuem características de dados distintos, melhora a confiabilidade do argumento.