Erros Plagiados e a Genética Molecular
Mais um argumento na controvérsia evolução-criação
Copyright © 1986-1997 by Edward E. Max, M.D., Ph.D.
Traduzido por  Ronaldo Cordeiro
[Última atualização em 6 de junho de 2000]

Nota do Autor: "O ensaio a seguir é uma atualização de um artigo que publiquei na Creation/Evolution em 1986 (XIX, p.34). Estou postando-o com a permissão da Creation/Evolution."

1. Introdução

Outros Links:
Erros em Comum no DNA de Homens e Macacos
O criacionista David A. Plaisted argumenta que seqüências de DNA em comum nos pseudogenes de diferentes espécies não indicam necessariamente evolução (em inglês).
Edward Max responde a Plaisted
O autor deste ensaio escreve uma resposta a Plaisted.(em inglês)
Vírus "Produtores de Lixo" Neutralizam um Argumento Evolucionário
O Criacionista Carl Wieland descarta os pseudogenes em comum como prova da evolução.(em inglês)
Edward Max responde a Wieland
O autor deste ensaio escreve uma resposta a Wieland.(em inglês)

A maioria dos cientistas considera as provas da evolução mais que suficientes. Assim, na certeza de que a evolução já foi exaustivamente e suficientemente documentada, às vezes deixam de perceber de que forma algumas novas descobertas poderiam fornecer provas da evolução, que poderiam ser poderosamente convincentes para os indivíduos inclinados a crenças criacionistas. Neste artigo eu descreverei algumas descobertas da minha própria área, a genética molecular, descobertas essas cujas implicações na controvérsia criação-evolução não foram explicitamente discutidas quando foram anunciadas. Tentarei mostrar de que forma elas fornecem indícios em favor da evolução, ao mesmo tempo convincentes e conceitualmente simples o bastante para que os leigos interessados possam apreciá-las.

Os novos indícios moleculares trazem uma questão que, na minha opinião, representa um dos poucos casos em que um argumento criacionista havia demonstrado coerência lógica, e levado a posição evolucionária a um impasse. É a questão de como interpretar as similaridades entre as espécies vivas modernas, especialmente as similaridades observadas em nível molecular. Como veremos, as recentes descobertas da genética molecular resolvem esse impasse inequivocamente em favor da evolução.

1.1 A visão evolucionária das similaridades entre as espécies

Vejamos, em primeiro lugar, como os evolucionistas interpretam as similaridades entre as espécies que vivem atualmente. Os humanos de hoje e os chimpanzés, a despeito das óbvias diferenças externas e comportamentais, possuem órgãos internos e funções fisiológicas extremamente similares; na verdade, seus genes são mais de 98% idênticos (Goodman et al., J Molec Evolution 30:260, 1990). Assim como a semelhança entre dois irmãos sugere uma paternidade em comum, a semelhança entre espécies sugere ancestrais em comum. Os evolucionistas acreditam que homens, gorilas e chimpanzés evoluíram a partir de um ancestral comum: uma criatura simiesca que teria vivido provavelmente entre cinco e dez milhões de anos atrás, o que é bem recente em termos da escala de tempo geológica. (A idéia de que humanos e macacos poderiam compartilhar um ancestral comum parece especialmente inaceitável para os criacionistas, pelas implicações teológicas de um parentesco como este, e pela clara contradição com a interpretação literal dos criacionistas do Gênesis bíblico.) Acredita-se que espécies bem menos similares aos humanos que os macacos --camundongos, por exemplo-- se ramificaram milhões de anos antes, a partir de um ancestral mamífero primitivo em comum. Os diagramas da árvore genealógica evolucionária, que expressam estes relacionamentos entre as espécies, têm sido construídos pelos biólogos evolucionários através da análise das similaridades dos organismos dos dias atuais. Em muitos casos, restos fossilizados de espécies extintas podem ser usados para corroborar as características destas árvores evolucionárias; indícios fósseis, porém, não serão discutidas neste artigo.

Outra extensa fonte de dados, que tem sido de suma importância na construção dos diagramas de árvore de similaridades, é a comparação de proteínas e genes. As proteínas são grandes moléculas biológicas, feitas de subunidades chamadas aminoácidos, que se conectam uns aos outros em cadeias, como os vagões de um trem. Há vinte tipos diferentes de aminoácidos usados por proteínas, e a maioria das proteínas contém centenas dessas subunidades. Cada proteína tem uma quantidade e uma seqüência específica de aminoácidos, e esta seqüência determina as propriedades que a proteína terá. Para que uma célula sintetize uma proteína específica, ela precisa ter acesso a um "banco de informações", no qual as seqüências de aminoácidos ficam armazenadas; este banco de informações comporta os genes do organismo, que contém as seqüências de aminoácidos codificadas nas moléculas de Ácido Desoxirribonucléico (DNA). Os bioquímicos podem purificar as proteínas e descobrir a seqüência exata dos seus aminoácidos, ou podem obter essa informação lendo a seqüência adequada do DNA de um organismo. Esforços consideráveis foram gastos na comparação das seqüências de proteínas similares, isoladas de diferentes espécies. Por exemplo, uma proteína chamada "citocromo C" já foi examinada em mais de oitenta espécies. Essas seqüências de aminoácidos do citocromo C representam bits "digitais" de dados que podem ser usados para quantificar diferenças entre espécies, e essas diferenças podem ser usadas para construir árvores evolucionárias muito semelhantes às baseadas nas comparações das características "análogas" da anatomia dos corpos. Essas árvores de seqüências de proteínas --assim como as árvores baseadas nas similaridades das estruturas de DNA-- coincidem impressionantemente bem com as árvores evolucionárias anteriormente derivadas de similaridades anatômicas. A concordância entre árvores evolucionárias construídas a partir de fontes de dados completamente diferentes como essas (por exemplo, Goodman et al Mol Phylogenet Evol 9:585, 1998) tem sido considerada pelos evolucionistas uma prova da validade da estrutura intelectual na qual essas árvores se apóiam: a teoria da evolução (veja Jukes, em Scientists Confront Creationism, editado por Godfrey, WW Norton, New York 1983; Creation/Evolution XVIII:42, 1986; Goodman et al., J Mol Evol 30: 260, 1990).

1.2 A visão criacionista das similaridades entre espécies leva a um impasse

No entanto, os criacionistas têm uma interpretação alternativa para as similaridades entre as seqüências de aminoácidos, refletidas nas árvores dos evolucionistas. Afirmam que tais similaridades de seqüências entre espécies "parentes" simplesmente refletem a escolha do criador de projetar espécies similares para que funcionassem similarmente, não apenas em nível de ossos, músculos e órgãos, mas também no nível das funções das proteínas --daí as similaridades entre as seqüências de aminoácidos.

Assim, as similaridade entre as espécies, na anatomia e na estrutura das proteínas, pode ser interpretada de duas formas diferentes. Os evolucionistas dizem que as similaridades entre características de, por exemplo, homens e macacos, refletem o fato de que essas características tenham sido herdadas de um ancestral comum; isto é, as características similares de humanos e macacos são determinadas por cópias modernas de genes que certa vez existiram em uma espécie ancestral de ambos. Os criacionistas dizem que tanto os macacos como os homens foram criados independentemente, mas foram projetados com características similares, de forma que funcionassem similarmente. Tanto a visão da cópia dos genes como a da criação independente parecem coerentes como os dados de similaridades, mas qual delas será a correta?

1.3 Um possível raciocínio para solucionar o impasse

Uma forma para se distinguir a cópia da criação independente é sugerida pela analogia com os dois casos seguintes, extraídos da literatura legal. Em 1941, o autor de um livro de química apresentou uma denúncia de que porções do seu livro haviam sido plagiadas pelo autor de um livro concorrente (Colonial Book Co, Inc. vs. Amsco School Publications, Inc., District Court, S.D. New York, 9 de setembro de 1941). Em 1946, a editora de um catálogo comercial para a indústria da construção fez acusações semelhantes contra a editora de um catálogo concorrente (SubContractors Register, Inc. vs. McGovern's Contractors & Builders Manual, Inc. et al. District Court, S.D. New York, 2 de agosto de 1946). Em ambos os casos, a simples similaridade entre os conteúdos das supostas cópias e os originais não foi considerada indício convincente de cópia. Afinal, ambos os livros de química estavam descrevendo o mesmo conjunto de conhecimentos químicos (os livros tinham sido projetados para "ter funções similares") e ambos os catálogos listavam membros da mesma indústria, logo era de se esperar que houvesse semelhanças substanciais, mesmo se não houvesse ocorrido nenhuma cópia. Porém, em ambos os casos, erros presentes nos originais apareciam nas supostas cópias. Os tribunais julgaram que era inconcebível que os mesmos erros pudessem ter sido cometidos independentemente por cada queixoso e cada acusado, e determinou que, em ambos os casos, tinha ocorrido cópia. O princípio de que erros duplicados implicam em cópia está agora bem estabelecido na lei de direitos autorais. (Reconhecendo este fato, editoras de catálogos rotineiramente incluem itens falsos em suas publicações, como armadilha para plagiadores em potencial.)

Será que os "erros" em espécies modernas poderiam ser usados como evidência de "cópia" de ancestrais primitivos? De fato, a resposta a esta pergunta parece ser "sim", visto que investigações recentes da genética molecular têm descoberto alguns exemplos dos mesmos "erros" presentes no material genético de homens e macacos. Para que se compreenda estas descobertas, é necessário que se conheça um pouco sobre o DNA, a molécula química na qual as informações genéticas são armazenadas.

2.1 Fundamentos do DNA

Em um aspecto, a estrutura básica do DNA lembra a das proteínas: ambas são feitas de cadeias lineares de subunidades variáveis. Com exceção desta característica em comum, a estrutura do DNA é bem diferente da das proteínas. As subunidades do DNA são chamadas de nucleotídeos ou bases, e a seqüência desses nucleotídeos contém a informação genética que especifica a seqüência dos aminoácidos em cada proteína produzida pelo organismo. Enquanto que 20 aminoácidos diferentes compõem as subunidades das proteínas, há apenas quatro bases de nucleotídeos diferentes no DNA, geralmente abreviadas como A, T, G e C. De acordo com o "código genético", deduzido pelos cientistas na década de 60, cada aminoácido é especificado por uma ou mais trincas de nucleotídeos; por exemplo, a seqüência GCG especifica o aminoácido Alanina. Como existem 64 trincas diferentes, (cada uma chamada de Códon) e somente 20 aminoácidos para serem especificados, alguns deles são representados por mais de uma trinca (por exemplo, ATA, ATC e ATT codificam todas o aminoácido Isoleucina); e três trincas -- TAA, TAG e TGA -- representam "códons de parada" que marcam o fim da seqüência do gene que pode ser usada para especificar uma seqüência de aminoácidos.
 
Figura 1. Fundamentos do DNA. A forma oval no centro representa uma célula, dentro da qual fica o núcleo. Dentro do núcleo, a maior parte do DNA reside na forma de uma espiral dupla. A forma oval no canto superior esquerdo mostra uma visão expandida do DNA, na qual as espirais foram desenhadas "desenroladas" para revelar a semelhança com uma escada. A informação genética é armazenada nas seqüências das bases de nucleotídeos (A, T, G ou C) que formam os degraus da escada. Cada degrau é formado por um par de bases de nucleotídeos tocando-se uma à outra, uma das bases conectada a uma fita e a outra conectada à outra fita. Um nucleotídeo "A" sempre forma par com um "T", e um "G" sempre forma par com um "C". Para sintetizar uma proteína, a célula lê a informação genética do gene para aquela proteína, "transcrevendo" uma molécula de RNA a partir do gene. Para a transcrição, as fitas da dupla espiral do DNA precisam se separar parcialmente, de forma que as bases que formam RNA possam se reunir de acordo com as regras de formação de pares complementares. A visão expandida no alto à direita, mostra as duas principais diferenças entre o RNA e o DNA: fita do RNA tem uma estrutura química ligeiramente diferente (representada pela linha tracejada), e uma forma ligeiramente modificada do "T", conhecida como "U", é encontrada no RNA. A fita transcrita de RNA age como um "mensageiro", que transporta as informações genéticas do seu armazém no núcleo para os módulos de fabricação de proteínas (representados na figura pelas formas ovais duplas em cinza) no citoplasma. A visão expandida abaixo à esquerda mostra que a seqüência das bases de RNA é lida de forma que cada trinca de bases especifique um aminoácido (aa1, aa2, etc.) na proteína. Esta se dobra em uma estrutura funcional tridimensional, que depende da seqüência linear dos aminoácidos.

O DNA contém duas cadeias lineares em uma estrutura de fita dupla, que lembra uma escada em espiral --a famosa "dupla hélice." As traves verticais da escada representam uma cadeia uniforme que não contém nenhuma informação de seqüências. Como é mostrado na Figura 1 acima, as informações são armazenadas nos "degraus" da escada, que são formados a partir de um par de bases de nucleotídeos, cada uma se agarrando em uma das fitas verticais e tocando a base que parte da fita oposta para formar um "degrau". A base G em uma fita sempre faz contato com uma base C na fita oposta; similarmente, uma A sempre se conecta com uma T. Assim, uma cadeia de Ts em uma fita pode fazer o "pareamento" ou "anelamento" com uma fita contendo uma cadeia de As, para a formar uma estrutura de fita dupla. A seqüência de bases de nucleotídeos em uma fita é dita "complementar" à seqüência da outra fita. Para qualquer gene, as trincas de bases que codificam seqüências de aminoácidos estão em apenas uma das fitas. Alguns genes são codificados em uma fita, enquanto outros se situam na outra fita. Na maioria dos genes de mamíferos, o DNA codificante de seqüências de aminoácidos é interrompido por segmentos de DNA aparentemente sem sentido ("íntrons"). Seqüências de íntrons precisam ser removidas antes que a seqüência seja usada para montar os aminoácidos; esta remoção, ou "splicing", não ocorre na molécula de DNA, mas no estágio seguinte da transferência da informação.

Para que uma célula produza uma proteína específica, cuja seqüência de aminoácidos está codificada em um gene, a informação seqüencial contida no DNA precisa ser primeiro copiada, ou "transcrita" para uma molécula de fita única, chamada de Ácido Ribonucléico (RNA), como mostrado na Figura 1. Esta transcrição inicial de RNA sofre várias alterações estruturais, conhecidas coletivamente como "processamento," antes de ser usada para montar aminoácidos. Entre esses passos de processamento incluem-se o "splicing out" do RNA de segmentos desnecessários de íntrons, e o acréscimo de nucleotídeos em uma das extremidades --a "cauda de poli-A"-- que promove o funcionamento adequado do RNA na célula. É o RNA "processado" que participa diretamente na reunião dos aminoácidos em proteínas. A transcrição de um gene para uma cópia de RNA é controlada de forma bem rigorosa, em parte por seqüências regulatórias altamente específicas, conhecidas como promotores, que na maioria dos genes ocorrem no DNA fora da região transcrita, mas próximas da posição onde a transcrição para RNA deve começar.

Quando uma célula se divide, a seqüência inteira do seu DNA precisa ser duplicada em duas cópias fiéis da original; cada cópia vai para uma das células "filhas", criadas pela divisão. Ocasionalmente, ocorrem erros nesse mecanismo de cópia, chamados de "mutações" na seqüência do DNA. Há vários tipos de mutações, entre as quais se incluem substituições de um ou de alguns nucleotídeos, deleções de nucleotídeos, duplicação de segmentos de DNA ou inserção de segmentos de DNA estranhos em uma seqüência de DNA da qual não fazem parte. Mudanças desse tipo podem ocorrer na maioria das células do corpo --fígado, pele, músculos, etc.-- sem que sejam transmitidas aos descendentes quando o organismo se reproduz. No entanto, quando as mutações ocorrem no óvulo ou espermatozóide ou, mais genericamente, em "células germinativas" (ou seja, o óvulo, o espermatozóide e seus precursores embriológicos), podem ser passadas para as futuras gerações. Muitas vezes, as mutações não têm maiores conseqüências: ou seja, podem ocorrer fora de um gene, ou se ocorrerem dentro de um gene pode ser que não alterem o aminoácido codificado. Acredita-se que muitas das diferenças genéticas entre espécies próximas sejam exemplos dessas mutações aleatórias inofensivas. Às vezes, porém, as mutações danificam gravemente a função de um gene. De fato, mutações como essas são a causa de doenças genéticas como fibrose cística, anemia falciforme, fenilcetonúria e centenas de outras, assim como muitas aberrações genéticas estudadas em animais de laboratório. Quando os geneticistas moleculares examinam o DNA de pacientes com doenças bem caracterizadas como essas, conseguem quase sempre descobrir o gene defeituoso e identificar a mutação que o desativou, visto que é raro que essas doenças genéticas sejam causadas por uma deleção, que removeria o gene inteiro. Mutações que causam doenças genéticas e formações defeituosas são geralmente tão prejudiciais à sobrevivência e ao sucesso reprodutivo do organismo que, na natureza --ou seja, na ausência da ciência médica moderna-- elas tenderiam a ser "extirpadas" pela pressão da seleção natural. Raramente, as mutações podem ser benéficas para um organismo: esses casos raros formam a base para que as adaptações evolucionárias aperfeiçoem a "adaptação" de um organismo ao seu ambiente.

2.2 Erros no DNA

A tecnologia do DNA recombinante, em anos recentes, tem permitido aos cientistas determinar a seqüência de nucleotídeos nos segmentos de DNA de muitas espécies, e informações na forma de vários milhões de nucleotídeos foram acumuladas. Essas seqüências amplamente aumentaram nossa compreensão sobre como os genes normalmente funcionam; mas, visando mais diretamente ao assunto deste artigo, revelaram um tesouro oculto de "erros" genéticos, que são pistas em potencial para a análise das cópias discutidas acima. Neste contexto, eu utilizo a palavra "erro" para englobar qualquer característica do DNA para a qual não tenhamos nenhuma boa razão para acreditar que (1) tenha se originado de um "acidente" genético; (2) não traga qualquer benefício para o organismo que as carregue; e (3) logo, não possa razoavelmente ser interpretada como tendo sido "projetada". Discutirei várias classes sobrepostas desses "erros", que representam argumentos a favor da evolução de formas ligeiramente diferentes. Uma das classes inclui os "pseudogenes," ou cópias danificadas não-funcionais de genes. Discutirei três classes de pseudogenes, sendo que a última se sobrepõe a uma categoria mais ampla de erros genéticos conhecidos como retroposons, que serão também discutidos. Veja a Figura 2.
 
[Fig1]
Figura 2. Este diagrama de Venn ilustra as classes de "erros" discutidas neste artigo, exceto pelo fato de que a classe dos "pseudogenes unitários" (que é na verdade um pequeno subconjunto dos "pseudogenes clássicos") não é mostrada no diagrama. Os pseudogenes processados representam a interseção do conjunto dos pseudogenes como dos retroposons.

2.2.1 Pseudogenes

a. Pseudogenes unitários.
Porquinhos-da-índia e primatas, inclusive o homem, adoecem se não consumirem ácido ascórbico em sua dieta. Assim, para homens e porquinhos da índia, o ácido ascórbico é uma vitamina (a vitamina C), enquanto que a maioria das outras espécies consegue sintetizar seu próprio ácido ascórbico, e logo não precisam dessa molécula em suas dietas. A razão pela qual os seres humanos e porquinhos-da-índia não podem fabricar seu próprio ácido ascórbico é a falta de um gene funcional, codificando a proteína da enzima conhecida como L-gulono-gama-lactona oxidase (GLO), que é necessária para a síntese do ácido ascórbico e que está presente nas outras espécies de mamíferos. Como estes outros mamíferos produzem enzimas GLO funcionais, codificadas por genes GLO funcionais, a hipótese evolucionária é de que estes foram herdados de um gene GLO de um ancestral comum de mamíferos, e que os genes GLO nas linhagens de humanos e porquinhos-da-índia foram desativados por mutações. Presumivelmente, isso ocorreu separadamente nos porquinhos-da-índia e ancestrais dos primatas, cujas dietas naturais eram tão ricas em ácido ascórbico que a ausência da atividade da enzima GLO não era uma desvantagem --não causava pressão seleetivaa contra o gene defeituoso.

Os geneticistas moleculares, que examinam as seqüências de DNA sob um ponto de vista evolucionário, sabem que as grandes deleções de genes são raras. Logo, esperavam que cópias mutantes não-funcionais do gene GLO --conhecidas como "pseudogenes"-- poderiam ainda estar presentes nos primatas e porquinhos-da-índia, como resquícios do gene ancestral que funcionava. Em contraste, os criacionistas acreditam que os homens e porquinhos-da-índia foram criados cada um de forma independente de todas as outras espécies, e devem ter sido "projetados" para funcionar sem o GLO. Se isso fosse verdade, não seria esperado que essas duas espécies portassem uma cópia defeituosa do gene GLO. Na verdade, pseudogenes GLO foram detectados tanto no porquinho-da-índia como no homem (Nishikimi et al. J Biol Chem 267: 21967, 1992; Nishikimi et al. J Biol Chem 269:13685, 1994), o que é coerente com a visão evolucionária; presumivelmente, também existem pseudogenes semelhantes nos primatas não-humanos que precisam da vitamina C na dieta. Os tipos de mutação encontrados nos pseudogenes do homem e do porquinho-da-índia são característicos do tipo encontrado em doenças como as mencionadas acima. Neste ensaio, chamarei as seqüências de DNA GLO do homem e do porquinho-da-índia de "pseudogenes unitários", de modo a diferenciá-los de dois outros tipos de pseudogenes que ocorrem numa espécie que também possui uma cópia funcional do mesmo gene (veja abaixo). Os leitores devem observar que o termo "pseudogene unitário" é usado aqui por conveniência; não há nenhuma nomenclatura padrão para descrever este tipo raro de pseudogene.

Os pseudogenes unitários são relativamente raros; cada um é como um defeito genético que afeta todos os indivíduos de uma espécie. No entanto, esses genes defeituosos não correspondem a doenças genéticas, pois se causassem sintomas significativos, ou alguma outra desvantagem a seus portadores, os indivíduos com genes intactos teriam vencido há muito tempo a competição pela sobrevivência e pela reprodução, levando assim o pseudogene a deixar de existir. Sob uma perspectiva evolucionária, os pseudogenes unitários representam resquícios de genes cuja função foi importante em espécies ancestrais, mas que tornou-se desnecessária nas espécies modernas, ou seja, são seqüências vestigiais de DNA. A presença de resquícios de pseudogenes não-funcionais é facilmente explicada pelo modelo evolucionário: são uma conseqüência natural de mutações que deixaram de ser eliminadas pela seleção natural porque a função do produto do gene havia se tornado desnecessária. De fato, este modelo prevê que seriam encontrados muitos pseudogenes unitários, caso os cientistas examinassem os genes que especificam estruturas vestigiais --por exemplo, genes que codificam estruturas oculares em espécies cegas, como toupeiras ou animais que habitam cavernas. (Um exemplo que confirma esta previsão foi descrito recentemente nas toupeiras marsupiais: um pseudogene aparentemente unitário, relacionado ao gene da proteína de ligação retinóide do interfotoreceptor [Springer et al., PNAS 94:13754, 1997]. Pseudogenes de receptores do odor --cerca de 70% das seqüências dessa família-- fornecem um exemplo conceitualmente similar no DNA humano, refletindo o caráter quase vestigial da nossa percepção olfativa, em comparação com a das outras espécies. [Rouquier S et al., Nat Genet18:243,1998; Rouquier S, et al. Human Molec Genet &:1337,1998; Sharon et al., Genomics 61:24,1999; Rouquier et al., PNAS 97:2871,2000]) Em contraste, não esperaríamos encontrar pseudogenes como esses se cada espécie tivesse sido criada independentemente por um projetista inteligente (a não ser se esse projetista estivesse intencionalmente simulando uma evolução). Vários outros pseudogenes unitários são conhecidos no homem, inclusive seqüências homólogas aos genes que codificam a urato oxidase (Yeldandi et al, Gene 109:2821, 1994; Wu et al, J Mol Evol 34:78, 1992), alfa-1,3-galactosiltransferase (Galili e Swanson, PNAS 88:7401,1991) e a proteína superficial RT6 (Haag et al, J Mol Biol 243:537,1994). Muitos mais podem ser descobertos, à medida que o Projeto Genoma Humano aprofunda o conhecimento da nossa seqüência de DNA.

(Outro grupo interessante de pseudogenes unitários são as seqüências polimórficas, que são genes em alguns indivíduos e pseudogenes em outros, com diferentes freqüências de pseudogenes em diferentes populações. Entre os exemplos se incluem os genes humanos para o receptor de quimiocinas CCR5, para o citocromo p450 2C19, e para a apolipoproteína (A). Nesses exemplos, a ausência dos proteínas funcionais correspondentes geralmente não têm maiores conseqüências na maior parte do tempo, mas pode se tornar clinicamente importante --seja de forma benéfica ou maléfica-- sob determinadas circunstâncias ambientais, ou em combinação com outros genes. Em alguns casos, o mesmo produto do gene pode ser benéfico em algumas circunstâncias e maléfico em outras, de forma que a seleção leva a uma freqüência de genes intermediária.)

b. Pseudogenes duplicados clássicos
Uma classe muito maior de pseudogenes aparentemente surge de acidentes em um padrão de alteração de genes que tem sido importante na evolução dos genes funcionais normais: o padrão de duplicação e diferenciação (Ohta, Genome 31:304,1989; Holland et al., Dev Suppl 36:125, 1994). Este padrão é evidenciado pela observação freqüente (no DNA de numerosas espécies) de blocos de seqüências que foram aparentemente duplicados de forma que duas ou mais repetições de seqüências similares aparecem lado a lado, ou seja, em tandem (veja o box 1).

Tudo indica que, imediatamente após a duplicação, cada cópia do gene tinha uma seqüência idêntica (veja a Figura 3.) Mas, à medida em que as seqüências de DNA são copiadas de geração em geração, mutações podem se acumular independentemente nas cópias da seqüência duplicada, com várias conseqüências possíveis.
 

[Fig2]
Figura 3. No funcionamento normal dos genes (painel à esquerda), o DNA é transcrito em RNA, que é então "processado" pela remoção dos íntrons (as seqüências não-codificantes entre as caixas em cinza) e pela adição de uma cauda de poli (A). O RNA processado maduro é então traduzido em uma cadeia de aminoácidos para formar uma proteína. Os paralelos à direita ilustram os dois caminhos que geram pseudogene duplicado clássico (no alto) e o pseudogene processado (abaixo) . No caminho superior, a duplicação do DNA gera duas cópias do gene inteiro (caixa no alto à direita), mas mutações um uma das cópias (representadas pelos "x") tornam-na um pseudogene. No outro caminho, uma transcrição de RNA processado de um gene pode tornar-se transcrita reversamente em uma cópia de cDNA (caixa abaixo à direita), que se insere de volta no DNA da célula em uma posição aleatória no genoma, freqüentemente --como mostrado aqui-- no DNA separador entrre os genes (caixas brancas na figura).

i. Algumas mutações podem não ter qualquer efeito sobre o funcionamento do gene. 
B O X  1

Os criacionistas geralmente argumentam que características que observamos no DNA das espécies modernas  --inclusive, presumivelmente, as seqüências repetidas em tandem-- foram projetadas especificamente por um criador inteligente, enquanto os cientistas vêem as seqüências em tandem como resultantes de duplicações acidentais do DNA. Um dos argumentos a favor do ponto de vista científico é que podemos ver exemplos destes acidentes genéticos ocorrendo atualmente, no DNA humano (assim como no DNA de espécies de laboratório), aparentemente sem intervenção divina. Devido à nossa propensão para a averiguação --isto é, somente descobrimos coisas quando procuramos por elas-- os exemplos melhor estudados de duplicações em humanos são os das que causam doenças. Uma maneira pela qual duplicações no DNA podem causar doenças é se apenas uma parte de um gene for duplicada, de forma que a proteína resultante tenha alguns aminoácidos repetidos, alterando assim a estrutura e a função da proteína (Heikkinen etal., Am J Hum Genet 60:48, 1997; Hu e Worton Hum Mutat 1:3, 1992). Quando as duplicações no DNA ocorrem em células somáticas (ou seja, fora da linhagem de células que contribui para o óvulo e o espermatozóide), elas não podem ser passadas adiante para as futuras gerações, mas podem causar problemas para o indivíduo afetado; por exemplo, têm-se relatado casos de câncer contendo duplicação parcial de genes nas células cancerosas, enquanto que esta duplicação está ausente nos tecidos normais do corpo (Schichman et al., Cancer Research 54: 4277, 1994), indicando que a duplicação ocorreu durante a vida do paciente afetado. Grandes duplicações, envolvendo genes inteiros, podem criar problemas clínicos se cópias extras de um gene funcional inteiro puderem produzir efeitos nocivos; embora isto seja incomum, um exemplo bem estudado é a doença neurológica de Charcot-Marie-Tooth tipo 1A (CMT1A), da qual o culpado parece ser uma cópia extra do gene conhecido como PMP-22 . Têm sido relatados numerosos casos de CMT1A nos quais a duplicação está presente no paciente afetado, mas não em seus pais, indicando que a duplicação deve ter ocorrido nas células germinativas de um dos pais, ou bem no início do desenvolvimento embrionário do paciente (Eur Neurol 34:135, 1994). Estes exemplos mostram claramente que a duplicação de genes não é apenas uma construção hipotética --invocada para explicar repetições em tandem que foram criadas por eventos inescrutáveis no passado distante-- mas, pelo contrário, são um processo bioquímico natural que pode ser observado atualmente no homem (também pode ser simulado em espécies de laboratório tão diversas como bactérias e moscas das frutas; Lupski et al. Am J Hum Genet 58:21, 1996). Os genomas dos modernos vertebrados podem representar indícios de dois eventos antigos de duplicação com proporções genômicas, que dobraram o conteúdo genético inteiro (Sidow Curr Opin Genet & Devel 6:715,1996; Endo et al, Gene 205:19, 1997; Pebusque et al. Mol Biol Evol:1145, 1998); duplicações similares mais recentes têm sido deduzidas em certas plantas, sapos e até mesmo camundongos (Gallardo et al, Nature 401:6751, 1999). 

ii. Outras mutações podem levar a uma proteína que tem uma função ligeiramente diferente daquela do gene original. Na verdade, esta diferenciação dos genes duplicados para desenvolver novas funções em uma cópia, aparentemente é responsável por uma parcela significativa da expansão na complexidade dos genes dos organismos superiores. Por exemplo, acredita-se que o gene para uma proteína primordial de transporte de oxigênio tenha sido duplicado, levando a genes separados para a codificação da mioglobina (a proteína de transporte de oxigênio dos músculos) e a hemoglobina (a proteína de transporte de oxigênio das células vermelhas do sangue). Assim, o gene da hemoglobina se duplicou e as cópias se diferenciaram nas formas conhecidas como (alpha)(beta). Mais tarde, tanto o gene da hemoglobina (alpha) como o da (beta) se duplicaram várias vezes, produzindo um grupo de seqüências relacionadas à hemoglobina (alpha) e outro de seqüências relacionadas à hemoglobina (beta). Os grupos incluem genes funcionais que são ligeiramente diferentes, que se expressam em tempos diferentes durante o desenvolvimento do embrião para o adulto, e que codificam proteínas especificamente adaptadas para esses períodos de desenvolvimento. A divergência entre a mioglobina e os genes (alpha)(beta) ocorreu há tanto tempo na evolução que o embaralhamento da informação genética, que ocorre ocasionalmente no DNA, distribuiu esses genes em diferentes cromossomos. Os genes compreendidos no grupo (alpha) e no grupo (beta) se duplicaram mais recentemente no processo evolutivo, e ainda estão agrupados.

iii. Finalmente, ainda há outras mutações que alteram aminoácidos críticos, que afetam o "splicing" dos íntrons ou que criam novos códons de parada, podendo destruir completamente a função de uma seqüência de genes duplicada e transformá-la num pseudogene. Esses tipos de mutações que destroem a função do gene lembram, mais uma vez, aqueles que desativam genes cruciais não duplicados, causando assim doenças genéticas. Genes defeituosos não duplicados tendem a desaparecer das populações ao longo do tempo, pois indivíduos sem uma cópia funcional do gene são menos aptos a sobreviverem e produzirem descendentes (exceto se o gene não for mais necessário, como ocorre nos pseudogenes unitários). No entanto, quando um pseudogene coexiste com uma cópia normal, a continuidade do funcionamento do gene normal geralmente compensa qualquer mutação na cópia defeituosa; a seqüência defeituosa é geralmente inócua, e pode ser perpetuada no DNA como um pseudogene "duplicado clássico". De modo geral, cada pseudogene deste tipo contém uma seqüência que lembra o gene inteiro --contendo inclusive ambas as seqüências regulatórias que ficam fora das seqüências do codificação de aminoácidos, e íntrons que interrompem as seqüências codificantes (ver acima). Já foram encontrados numerosos pseudogenes deste tipo no DNA de diversos organismos, inclusive no homem. Por exemplo, tanto o agrupamento alfa como o beta dos genes da hemoglobina no homem têm inclusos pseudogenes duplicados desse tipo.

Embora a maioria dos pseudogenes "clássicos" se localizem próximos ao gene do qual se originaram, através da duplicação em tandem, vários laboratórios têm descrito recentemente uma variedade particular de pseudogenes duplicados, localizados próximos aos centrômeros de vários cromossomos diferentes. (Os centrômeros são os segmentos cromossômicos onde --imediatamente antes da divisão celular-- as duas cópias duplicadas de cromossomos com forma de salsicha parecem amarradas juntas, como no diagrama da Figura 4, abaixo). Aparentemente, durante a evolução dos primatas, várias regiões do DNA sofreram um processo ainda pouco compreendido, que distribuiu cópias imperfeitas para as regiões centroméricas de múltiplos cromossomos. Os genes nestas cópias incluem íntrons mas são, em muitos casos, truncados e geralmente possuem mutações de múltiplos pontos, que os tornam pseudogenes não funcionais. Entre os exemplos destes pseudogenes centroméricos podem-se incluir seqüências relacionadas ao gene da adrenoleucodistrofia ALD (Eichler et al., Human Molec Genet 6:991, 1997), o gene transportador da creatina SLC6A8 (Eichler et al. Human Molec Genet 5:899, 1996), o gene da neurofibromatose NF1 (Human Molec Genet 6:9, 1997), e um gene chamado de FRG1, próximo do locus da distrofia muscular fácio-escápulo-umeral (Grewal et al., Gene 227:79, 1999).

c. Pseudogenes processados
Uma classe totalmente diferente de pseudogenes, conhecida como pseudogenes processados (veja Figura 3, painel abaixo à direita), surge de inserções, que ocorrem naturalmente, de cópias extras de genes derivados de transcrições de RNA. Três características dessas seqüências sugerem que elas sejam derivadas do RNA:

i. Cada seqüência de pseudogenes processados lembra uma transcrição de RNA, na qual a similaridade do pseudogene com seu "gene original" se estende desde o local de iniciação até o de terminação do RNA, mas não inclui seqüências que se situam imediatamente fora da região transcrita, inclusive seqüências regulatórias como as promotoras.

ii. Estes pseudogenes não possuem seqüências de íntrons que são normalmente transcritas em RNA, mas sofrem "splice out" do RNA, antes que seja usado para especificar a seqüência de aminoácidos de uma proteína.

iii. Estes geralmente incluem a cauda de poli-A característica de transcrições de RNA que codificam proteínas.

Além disso, diferentemente dos pseudogenes duplicados clássicos, que se encontram geralmente próximos ao gene funcional do qual se derivaram através da duplicação, os pseudogenes processados aparentemente se inserem no DNA em posições ao acaso. Esse acaso é o que se esperaria de uma molécula de RNA que pudesse flutuar livremente, afastando-se de seu gene original (do qual ela foi transcrita), antes que uma cópia fosse reinserida no DNA. Mesmo se codificar uma seqüência correta de aminoácidos, um pseudogene processado geralmente não é funcional porque faltam a ele as seqüências regulatórias (como um promotor transcricional), necessárias para a expressão gênica; uma seqüência como esta, por ser uma cópia extra não-funcional, pode acumular mutações aleatórias sem sofrer qualquer pressão seletiva, ou seja, sem reduzir o sucesso reprodutivo de um organismo portador de tais mutações.

Não se deve confundir os pseudogenes processados com um pequeno número de cópias retropostas de genes que são, na verdade, genes funcionais. Estes podem surgir porque, raramente, uma cópia de DNA de um RNA processado pode se inserir no DNA de uma forma em que a cópia possa se expressar ativamente. Nestes casos, pode ser que a seqüência de DNA se mantenha funcional, continuando assim sob pressão seletiva contra o acúmulo de mutações. Embora seqüências como essas --que podem ser chamadas de genes processados ou genes retropostos-- representem uma ínfima fração das cópias retropostas de genes observadas, mais de uma dúzia delas já foram descobertas, especialmente como cópias de genes que se expressam especificamente nos testículos (Kleene et al, J Molec Evol 47: 275, 1998). Estes genes retropostos são facilmente diferenciáveis dos pseudogenes processados pela sua falta de mutações incapacitantes. O fato de que essas poucas cópias retropostas de DNA sejam genes úteis não nos sugere qualquer função para os pseudogenes processados, muito mais numerosos, que possuem múltiplas mutações incapacitantes, como códons de parada, que impossibilitariam sua expressão como proteínas funcionais.

Evolucionistas tão antigos quanto Darwin apontavam as estruturas vestigiais --como olhos sem função de animais cegos habitantes de cavernas, ou ossos pélvicos rudimentares de algumas cobras-- como apoios ao ponto de vista evolucionário. Estas estruturas não possuem nenhuma função aparente que pudesse explicar seu projeto por um criador, mas podem facilmente ser compreendidas sob a perspectiva evolucionária como derivadas de estruturas que tinham sido funcionais em espécies ancestrais. Seqüências genéticas vestigiais --isto é, pseudogenes-- fornecem exceelentes exemplos de estruturas vestigiais, e logo evidências especialmente convincentes da evolução. Seqüências como essas podem ser estudadas em diversas espécies; seu relacionamento com sua duplicata funcional é óbvio e quantitativo (baseado no número de discrepâncias entre as seqüências do gene e do pseudogene); e pode-se assumir que o subconjunto dos pseudogenes processados --com raras e facilmente reconhecíveis exceções-- tem sido totalmente não-funcional desde o momento de sua origem. Finalmente, os pseudogenes são uma rica fonte de dados por serem abundantes. O seqüenciamento recentemente concluído do cromossomo humano 22 (Dunham et al, Nature 402:489, 1999) identificou 134 pseudogenes, juntamente com 545 genes na região seqüenciada, o que corresponde a aproximadamente 1,1% do genoma humano. Se esta amostra for representativa podemos esperar, grosso modo, 15.000 pseudogenes no genoma humano.

2.2.2 Retroposons

Como uma seqüência de RNA processado poderia encontrar seu caminho de volta para o DNA? Na verdade, os pseudogenes processados são membros de uma classe muito maior de seqüências, conhecidas como elementos retropostos, que eu chamarei de "retroposons", e que envolvem todos seqüências de RNA que foram inseridas no DNA. Como foi discutido acima, na fisiologia molecular celular normal, a informação genética passa do DNA para o RNA e daí para a proteína. Às vezes, porém, ocorre um acidente genético e o RNA se torna reversamente transcrito em DNA ("retro", ou ao contrário da direção normal) e o DNA é depositado de volta (ou "retroposto") em uma posição aleatória no DNA da célula. (veja a Figura 4) Alguns leitores talvez reconheçam a retroposição como o mecanismo pelo qual os retrovírus como o HIV --o vírus da AIDS-- se esconde no DNA das células T dos pacientes. Como no caso do HIV, uma exigência crítica para qualquer retroposição é a atividade de uma enzima chamada transcriptase reversa (TR), que gera uma cópia DNA de uma seqüência de RNA. Não se conhece, até o presente momento, nenhum gene que codifique esta enzima no genoma humano, com exceção das cópias associadas a elementos que sofreram a retroposição. A enzima TR não possui nenhuma função na fisiologia celular normal, embora pareça que uma variação especializada da transcriptase reversa esteja envolvida na manutenção dos telômeros, que são seqüências repetitivas nas extremidades dos cromossomos. Assim que uma cópia DNA de um RNA tiver sido sintetizada pela TR, ela pode ser inserida em intervalos no DNA. Estes intervalos ocorrem de tempos em tempos na célula, e são normalmente preenchidos por um complexo mecanismo de enzimas de reparo de DNA, necessárias a todas as células. Intervalos como esses freqüentemente ocorrem em posições ligeiramente diferentes nas duas fitas de DNA, produzindo "extremidades desencontradas"; seqüências de retroposons inseridas entre estas extremidades são freqüentemente acompanhadas em ambos os lados por seqüências idênticas curtas, criadas para o conserto das duas "extremidades desencontradas".
 
 
[Fig3]
Figura 4. A formação de um retroposon ocorre quando uma seqüência de DNA se torna transcrita em RNA, que então é "reversamente transcrito" de volta em DNA. No alto da figura, à esquerda, vemos um cromossomo como ele se apresenta exatamente antes da divisão celular, parecendo-se com duas salsichas amarradas juntas no centrômero. Um gene, em um dado cromossomo, pode dar origem a vários pseudogenes, que geralmente se inserem aleatoriamente em diferentes cromossomos. Um mecanismo similar dissemina inserções de SINEs, LINEs e Alus.

Entre os muitos tipos de retroposons conhecidos pelos biólogos moleculares, mencionarei quatro classes principais, encontradas no DNA humano.

a. Pseudogenes Processados. Em geral, os pseudogenes processados (descritos acima) vem sendo descobertos à medida em que os cientistas têm vasculhado o genoma (usando técnicas que vão além do escopo deste artigo), procurando por seqüências similares a genes conhecidos. Essas buscas descobriram versões mutantes com as características "processadas" descritas acima, levando à sua identificação como retroposons. Como qualquer retroposon, essa classe somente poderia ter entrado no DNA germinativo (ou seja, no DNA das células sexuais que permitem a propagação para as gerações futuras) se as células germinativas contivessem dois componentes: transcrições em RNA do gene e transcriptase reversa (TR) para copiá-las de volta em DNA. Consideremos estes dois componentes um de cada vez. Muitas das proteínas mais conhecidas são encontradas somente em tecidos diferenciados específicos, e não se expressam em nenhum outro lugar. A hemoglobina, por exemplo, é produzida somente nas células sangüíneas e em seus precursores, e as proteínas de pigmento visual somente são produzidas nos olhos. Os genes para essas proteínas específicas de tecidos quase nunca são transcritos em células germinativas, e assim raramente contribuem para os pseudogenes processados. Por outro lado, todas as células possuem certas proteínas de "serviços domésticos", necessárias para funções metabólicas básicas; transcrições do RNA que codificam essas proteínas estão presentes nas células germinativas e freqüentemente contribuem para os pseudogenes processados. O gene da gliceraldeído-3-fosfato desidrogenase, por exemplo, é um gene de "serviço", representado por aproximadamente 10 pseudogenes processados no DNA humano (Ercolani et al, JBC 263:15335,1988). Conforme foi mencionado acima, como as seqüências dos pseudogenes processados não têm inclusas as seqüências promotoras necessárias para iniciar a transcrição do RNA, esses pseudogenes, uma vez inseridos no DNA, não são transcritos e logo não podem eles próprios representar um gene fonte para futuros retroposons. (Esta limitação contrasta com características de outras classes de retroposons, como veremos a seguir.) O outro componente necessário para a retroposição é a transcriptase. A TR não se apresenta na maioria dos tecidos normais em quantidades mensuráveis, embora possa se expressar se uma célula for infectada por um retrovírus portador do gene para esta enzima. Células germinativas, no entanto, são um tipo de célula na qual se pode encontrar atividade de TR, na ausência de retrovírus infecciosos. Nessas células, a enzima aparentemente é derivada de outros elementos retropostos --a serem discutidos abaixo-- portadores de genes funcionais da TR em sua seqüência.

b. SINEs. A classe de Elementos Intercalados Curtos (Short Interspersed Elements ou SINEs) melhor caracterizada nos primatas, é conhecida como as seqüências Alu. Estas possuem aproximadamente 300 bp de comprimento e não codificam nenhuma seqüência de proteínas. Estima-se que aproximadamente um milhão de cópias de seqüências Alu estejam espalhadas no DNA humano (Smit, Curr Opin Genetics & Devel. 6:743,1996). Diferentemente dos pseudogenes processados, que geralmente não são transcritos, as seqüências Alu têm incluso um segmento que pode agir como um promotor transcricional interno; logo, cada inserção Alu pode potencialmente ser transcrita em RNA, servindo como fonte para uma nova inserção. Essa propriedade pode parcialmente explicar como essas seqüências se tornaram tão abundantes nos nossos genomas. Porém, indícios atuais sugerem que somente algumas poucas seqüências Alu são fontes ativas de transcrições; talvez a transcrição, para a maioria das cópias, seja inibida pelo ambiente cromossômico da inserção (Englander e Howard, JBC 270:10091, 1995). Mesmo se existirem transcrições de RNA de Alu em algumas células germinativas, elas só se reinserem no DNA raramente, pois esse passo exige a transcriptase reversa, que pode não estar presente nas mesmas células onde o RNA da Alu está sendo transcrito.

c. LINEs. Os Elementos Intercalados Longos (Long Interspersed Elements) representam uma família de seqüências correlacionadas que estão presentes no nosso DNA em umas seis milhões de cópias (Smit, Curr Opin Genetics & Devel. 6:743,1996). Elas diferem das seqüências Alu por serem potencialmente muito mais longas --até aproximadamente 7000 pares de bases-- e por conterem duas seqüências potencialmente codificantes. Uma dessas seqüências codificantes possui similaridade com genes ativos da TR. Embora na maioria das cópias LINE os genes da TR contenham numerosas mutações que evitariam que eles codificassem qualquer enzima TR fucional, certas cópias LINE codificam mesmo transcriptase reversa ativa. Além disso, as regiões regulatórias imediatamente fora das seqüências codificantes das LINEs causam a expressão dos genes seletivamente nas células germinativas. Assim, as LINEs possuem várias propriedades esperadas de seqüências "egoístas" de DNA, que podem se disseminar no DNA hospedeiro simplesmente pelo fato de codificarem seu próprio mecanismo de disseminação. As LINEs podem se expressar como RNA em células germinativas , e as raras cópias que codificam TR podem permitir a transcrição reversa do RNA LINE de volta em uma cópia de DNA, que pode não se inserir em novas posições no DNA da célula germinativa; quando uma célula como essa amadurece tornando-se um óvulo ou espermatozóide, pode ocorrer a transmissão da nova LINE para gerações futuras. Aparentemente, a TR muitas vezes cai para fora do RNA antes que a transcrição reversa se complete, já que a maioria das cópias da LINE são truncadas nas suas extremidades 5'. É possível que a atividade da transcriptase reversa codificada pela LINE possa também produzir as cópias reversamente transcritas de outros RNAs -- como transcrições de Alu e transcrições RNA de genes-- que levem a novas inserções de seqüências Alu e pseudogenes processados no DNA celular.

d. Retrovírus endógenos. Descobriu-se que os retrovírus infecciosos, que têm sido intensamente estudados, agem em doenças humanas. Eles são os mais complexos entre os elementos de retroposição e talvez tenham evoluído a partir de outros mais simples, como os descritos acima. Todos contém duas Repetições Terminais Longas (LTRs) não-codificantes idênticas em suas extremidades, assim como três genes conhecidos como gag, pol e env. Estes genes não são codificados no vírus pelo DNA, mas pelo RNA. O gene pol codifica a transcriptase reversa, e pode também codificar atividades enzimáticas adicionais. O gene env codifica proteínas que cobrem a superfície externa (envelope) do vírus infeccioso. O gene gag codifica proteínas adicionais, necessárias para o processamento dos componentes virais. Assim, estrutura comum a todos os retrovírus é LTR-gag-pol-env-LTR. O LTR "esquerdo" inclui seqüências regulatórias que podem iniciar a transcrição do RNA em direção à direita, no gag-pol-env-LTR; o LTR "esquerdo" é então recopiado a partir do LTR "direito" por um mecanismo complexo. Entre os retrovírus infecciosos incluem-se o HTLVI, que causa um tipo de leucemia em humanos, e o HIV, que causa a AIDS. Tipicamente, estes vírus infectam tipos específicos de células brancas do sangue --os linfócitos-- e inserem cópias reversamente transcritas de genes do RNA no DNA dessas células. Logo após a descoberta dos retrovírus infecciosos, os cientistas notaram que seqüências similares estavam presentes no DNA de várias espécies de mamíferos, inclusive no homem; estas cópias são chamadas de retrovírus endógenos, e presumivelmente representam as conseqüências de antigas infecções retrovirais de células germinativas. No DNA humano, existem aproximadamente 8 classes diferentes de retrovírus endógenos, com os membros de cada classe variando em número de uma a 50 cópias. Essencialmente, todos esses retrovírus endógenos contém mutações que teriam interrompido o funcionamento de seus genes, como seria esperado se eles se inserissem há milhões de anos atrás, sem qualquer pressão seletiva para preservar a função dos genes. Além disso, as seqüências duplicadas de LTR representam alvos em potencial para eventos de "recombinação homóloga", que deletam o DNA entre a região correspondente dos LTRs, deixando apenas uma única seqüência composta de LTR; existem muito mais cópias destes fragmentos isolados de LTR do que cópias retrovirais completas no DNA.

3. Como erros antigos podem persistir em espécies modernas

De que forma cada um dos muitos tipos de seqüências não-funcionais mencionadas acima , surgindo em uma célula germinativa de um indivíduo específico, poderia ser preservado em todos os indivíduos de uma espécie? Uma possibilidade é que cada uma dessas seqüências tenha por acaso ficado próxima a um gene vantajoso, que tenha se tornado prevalente em uma população através da seleção natural (o pseudogene ou retroposon "pegou carona" no gene vantajoso próximo) (veja Nurminsky et al, Nature 396:572,1998). Possivelmente, essas seqüências não-funcionais surgem em uma freqüência elevada e nós vemos somente aquelas poucas que se preservam por influências indiretas como essas ou por eventos casuais em pequenas populações.

O ônus extra de carregar mesmo uma grande seqüência de pseudogenes --por exemplo, 100.000 nucleotídeos-- é insignificante para uma célula de um mamífero com aproximadamente três bilhões de nucleotídeos em informações. Em todo caso, não há nenhum mecanismo de "revisão" conhecido, pelo qual a célula poderia distinguir DNA funcional de não-funcional e seletivamente eliminar o que ela não precisa. As seqüências não-funcionais de DNA que os cientistas inserem no DNA de camundongos e outras espécies são fielmente passadas para os descendentes, e os pseudogenes e retroposons que ocorrem naturalmente se comportam, provavelmente, de maneira similar. O acúmulo de DNA não-funcional não é totalmente livre de oposição; deleções de DNA realmente ocorrem, mas aparentemente como acidentes raros que não discriminam entre seqüências funcionais e não-funcionais. Deleções que removem genes funcionais cruciais têm sido identificadas como causas raras de doenças genéticas; a redução da adaptabilidade dos indivíduos portadores tenderia a eliminar cópias com esse tipo de deleções. Outras deleções que por acaso não removem nenhum gene funcional poderiam eliminar um pouco de DNA inútil, inclusive pseudogenes e retroposons; mas um indivíduo com uma deleção desse tipo não teria nenhuma vantagem seletiva em particular como resultado da deleção, logo, a disseminação de cópias de DNA portando a deleção para o restante da população não seriam mais prováveis que a disseminação de qualquer outra mutação sem maiores conseqüências. Assim, eventos de deleção como esses são claramente um mecanismo ineficiente de "remoção de lixo"; e, como conseqüência inevitável desta ineficiência, quantidades substanciais de seqüências "lixo" sem função se acumularam entre os genes funcionais dos mamíferos. Essa é uma característica do material genético que não havia sido apreciada, até que a tecnologia do DNA recombinante permitiu que os biólogos moleculares olhassem além das seqüências de aminoácidos para a estrutura do próprio DNA. Embora o alto conteúdo de "DNA-lixo" ("junk DNA") tenha inicialmente causado surpresa, quando foi descoberto, nossa compreensão atual dos mecanismos de expansão genômica (duplicação e inserção), e a aparente falta de pressão seletiva significativa para minimizar o tamanho do genoma, combinam-se para fazer com que o acúmulo de seqüências inúteis no nosso DNA pareça inevitável.

4. O argumento do DNA para a evolução: Pseudogenes e retroposons compartilhados

A observação crucial que relaciona a descoberta dos pseudogenes e retroposons com a teoria da evolução é esta: alguns pseudogenes e retroposons são compartilhados entre diferentes espécies, como se tivessem sido copiados de um pseudogene ou retroposon de um ancestral comum. Examinemos exemplos de cada uma das classes de "erros" discutidas acima. 
 
B O X  2

Os pseudogenes compartilhados da galactosiltransferase são fascinantes por uma razão que complica o seu uso na argumentação contra os criacionistas: há indícios que sugerem que pode ter havido uma vantagem seletiva para mutações que desativassem esse gene. O produto enzimático do gene catalisa a produção de uma molécula de carboidrato específica, que é encontrada na membrana celular de mamíferos que possuem a enzima, mas também em certas bactérias infecciosas. Indivíduos infectados com essas bactérias se beneficiariam organizando um ataque imunológico a essa molécula de carboidrato. Mas se o mesmo carboidrato aparecesse em suas próprias células, esse ataque poderia danificar seus próprios tecidos. Logo, os indivíduos portadores de mutações na enzima --e, logo, não produzissem o carboidrato em suas próprias células-- ficariam livres para organizar um ataque imunológico focalizado nessa molécula, protegendo-os contra muitas bactérias sem o perigo de danificar seus próprios tecidos. Logo, a pressão seletiva levaria à disseminação de cópias do gene que tivessem sofrido mutações que o incapacitassem. Os criacionistas poderiam argumentar com certa razão que tais mutações poderiam ter ocorrido independentemente em diferentes espécies, como exemplos de microevolução recente após a criação independente das espécies. É possível que diferentes mutações realmente tenham desativado o gene independentemente em vários dos ancestrais dos primatas. Porém, os pseudogenes da galactosiltransferase do homem e do chimpanzé possuem mutações incapacitantes idênticas; logo, é mais provável que o gene tenha sido desativado em um ancestral comum ao homem e ao chimpanzé.

4.1. Pseudogenes unitários em comum. O gene RT6 mencionado acima (2.2.1.a) codifica uma proteína de aproximadamente 230 aminoácidos, expressa na membrana superficial dos linfócitos T de roedores; tanto o pseudogene humano como seu homólogo no chimpanzé contém mutações produzindo os mesmos três códons de parada que evitariam a síntese de uma proteína RT6 (Haag et al, M Mol Biol 243:537,1994). Vários dos pseudogenes dos receptores humanos do odor, mencionados acima, são encontrados em outros primatas, e compartilham os mesmos defeitos dos pseudogenes humanos (Rouquier S et al., Nat Genet18:243,1998; Rouquier S, et al. Human Molec Genet &:1337,1998; Sharon et al., Genomics 61:24,1999). O pseudogene humano da urato oxidase tem três mutações incapacitantes em comum com os pseudogenes do chimpanzé e do orangotango (Wu et al, J Mol Evol 34:78, 1992). Além disso, o pseudogene da galactosiltransferase presente no genoma humano é compartilhado com macacos antropóides e macacos do Velho Mundo (Galili e Swanson, PNAS 88:7401, 1991) embora a interpretação evolucionária desses pseudogenes compartilhados da galactosiltransferase seja complexa, por poder ter havido uma pressão seletiva para desativar essa enzima (veja Box 2).

No caso do pseudogene unitário da GLO dos humanos, sabe-se que a vitamina C é necessária na dieta de outros primatas, mas não na de outros mamíferos (exceto porquinhos-da-índia); presumivelmente, primatas não humanos portam pseudogenes GLO como o homem (enquanto que a maioria dos mamíferos porta genes funcionais). Neste caso, não há razão para se supor nenhuma pressão seletiva para desativar a enzima, mas ao invés disso uma ausência de pressão seletiva para manter a função. A teoria da evolução faria uma forte predição de que se descobriria que os primatas parentes próximos do homem possuem pseudogenes GLO, e que estes portam mutações incapacitantes similares às encontradas no pseudogene humano. Essa predição tinha sido declarada em versões anteriores deste ensaio. Foi relatada recentemente uma confirmação dessa predição. Uma pequena seção da seqüência do pseudogene GLO foi recentemente comparada entre o homem, o chimpanzé, o macaco reso e o orangotango; descobriu-se que todos os quatro pseudogenes compartilhavam uma deleção incapacitante de um único nucleotídeo, que faria com que o restante da proteína fosse traduzido num enquadramento errado de leitura de trincas (Ohta e Nishikimi, BBA 1472:408, 1999).

Resumindo, embora os pseudogenes unitários sejam relativamente raros no homem, a maioria dos exemplos relatados são compartilhados com outros primatas não-humanos.

(Os únicos outros exemplos de pseudogenes unitários humanos de que eu tenho conhecimento são exclusivos do homem, tendo aparentemente adquirido seus defeitos incapacitantes após a separação homem-chimpanzé; essas seqüências correspondem ao CMP-ácido siálico hidroxilase [Chou et al., PNAS 95:11751, 1998] e o gene variável V10 do locus gama do receptor da célula T humana [Zhang et al., Immunogenetics 43:196, 1996]. Convido os leitores a me informarem sobre pseudogenes unitários adicionais.)

4.2. Pseudogenes duplicados clássicos. Existem muitos exemplos de pseudogenes em comum deste tipo; descreverei um. O gene do esteróide 21-hidroxilase codifica uma enzima envolvida no metabolismo dos hormônios esteróides. No DNA humano, a seqüência do gene da 21-hidroxilase, assim como um gene adjacente que codifica o "complemento C4," foi duplicado; ou seja, cópias quase idênticas dos segmentos de DNA ficam adjacentes uma à outra, cada uma contendo um gene do complemento C4 e uma seqüência do esteróide 21-hidroxilase. Porém, somente a cópia "B" do gene da 21-hidroxilase é funcional; a cópia "A" em todos os humanos é um pseudogene, ou seja, contém múltiplas mutações, incluindo uma deleção de 8 bp que impediria seu funcionamento. A seqüência da cópia "A" correspondente do chimpanzé foi examinada; ela contém a mesma deleção incapacitante de deleção de 8 bp, vista no pseudogene humano (Kawaguchi, Am J Hum Genet 50:766-80, 1992).

Muitos dos pseudogenes centroméricos peculiares descritos acima (na seção 2.2.1.b) estão também conservados em outros primatas (Eichler et al., Human Molec Genet 5:899, 1996; Regnier et al, Human Molec Genet 6:9, 1997; Grewal et al., Gene 227: 79, 1999).

4.3. Pseudogenes processados. Como o DNA humano contém, grosso modo, quatro vezes mais pseudogenes processados que pseudogenes duplicados clássicos (extrapolando a partir de dados do cromossomo 22 [Dunham et al, Nature 402:489, 1999]), existem muito mais exemplos de pseudogenes processados (do que pseudogenes clássicos) compartilhados entre as espécies. Descreverei um que meus colegas e eu descobrimos: um pseudogene derivado do gene que codifica a épsilon imunoglobulina -- um tipo de anticorpo que participa naas reeações alérgicas. Em nossos estudos, direcionados para a investigação das bases para a alergia, descobrimos uma seqüência que lembrava o gene da épsilon imunoglobulina, com a exceção de que não possuia íntrons, possuía mutações incapacitantes múltiplas, possuía nas extremidades uma seqüência de "A"s quase contínuos (parecendo-se com uma região poli-A levemente mutada), e era localizada num cromossomo diferente (o cromossomo 9) daquele do gene funcional (cromossomo 14) (Max et al. Cell 29:691, 1982; Battey et al. PNAS 79:5956, 1982). Nossos indícios sugeriam que esse pseudogene processado também existiria no DNA do chimpanzé, e investigações detalhadas subseqüentes por outros laboratórios (Kawmura e Ueda, Genomics 13:194,1992) demonstraram existirem pseudogenes quase idênticos no chimpanzé, gorila, orangotango e macacos do Velho Mundo. Como no caso de todas as inserções de DNA compartilhadas entre diferentes espécies (veja outros exemplos abaixo), o argumento de que essas seqüências não foram criadas independentemente, mas sim descenderam de uma inserção em um ancestral comum, é reforçada pela demonstração de que elas ocorreram no mesma posição no DNA de cada espécie, ou seja, o DNA que circunda a inserção é muito similar entre as espécies --tão próximo ao idêntico quanto se poderia esperar, dada a ocorrência de mutações para as quais não há seleção contrária.

4.4. SINEs. Entre os aproximadamente um milhão de cópias de seqüências Alu no genoma humano, somente uma pequena fração já foi comparada entre o homem e outras espécies de primatas. Entretanto, em vários segmentos longos do DNA em que as seqüências correspondentes foram obtidas no DNA humano e do chimpanzé, quase todas as seqüencias Alu são comuns entre estas duas espécies. Por exemplo, no grupo ("cluster") de genes da (alpha)-globina a que nos referimos acima, todas as sete seqüências Alu encontradas no DNA humano estão presentes no chimpanzé, encaixadas exatamente nas mesmas posições(Sawada et al. J Mol Evol 22:316, 1985). O mesmo também é verdadeiro para as sete seqüências Alu próximas a um pseudogene derivado do gene de cópia única cdc27hs (Gonzalez et al., Genomics 18:29, 1993).

As seqüências de muitas repetições de Alu no DNA humano têm sido comparadas, permitindo a classificação em várias famílias, baseadas no grau de similaridade das seqüências. Membros de certas famílias são encontrados no DNA de muitos primatas diversos, enquanto que outras famílias parecem ter sido dispersadas mais recentemente, por não serem compartilhadas por outras espécies. Sabe-se que vários exemplos de inserções da família "mais jovem" são polimórficos na população humana: ou seja, ocorrem em alguns indivíduos, mas não em outros. De fato, a freqüência de certas inserções Alu em diferentes populações humanas tem sido usado para deduzir prováveis padrões de migração e combinação de genes nos nossos ancestrais humanos. Essas observações são coerentes com a inserção dessas cópias Alu após a evolução do homem. Além disso, a saúde excelente de indivíduos que não possuem determinadas inserções Alu apóia a visão de que essas inserções não desempenham qualquer função importante na fisiologia humana.

4.5. LINEs. Numerosas seqüências LINE-1 têm sido encontradas no homem e em outras espécies na mesma posição no DNA, inclusive exemplos no locus da globina, genes de pigmento visual, e na fosfatase alcalina (revisto por Smit et al. J Mol Biol 246:401,1995). Alguns dos exemplos relatados são compartilhados por espécies tão díspares como o homem e a vaca, indicando inserções em ancestrais mamíferos muito antigos.

4.6. Retrovírus endógenos. Como os retrovírus endógenos são menos numerosos que as outras seqüências não funcionais de DNA discutidas aqui, e como apenas uma fração relativamente pequena das seqüências conhecidas do DNA humano foi comparada entre as espécies, há uma escassez de exemplos de retrovírus endógenos compartilhados. Entretanto, pelo menos cinco diferentes exemplos de seqüências retrovirais quase idênticas, encaixadas na mesma posição no DNA do homem e do chimpanzé, já foram relatadas (Bonner et al. PNAS 79:4709, 1982; Dangel et al. Immunogenetics 42:41, 1995; Svensson et al. Immunogenetics 41:74,1995; Medstrand & Mager, J Virol 72:9782, 1998; Barbulescu et al. Curr Biol 9:861, 1999), todos aparentemente exemplos de retrovírus que foram "pegos" por nossos ancestrais há milhões de anos. Podemos prever que exemplos adicionais serão descobertos à medida em que mais dados sobre seqüências forem disponibilizados, especialmente no cromossomo Y, que tem sido descrito como um "cemitério" de seqüências de retrovírus endógenos tanto para o homem como para o chimpanzé (Kjellman et al. Gene 161:163, 1995).

4.7 Implicações de seqüências sem função compartilhadas entre espécies

Todos os exemplos de seqüências sem função compartilhadas entre humanos e chimpanzés reforçam o argumento a favor da evolução, que seria convincente mesmo se apenas um exemplo fosse conhecido. Esse argumento pode ser compreendido pela analogia com os casos jurídicos discutidos anteriormente, nos quais os erros em comum foram reconhecidos como prova da cópia. O aparecimento do mesmo "erro"-- isto é, o mesmo pseudogene inútil ou seqüência Alu ou retrovírus endógeno na mesma posição no DNA do homem e do macaco-- não podem ser logicamente explicados por origens independentes das duas seqüências. O argumento criacionista discutido acima --de que similaridades na seqüência do DNA simplesmente refletem os planos do criador para funções similares de proteínas em espécies similares-- não se aplica a seqüências que não possuem nenhuma função no organismo que as abriga. A possibilidade de que acidentes genéticos idênticos criem os mesmos dois pseudogenes ou Alus ou retrovírus endógenos independentemente em duas espécies diferentes por acaso é tão remota que pode ser descartada. Como nos casos de direitos autorais discutidos acima, "erros" em comum como esses indicam que deve ter ocorrido algum tipo de cópia. Como não há nenhum mecanismo conhecido pelo qual seqüências de macacos modernos pudessem ser copiadas na mesma posição no DNA humano, ou vice-versa, a existência de pseudogenes ou retroposons compartilhados leva à conclusão lógica de que tanto a seqüência do homem como a do macaco foram copiadas de seqüências ancestrais, que dever ter surgido em um ancestral comum dos homens e macacos.

Esses indícios de um ancestral comum tornam conclusivo o argumento a favor da evolução homem/macaco que decorre das seqüências não funcionais em comum. Embora os exemplos melhor documentados dessas seqüências compartilhadas por diferentes espécies coincidentemente liguem homens e macacos (veja por exemplo Hamdi et al, J Mol Biol 284:861, 1999), isso simplesmente reflete o fato de que o DNA humano tem sido estudado mais intensamente que o de qualquer outra espécie superior, ao mesmo tempo que também é conhecida uma quantidade considerável de seqüências homólogas no chimpanzé. É óbvio, no entanto, que uma lógica idêntica poderia ser utilizada para ligar outras espécies em diferentes ramos da árvore evolucionária e exemplos disso têm sido relatados, por exemplo SINEs esclarecendo parentescos entre espécies de roedores (Furano J Biol Chem. 270: 25301, 1995; Verneau et al, PNAS 95: 11284, 1998) ou ligando cavalos a rinocerontes (Gallagher et al, Mamm Genome:140, 1999). Espécies tão díspares como humanos e camundongos têm sido ligadas por exemplos da antiga família de SINE conhecida como MIRs (Mammalian-wide Interspersed Repeats - repetições intercaladas amplamente distribuídas entres os mamíferos; veja Smit e Riggs, Nucleic Acids Research 23:98, 1995; Jurka et al, Nucleic Acids Research 23:170, 1995) que foram encontradas encaixadas na posição homóloga da mioglobina dos genes N-myc humanos e murinos (Donehower, Nucleic Acids Research 17:699, 1989; observe que, no momento dessa descrição, a seqüência conservada não tinha sido reconhecida como SINE). Além disso, antigas inserções LINE-1 ligam humanos à vaca, como foi mencionado acima (inserções LINE similares situadas na porção anterior no sentido de leitura dos genes da fosfatase alcalina intestinal em ambas as espécies), assim como ao rato (inserções LINE similares no primeiro íntron da subunidade alfa2 dos genes da sódio-potássio ATPase; Smit et al, J Mol Biol 246:401, 1995) e ao camundongo (por exemplo, inserções LINE na região mnd2 do cromossomo 2p12 [Jang et al, Genome Res 9:51, 1998] e próximas ao gene CD4 no cromossomo humano 12p13 [Ansari-Lari et al Genome Res 8:29, 1998]). Com as comparações adicionais de seqüências de longos trechos homólogos do DNA do homem e do camundongo, previstas pelo Projeto Genoma Humano e pelo Projeto Genoma do Camundongo, serão provavelmente descobertas seqüências LINE adicionais em comum entre essas espécies.

Um exemplo particularmente impressionante de retroposons em comum foi relatado recentemente, ligando os cetáceos (baleias, golfinhos e botos) aos ruminantes e hipopótamos e é instrutivo apreciar esse exemplo detalhadamente. Os cetáceos são animais marinhos que possuem importantes similaridades com os mamíferos terrestres; mais especificamente, as fêmeas possuem glândulas mamárias e amamentam sua prole. Os cientistas, ao estudar a anatomia e a fisiologia dos mamíferos, demonstraram maiores similaridades entre os cetáceos e o grupo de mamíferos chamado de artiodáctilos (ungulados de dedos pares) entre os quais se incluem as vacas, carneiros, camelos e porcos. Estas observações levaram à visão evolucionista de que as baleias evoluíram de um ancestral artiodáctilo quadrúpede que vivia em terra. Os criacionistas exploraram as óbvias diferenças entre os artiodáctilos conhecidos e as baleias, e ridicularizaram a idéia de que elas poderiam ter tido ancestrais quadrúpedes terrestres. Os criacionistas, que afirmam que os cetáceos não surgiram de mamíferos quadrúpedes terrestres, têm que ignorar ou de alguma forma desprezar os indícios fósseis de ancestrais aparentes da baleia, que têm a aparência exata que se poderia prever de uma espécie transicional entre mamíferos terrestres e baleias -- com pernas diminutas e estruturas auriculares intermediárias entre as dos artiodáctilos modernos e as dos cetáceos (Nature 368:844,1994; Science 263: 210, 1994). (Uma discussão a respeito da espécie fóssil ancestral da baleia, com referências, pode ser encontrada em http://www.talkorigins.org/faqs/faq-transitional/part2b.html#ceta (em inglês)) Os criacionistas também têm que ignorar ou desprezar os indícios que mostram a grande similaridade entre as seqüências de genes dos cetáceos e artiodáctilos (Molecular Biology & Evolution 11:357, 1994; ibid 13: 954, 1996; Gatesy et al, Systematic Biology 48:6, 1999).

Recentemente, a prova pelos retroposons solidificou o parentesco evolucionário entre baleias e artiodáctilos. Shimamura et al. (Nature 388:666, 1997; Mol Biol Evol 16: 1046, 1999) estudaram seqüências SINE que estão altamente reduplicadas no DNA de todas as espécies de cetáceos examinadas. Descobriu-se que essas SINEs também estão presentes no DNA de ruminantes (inclusive vacas e carneiros), mas não no de camelos e porcos, ou mamíferos de parentesco mais distante, como o cavalo, o elefante, o gato, o homem ou o canguru. Essas SINEs aparentemente tiveram origem em algum ramo específico de artiodáctilos ancestrais, depois que esse ramo se separou do dos camelos, porcos e outros mamíferos, mas antes da separação das linhas que levaram aos modernos cetáceos, hipopótamos e ruminantes. (Veja Figura 5.) Para corroborar este cenário, Shimamura et al. idenficaram duas inserções específicas desses SINES no DNA da baleia (inserções B e C na Figura 5) e demonstraram que, no DNA do hipopótamo, da vaca e do carneiro, esses dois sítios continham os SINES; mas no DNA do porco e do camelo esses mesmos sítios estavam "vazios" de inserções. Mais recentemente, o hipopótamo foi identificado como o parente terrestre mais próximo dos cetáceos, já que os hipopótamos e baleias possuem inserções de retroposons em comum (ilustradas como D e E na Figura 5), que não são encontradas em nenhum outro artiodáctilo (Nikaido et al, PNAS 96:10261, 1999). O parentesco próximo de hipopótamos e baleias é coerente com comparações de similaridade de seqüências relatadas anteriormente (Gatesy, Mol Biol Evol 14:537, 1997). (Alguns leitores ficaram intrigados: se os ruminantes são parentes mais próximos das baleias que dos porcos e camelos, por que são anatomicamente mais semelhantes aos porcos e camelos que às baleias? Aparentemente, isso resulta do fato de que ruminantes, porcos e camelos mudaram relativamente pouco, desde seu último ancestral em comum, enquanto que a linhagem dos cetáceos mudou drasticamente na adaptação a um estilo de vida aquático, desaparecendo assim muitas das características -- como cascos, peles e patas traseiras -- que são comuns aos ruminantes,, seuus parentes próximos e aos porcos e camelos, seus parentes distantes. O parentesco particularmente próximo entre baleias e hipopótamos, é coerente com várias adaptações comuns à vida aquática, inclusive o uso de vocalizações subaquáticas para a comunicação, e a ausência de pêlos e glândulas sebáceas.) Assim, a prova dos retroposons fortemente confirma que as baleias se derivam de um ancestral em comum com os hipopótamos e os ruminantes, coerente com a interpretação evolucionária dos fósseis e das similaridades de seqüências de DNA em geral. E de fato, a lógica da prova pelos SINEs em comum é tão forte que eles podem ser as melhores características disponíveis para a dedução do parentesco entre espécies (Shedlock e Okada, Bioessays 22:148, 2000).
 
 

[Fig4]
Figura 5. Inserções SINE específicas podem funcionar como "rastreadores", que iluminam relacionamentos filogenéticos. Esta figura resume alguns dos dados sobre SINEs encontrados em artiodáctilos vivos, e mostra como as inserções compartilhadas podem ser interpretadas em relação às ramificações evolucionárias. Um evento específico de inserção de SINE ("A" na Figura), que aparentemente teria ocorrido em um ancestral primitivo comum aos porcos, ruminantes, hipopótamos e cetáceos,  já que essa inserção está presente nestes descendentes modernos do referido ancestral; mas está ausente nos camelos, que divergiram das outras espécies antes desta SINE ser inserida. Inserções B e C mais recentes estão presentes apenas em ruminantes, hipopótamos e cetáceos, identificando assim os hipopótamos como os parentes vivos mais próximos dos cetáceos (pelo menos entre as espécies examinadas nesses estudos). As inserções de SINE F e G ocorreram na linhagem dos ruminantes depois que eles divergiram das outras espécies; e as inserções H e I ocorreram após a divergência da linhagem dos cetáceos.

Embora alguns criacionistas aceitem as provas da seleção natural de variações menores (por exemplo, a divergência dos pintassilgos de Darwin nas ilhas Galápagos), que eles chamam de "microevolução," a maioria deles nega que essa evolução possa explicar mudanças mais significativas, que eles denominam "macroevolução". Entretanto, os pseudogenes/retroposons compartilhados descritos aqui, fornecem fortes indícios de que os humanos possuem ancestrais em comum com espécies tão díspares como macacos, vacas e camundongos. Assim, mesmo que talvez faltem provas convincentes de que algum fóssil em particular seja ancestral de alguma espécie moderna específica e mesmo que não tenhamos indícios fósseis que claramente identifiquem o último ancestral em comum entre humanos e vacas, ou entre baleias e ruminantes, podemos ter confiança, pelos erros em comum descritos aqui, que essas espécies ancestrais em comum existiram. Essa conclusão, além disso, implica em que novas características importantes (por exemplo, a postura ereta ao caminhar e o desenvolvimento do cérebro do homem, e as adaptaçõs dos cetáceos à vida aquática) devem ter sido desenvolvidas entre o tempo em que seus respectivos ancestrais comuns viviam e o presente. Essas mudanças são claramente grandes o bastante para serem chamadas de "macroevolução", de modo que o "argumento dos erros compartilhados" é uma prova poderosa da macroevolução. Essa conclusão parece sólida, já que na literatura científica não foi proposta nenhuma explicação alternativa para esses erros em comum, que fosse coerente com a origem independente dessas espécies de animais.

Claramente, o argumento dos "erros em comum" fornece fortes provas de mudanças maroevolucionárias na evolução dos mamíferos e conseqüentemente refutam uma posição comumente sustentada pelos criacionistas. Mas, para sermos justos, devemos deixar claro que esse argumento não ganha tudo no jogo evolucionista. Embora os indícios de erros em comum impliquem na descendência comum de diversas espécies de mamíferos, ela não entra no mérito de se essas espécies evoluíram de seus últimos ancestrais em comum através dos mecanismos darwinianos da mutação e seleção natural ou através de outros mecanismos alternativos. Outra limitação é o fato de que não há exemplos de "erros em comum" que liguem os mamíferos a outros ramos da árvore genealógica da vida na Terra. Por exemplo, embora espécies tão diversas como vermes, levedo e plantas possuam elementos LINE em seus genomas, não foi relatado nenhum exemplo de inserções LINE específicas em posições homólogas entre qualquer mamífero e não mamífero, ao que eu saiba (embora eu aprecie informações dos leitores sobre esse assunto). Exemplos assim seriam previsivelmente difíceis de se achar, já que se acredita que os últimos ancestrais comuns entre mamíferos e répteis tenham vivido mais de 200 milhões de anos atrás, tempo suficiente para que similaridades de seqüências que tenham existido em DNA sem função, como pseudogenes e retroposons, podem ter sido grandemente destruídas pelo acúmulo de numerosas mutações. Logo, os parentescos evolucionários entre ramos distantes na árvore genealógica evolucionária devem se apoiar em outros indícios além dos "erros em comum". Como uma limitação final e óbvia do argumento dos "erros em comum", deve ficar claro que esse argumento não tem relação com questões sobre a origem da vida, que os criacionistas costumam agrupar com a evolução.
 

5. Respostas dos criacionistas ao argumento das seqüências não funcionais em comum

Os criacionistas tendem a evitar mencionar o argumento apresentado neste ensaio, já que ele fornece provas convincentes da evolução, mas Duane Gish, porta-voz dos criacionistas, comentou sobre o argumento quando foi confrontado com ele em debates e têm surgido algumas poucas discussões criacionistas sobre pseudogenes. Examinemos primeiro várias das respostas do Dr. Gish.

5.1 Alguns "pseudogenes" processados são funcionais, logo poderiam ser exemplos de "projeto similar para função similar."

Conforme mencionado acima (2.2.1.c), cópias reversamente transcritas de transcrições RNA de genes podem, raramente, se inserir no DNA próximo a um promotor existente, ou de alguma forma que permita sua transcrição de uma maneira útil ao organismo. Essas cópias (que são na verdade genes processados e não pseudogenes processados) podem, por conseguinte, desempenhar alguma função que exerça pressão seletiva contra mutações incapacitantes. Já foram relatados vários exemplos dessa possibilidade, como mencionado acima na seção 2.2.1.c; e isso poderia ser interpretado como "projeto similar para função similar." Mas esses exemplos possuem uma característica em comum que os distingue claramente das centenas de exemplos de pseudogenes processados inúteis relatados: não possuem mutações incapacitantes que impediriam seu funcionamento, logo continuam capazes de codificar uma proteína útil. Entre os pseudogenes processados legítimos -- ou seja, cópias retropostas dee gennes com múltiplas mutações incapacitantes, como códons de parada-- não foi relatado nenhum exemplo com função documentada. (Os leitores que acreditem existir exemplos que contradigam esta afirmação estão convidados a contatar-me com as referências na literatura; modificarei este artigo, se necessário.) Assim, o argumento do Dr. Gish simplesmente reflete seu agrupamento errôneo de duas classes distintas de cópias retropostas de genes: genes processados e pseudogenes processados. E o Dr. Gish ainda não ofereceu qualquer argumento que explique --em termos de função inteligentemente projetada-- os numerosos exemplos de seqüências retropostas em comum que, diferentemente dos pseudogenes, nem mesmo são derivadas de um DNA que tenha papel funcional.

5.2 Descobriu-se recentemente que alguns órgãos, anteriormente considerados vestigiais,  possuem função; sabemos muito pouco sobre essas características recentemente descobertas do DNA para termos certeza de que não será descoberta uma função no futuro.

Imagine um réu julgado por homicídio se defendendo --contra fortes provas incriminadoras-- com um argumento semelhante: que, como alguns criminosos condenados já foram mais tarde inocentados, ele (o acusado neste momento) deveria, por conseguinte, ser absolvido agora, já que algum dia no futuro poderiam ser encontradas provas para livrá-lo! Esta defesa seria tão ridícula quanto o argumento do Dr. Gish. Cientistas (e jurados) devem tirar suas conclusões baseando-se nas melhores provas disponíveis no momento. É verdade que provas posteriores podem inocentar um criminoso condenado, ou derrubar uma teoria científica. Essa possibilidade deve inspirar-nos humildade e prevenir-nos contra conclusões dogmáticas (e talvez contra a pena de morte); mas não deve nos dissuadir de tirar as conclusões mais razoáveis a partir dos dados que temos à mão. Nosso conhecimento presente corrobora a interpretação de que a maioria dos pseudogenes/retroposons em comum são provas da descendência comum e da macroevolução. Se no futuro --para uma seqüência de Alu oou LIINE-1 ou retrovírus endógeno compartilhada entre o homem e outra espécie-- forem descobertas provas de uma função, então essa seqüência específica poderia de fato ser interpretada razoavelmente através do paradigma criacionista de "seqüência similar projetada para função similar"; e assim esse retroposon teria de ser removido da lista de seqüências não funcionais em comum que fornecem provas da evolução. As centenas de milhares de exemplos restantes na lista continuariam a oferecer apoio válido para a evolução.

Além disso, embora essas seqüências vestigiais de DNA tenham sido descobertas mais recentemente que os órgãos vestigiais da época de Darwin, sabemos o bastante sobre como elas surgem para que não precisemos supor nenhum projetista misterioso ou função desconhecida para explicá-las. Sabemos que os pré-requisitos para a formação de SINEs e outros retroposons --ou seja, transcrições de RNA e transcriptase reversa-- estão presentes em baixos níveis em células germinativas estudadas em laboratório, onde elas seriam capazes de, sem qualquer intervenção sobrenatural, gerar retroposons que poderiam ser transmitidos para as futuras gerações. Isso prevê que devem estar ocorrendo inserções de retroposons a uma determinada freqüência, mesmo hoje em dia. De fato, têm sido documentadas inserções específicas de seqüências Alu no DNA de indivíduos vivos. Por exemplo, um elemento Alu foi encontrado inserido no DNA de um paciente com neurofibromatose I, danificando o gene associado com essa doença (Wallace et al. Nature 353:6347, 1991). O pai e a mãe do paciente tinham cópias intactas do gene, sem qualquer inserção de Alu, de forma que a inserção tem que ter ocorrido nas células germinativas de um dos pais, ou muito no início do processo de desenvolvimento embrionário do paciente. Similarmente, foi descoberto que um elemento LINE-1, recentemente inserido, havia danificado o gene para uma proteína de coagulação do sangue, causando a hemofilia em um outro paciente cujos pais não possuíam essa inserção (Kazazian et al. Nature 332:164, 1988). (Outros exemplos de inserções de Alu ou LINE-1 causando doenças, são revistos por Kazazian [em Curr Opin Genet & Devel 8:343, 1998] e por Deininger and Batzer [Molec Genet & Metab 6:183, 1999].) Estima-se que novos eventos de retroposição ocorram em 1% a 10% da população humana (Kazazian, Nature Genet 22:130, 1999). Carlton et al (Mamm Genome 6:90, 1995) observaram surgimento de um novo pseudogene processado quando forneceram uma fonte de transcriptase reversa, infectando células cultivadas com um retrovírus. E, usando um exame sensível para detecção de retroposons, Maestre et al. (EMBO J 14:6388, 1995) foram capazes de detectar cópias retropostas de uma seqüência marcada de uma seqüência de gene sendo inserida no DNA de células humanas, enquanto elas se desenvolviam no laboratório, mesmo sem a adição de transcriptase reversa exógena. Além disso, Jensen e Heidmann (EMBO J 10:1927,1991) detectaram retroposição em andamento de uma cópia marcada de LINE-1 na Drosófila.

Recentemente, Feng et al (Cell 87: 905, 1996) demonstraram que a enzima ativa da transcriptase reversa, codificada por uma cópia de LINE-1 recentemente inserida, tinha uma atividade inesperada adicional: ela é uma endonuclease --isto é, é capaz de criar fendas no DNA que poderiam servir de pontos de inserção para novos eventos de retroposição. De fato, essa endonuclease corta o DNA com características de seqüência específicas e as mesmas características foram observadas nas posições de inserção de várias cópias de LINE-1 selecionadas aleatoriamente no DNA humano. (Veja também Cost e Boeke, Biochemistry 37:18081, 1998). Este resultado sugere que as seqüências LINE-1 são tão bem adaptadas para a replicação "egoísta" no genoma que elas não dependem de quebras aleatoriamente geradas no DNA para suas inserções, mas criam seus próprios cortes. Para testar essa idéia, Moran et al. (Cell 87:917, 1996; veja também Ostertag et al, Nucl Ac Res 28:1418, 2000) construíram uma seqüência LINE-1 projetada de forma que se gerassem qualquer cópia retroposta em quaisquer células, estas células pudessem ser selecionadas e contadas. Quando essa seqüência foi colocada em células cultivadas de tecido humano, cópias retropostas novas foram rotineiramente produzidas. Através de testes dos efeitos das mutações nos vários segmentos da seqüência LINE-1, demostrou-se que uma retroposição eficiente exigia tanto a atividade da transcriptase reversa como a atividade da endonuclease presentes na mesma proteína.

Eventos observados como esses reforçam a idéia de que as seqüências de retroposons que observamos no nosso DNA, e no de outros mamíferos, não foram criadas por forças misteriosas agindo somente num passado remoto para propósitos insondáveis, mas por simples acidentes genéticos que ocorrem em freqüencias baixas, como resultado de caprichos da bioquímica celular e que não têm nenhum propósito. O fato de que muito poucos desses acidentes genéticos possam criar alguma função benéfica (Britten RJ, PNAS 93:9374,1996; Britten RJ, Gene 205:177,1997) de forma alguma enfraquecem esta interpretação; estes eventos são simplesmente exemplos das raras mutações benéficas, cuja ocorrência forma a base para a mudança evolucionária adaptativa, e cuja existência parece tão difícil de engolir para os criacionistas. Como a maioria das mutações, a maioria esmagadora  das inserções de retroposons ocorrem no DNA não funcional entre os genes, e não têm qualquer efeito sobre as células ou o organismo; e é esse vasto conjunto de inserções, compartilhado entre as espécies, que fornece a base para o presente argumento apoiando a evolução.

5.3 Se todas essas seqüências fossem mesmo não-funcionais, teriam sido eliminadas ao longo do tempo evolucionário.

Esse argumento reflete a ignorância dos fatos discutidos acima, na seção 3. Repetindo: não se conhece nenhum mecanismo pelo qual seqüências de DNA não funcional pudessem ser diferenciadas das funcionais e marcadas para a eliminação pelas enzimas celulares. As bactérias sim, parecem estar sob pressão seletiva para eliminar DNA não funcional; os cromossomos das bactérias possuem muito pouco DNA entre os genes, talvez porque a competição sob condições de crescimento rápido possa favorecer cromossomos que se repliquem rapidamente --ou seja, os curtos-- e logo podem selecionar células que tenham deletado qualquer DNA não funcional. Mas não há qualquer indício de uma pressão seletiva como essa para os cromossomos de mamíferos, nos quais os genes são amplamente separados um do outro e nos quais as regiões não funcionais constituem aparentemente de 90 a 95% do DNA. De fato, alguém poderia perguntar: por que então nossos cromossomos não estão recheados com seqüências de retroposons numa freqüência ainda mais alta que a atualmente observada? Uma resposta razoável é que nossos ancestrais estavam sob pressão seletiva para suprimir a retroposição, já que altas freqüências de inserções de retroposons aumentariam a taxa de danos genéticos causados por inserções incapacitantes nos genes. Além disso, é concebível que uma fração maior do que a que atualmente podemos identificar de nosso DNA, tenha se originado através da retroposição; algumas inserções muito antigas de pseudogenes e retroposons podem ter sofrido tantas mutações desde sua inserção que suas identidades como pseudogenes e retroposons tenham sido destruídas. Entretanto, à taxa de mutação estimada para seqüências não selecionadas, a destruição completa de um retroposon típico pelas mutações exigiria mais de 100 milhões de anos. Assim, não seria surpreendente para um evolucionista que seqüências não funcionais de retroposons que se inseriram em um ancestral comum entre humanos e vacas pudesse ainda ser detectável por comparações computadorizadas de seqüências de DNA.

5.4 Foram descobertos papéis importantes para regiões de DNA que anteriormente se pensava serem não-funcionais.

Num recente debate comigo, o Dr. Gish citou uma pesquisa na Science chamada "Mining treasures from 'junk' DNA" (Escavando tesouros no DNA-lixo) (263:608, 1994), parecendo implicar que essa pesquisa sugeriria funções para pseudogenes e retroposons que seriam coerentes com o ponto de vista criacionista de que eles teriam sido projetadas para ter função similar em espécies similares. Na verdade, essa pesquisa discute indícios de possíveis funções de seqüências centroméricas e teloméricas repetitivas, minissatélites, íntrons e regiões 3' não traduzidas. Ela menciona pseudogenes e retroposons, mas não faz nenhuma sugestão de que esses elementos específicos tenham função, de forma que essa pesquisa não oferece nenhum argumento contra os pontos levantados neste ensaio. Assim mesmo, como tem havido outras especulações a respeito de possíveis funções para o DNA fora de seqüências codificantes de genes, vale a pena levar em conta por que os cientistas geralmente aceitam a idéia de que a maioria desse DNA seja lixo.

Em primeiro lugar, nós conhecemos vários mecanismos pelos quais o comprimento do DNA pode ser aumentado através de acidentes genéticos, como as duplicações de DNA e inserções de retroposons, que têm sido observadas em laboratório ou ocorrendo em seres humanos sem efeitos aparentes; logo, é razoável supor que esses mecanismos tenham operado no passado para aumentar o tamanho do genoma, sem afetar o funcionamento. Parece haver pouca ou nenhuma pressão seletiva para reduzir o tamanho dos genomas nucleares dos vertebrados; e não há nenhum mecanismo aparente para seletivamente eliminar o DNA inútil. Grandes deleções que eliminam DNA funcional são eliminadas pela seleção. Estas observações prevêem o acúmulo do DNA inútil, como resultado de acidentes genéticos aleatórios, de forma que quando encontramos um DNA que parece ser não funcional, não devemos necessariamente assumir que ele possui uma função que nós não compreendemos.

Em segundo lugar, quando uma seqüência de DNA é comparada entre espécies como homem versus camundongo, descobre-se que as seqüências que se sabe serem funcionais -- seqüências que codificam genes em particular -- são altamente similares, o que é coerente com a pressão seletiva que extirpa os indivíduos que possuem mutações deletérias nessas regiões funcionais. Por outro lado, regiões de DNA sem nenhuma função conhecida -- por exemplo, seqüências não codificantes entre genes -- geralmente se comportam como se não estivessem sob nenhuma pressão seletiva, isto é,  aparentemente acumulam mutações a uma taxa muito mais alta de forma que há pouca conservação de seqüências entre espécies de parentesco distante. Como uma exceção à regra, comparações de seqüências não codificantes entre espécies ocasionalmente detectam "ilhas" de seqüências curtas, conservadas em regiões não-codificantes, mas estas se revelaram corresponder a regiões regulatórias, como elementos promotores ou enriquecedores, que controlam quando um gene próximo se expressa.  Um exemplo de uma "ilha" como essa, conservada no coelho, no camundongo e no homem, foi descoberta no meu próprio laboratório [Emorine et al., Nature 304:447, 1983]; ela se revelou um enriquecedor importante. Esses tipos de regiões regulatórias geralmente consomem muito menos DNA que as seqüências codificantes dos genes que elas regulam, portanto não podem representar uma função provável para a maioria do DNA não codificante. A boa correlação entre funcionalidade e conservação da seqüência empresta apoio à idéia de que a maioria das seqüências mal conservadas não tem função.

Um terceiro, mas pertinente argumento, se deriva da observação de que a inserção de um retroposon numa seqüência funcional é uma maneira poderosa de destruir a referida função. Exemplos de inserções que ocorrem naturalmente foram discutidas na seção 5.2 acima e a inserção intencional de retroposons está sendo amplamente utilizada como ferramenta de laboratório para criar grupos de linhagens de camundongos, drosófilas e levedo com diferentes funções de genes destruídas. Porém, a maioria dos exemplos de inserções de retroposon entre genes não tem qualquer efeito aparente sobre os indivíduos que as abrigam; por exemplo, as seqüências Alu que são polimórficas no DNA humano, parecem ser inofensivas quando presentes. Logo, é razoável inferir que essas inserções não tenham interrompido nenhuma seqüência funcional. (Naturalmente, é impossível descartar formalmente a possibilidade de que alguma seqüência funcional hipotética fora de genes possa ainda funcionar, a despeito da presença de uma inserção de retroposon.)

Para concluir, conhecem-se vários exemplos de pares de espécies que possuem complexidade aparente similar, mas genomas grandemente diferentes em tamanho (paradoxo do valor-C). o peixe-bola 'fugu' tem mais ou menos um quarto do tamanho do genoma de outras espécies de peixes, mas aproximadamente o mesmo número de genes. A principal diferença é uma menor quantidade de DNA entre os genes no DNA do 'fugu' (por exemplo: veja Elgar et al. Genome Res 9:960, 1999). Embora ainda existam perguntas em aberto sobre a interpretação dessa diferença, parece que muito do DNA entre os genes da maioria dos genomas de peixes (e provavelmente no nosso também) é dispensável. (Por outro lado, as pequenas regiões de seqüências não codificantes que estão conservadas no 'fugu' e no Homo, freqüentemente correspondem a seqüências regulatórias funcionais.)

É impossível provar a ausência de função de qualquer região do DNA. Além disso, é possível que possa ser encontrada alguma função para umas poucas regiões curtas adicionais de DNA não-codificante, que não se reconhece atualmente que possuam função. No entanto, como indicado acima, os cientistas tiram conclusões temporárias baseando-se nos dados então disponíveis, em lugar de possibilidades hipotéticas de dados futuros; e os argumentos que acabei de apresentar, baseados nos indícios atualmente disponíveis, sugerem que a maioria das seqüências de DNA que parecem ser desprovidas de função são simplesmente isso.

5.5 Os pseudogenes têm uma função: servem como uma cópia "backup" que pode ser corrigida de forma a codificar uma proteína útil, caso o gene funcional sofra uma mutação grave.

O Dr. Gish não forneceu nenhum detalhe sobre essa afirmação, mas talvez estivesse se referindo a uma sugestão recente de que um pseudogene de uma ribonuclease seminal bovina tenha sido recentemente "corrigido" de forma a se tornar funcional, através de um processo conhecido como "conversão gênica" (Trabesinger-Ruef et al. FEBS Lett 382:319, 1996). Embora isso possa ocasionalmente acontecer, foram descritos muito mais exemplos na literatura em que os defeitos em um pseudogene induzem mutações destrutivas em um gene funcional próximo, através da conversão gênica, desativando-o. Como exemplo desse tipo de evento: em quase todos os pacientes que sofrem de deficiência da esteróide 21-hidroxilase, por ter sido desativada por mutações sua cópia "B" (normalmente) funcional do gene 21-hidroxilase, essas mutações aparentemente são resultado da conversão gênica da cópia pseudogene "A" (Collier et al, Nat Genet 3:260, 1993; Carrera et al. Hum Hered 43:190, 1996). Pensa-se que conversões gênicas semelhantes por um pseudogene tenham desativado o gene da glucocerebrosidase nos pacientes da doença de Gaucher (Eyal et al. Gene 96:277, 1990). Em outros casos, eventos de conversão gênica aparentemente transferiram informação genética entre dois pseudogenes (Shapiro e Moshirfar, J Mol Biol 209:181, 1989) ou entre dois genes funcionais (Ollo e Rougeon, Cell 32:515, 1983). Como a conversão gênica envolvendo pseudogenes tem sido relatada ocorrendo mais com efeitos prejudiciais ou neutros do que com efeitos benéficos, a hipótese de que os pseudogenes tenham sido "projetados" com a possibilidade da conversão gênica como seu propósito não parece convincente. (O único exemplo em que cópias de pseudogenes claramente realizam mesmo uma função importante, transferindo sua seqüência para outra cópia de gene através da conversão gênica, ocorre na diversificação somática dos genes da região variável da imunoglobulina de galinhas e coelhos; das muitas mutações geradas por este mecanismo, as  poucas que fornecem um "melhor encaixe" entre a imunoglobulina e seu antígeno alvo são selecionadas para a expressão. Essa seleção por uma função melhorada entre genes que sofreram alterações de seqüência quase-aleatórias é um modelo biológico atraente para os aperfeiçoamentos evolucionários da função da proteína. Ironicamente, em vários debates comigo, o Dr. Gish negou que essa diversificação somática ocorra, embora fosse óbvia a sua ignorância sobre a literatura científica a respeito de genes de anticorpos.) Além de ser inconvincente pela razão descrita acima, a idéia do Dr. Gish de que os pseudogenes tenham sido criados para servir como cópia "backup" de genes não oferece nenhuma explicação criacionista para os retroposons em comum, mais numerosos, e que não são pseudogenes.

5.6 Esse papo de retroposons é realmente difícil demais para se entender.

O Dr. Gish usou este recurso com o público em um recente debate comigo. Ele parecia estar desviando a atenção do público para que ignorasse as implicações dos argumentos dos pseudogenes compartilhados e desconsiderasse o fato de que ele (Dr. Gish) não tinha conseguido encontrar contra-argumentos válidos para rebatê-lo. Essa é uma manobra de debates típica dos criacionistas: usar o humor ou invocação de fé ou algum outro apelo irrelevante para distrair uma audiência leiga, de forma que ela não perceba que uma posição criacionista foi eficazmente refutada.

(Este ensaio foi enviado ao Dr. Gish solicitando qualquer argumento adicional contra os pontos levantados aqui. Não foi recebida nenhuma resposta.)

5.7 Além do Dr. Gish, o criacionista John Woodmorappe comentou sobre os pseudogenes (Noah's Ark, a Feasibility Study [Arca de Noé, um Estudo da Viabilidade], 1996, publicado pelo ICR, p. 202; Bible-Science News 33:7,1995). Ele usa vários dos mesmos argumentos do Dr. Gish (veja 5.2 e 5.4 acima) mas acrescenta alguns próprios. Uma interpretação criacionista dos pesudogenes oferecida por Woodmorappe é de que alguns pseudogenes podem ser "o resultado de alterações degenerativas nos organismos vivos desde a Queda." Esta interpretação parece plausível, e -- se ignorarmos a parte da "Queda" -- não muito diferente da idéia evolucionária de que os pseudogenes surgem através de acidentes genéticos aleatórios. Porém, essa interpretação ignora completamente o fato de que muitos dos pseudogenes são comuns entre os macacos e os humanos, localizados nas mesmas posições e possuem os mesmos defeitos genéticos, aparentemente resultantes do mesmo acidente genético ou "alterações degenerativas" em um ancestral comum. (Se esses pseudogenes em comum surgiram depois da "Queda", como sugere Woodmorappe, será que a "Queda" ocorreu antes que o homem se separasse dos macacos?)

5.8 Ao se referir aos pseudogenes em comum, Woodmorappe tenta disfarçar o forte apoio deles à evolução alegando que, para alguns pseudogenes específicos, o grau de "parentesco" inferido pela presença ou ausência deles em diferentes espécies contradiz o "parentesco" inferido pelos evolucionistas através de outras características. Nesse argumento, Woodmorappe se alinha a outros argumentos criacionistas que nos convidam a abandonar a evolução devido a casos específicos que violam uma interpretação simplista da mesma e a ignorar o número muito maior de exemplos que a corroboram. Na longa e complexa história da vida na terra, foram geradas muitas exceções a idéias simplistas -- por exemplo, casos em que fóssseis mais antigos repousam acima de outros mais recentes (devido ao dobramento de estratos geológicos ou falhas de empurrão) ou exemplos em que similaridades de seqüências de pequenos trechos de DNA, comparados entre espécies, parecem violar parentescos estabelecidos (em virtude de erros estatisticamente esperados devido a amostras pequenas). Similarmente, podemos esperar casos em que um pseudogene ou retroposon que surgiu em um ancestral de três espécies modernas (A, B e C) possa ter sido deletado em uma delas (digamos, em C), sugerindo um parentesco mais próximo entre A e B que do que seria justificável em outras circunstâncias. Um exemplo como esse não deve fazer com que desprezemos o que aprendemos da maioria dos pseudogenes e retroposons compartilhados e, sim, encorajar-nos a ser cautelosos ao fazer generalizações a partir de casos excepcionais. 
 
B O X  3

Woodmorappe descreve um exemplo de um pseudogene da épsilon imunoglobulina que se relatou (Ueda et al, PNAS 82: 3712 1985) ser comum ao gorila e ao homem, mas não ao chimpanzé, parecendo contradizer a visão evolucionária convencional de que os ancestrais humanos divergiram da linhagem do gorila antes de divergirem da do chimpanzé. Infelizmente, Woodmorape deixou de levar em conta dados gerados posteriormente pelo laboratório de Ueda (Kawamura e Ueda, Genomics 13:194, 1992) que estavam disponíveis quando Woodmorappe escreveu em 1994 (Bible Science News 32:4 p. 12). Esses dados mais recentes mostram que deleções de DNA, destruindo cópias duplicadas dos genes da épsilon imunoglobulina (1) ocorreram independentemente nas linhagens do homem e do gorila (a independência foi deduzida do fato de que os limites "direito" e "esquerdo" do DNA deletado eram completamente diferentes nas duas espécies), e (2) também ocorreram (mais uma vez independentemente) no chimpanzé. Assim, o exemplo de Woodmorappe de um pseudogene compartilhado ligando humanos ao gorila, mas não ao chimpanzé (numa aparente violação da divergência mais recente dos ancestrais humanos do chimpanzé, aceita pela maioria dos evolucionistas), é incorreto: aqueles não são pseudogenes "compartilhados", mas sim pseudogenes surgidos independentemente e o chimpanzé possui uma deleção similar, embora maior.(Eu mencionaria que citei esse mesmo exemplo incorreto na minha versão original deste ensaio. Porém, no momento em que o escrevi -- 1986 -- o exemplo era corroborado pelos ind&iiacutte;cios então disponíveis; e publiquei uma correção no Creation/Evolution após os novos dados serem publicados. Devo também frisar que o exemplo do pseudogene processado épsilon, mencionado na seção 4.3 acima, representa uma seqüência totalmente diferente, a qual ninguém discorda que seja comum a humanos, chimpanzés e gorilas.)

Porém, o exemplo de pseudogenes compartilhados que Woodmorappe oferece a fim de desafiar o modelo evolucionário, tem uma explicação mais mundana: ele é simplesmente baseado em uma informação incorreta e desatualizada (veja box 3).

5.9 Uma hipótese final oferecida por Woodmorappe (em correspondência pessoal) é de que genomas similares (como os do homem e do chimpanzé) poderiam tender a adquirir os mesmos pseudogenes independentemente, ao passo que genomas menos similares poderiam ser menos capazes de adquiri-los. Essa hipótese obviamente ad hoc, teoricamente explicaria por quê --mesmo se os humanos e chimpanzés tivessem sido criados independentemente-- poderiam compartilhar mais pseudogenes que pares de espécies menos similares, independentemente relacionadas, como o homem e o gibão. O problema com essa hipótese é que a ocorrência independente --ou seja, em dois diferentes indivíduos-- do mesmo retroposon se inserindo na mesma posição quase nunca foi relatada, mesmo em indivíduos da mesma espécie. Eu só consegui encontrar duas publicações descrevendo exemplos de inserções independentes idênticas. Uma delas envolvendo um vírus modificado do sarcoma de Rous, criado através de engenharia com um marcador selecionável específico e infectando fibroblastos de peru cultivados em uma cultura de tecidos (Shih et al, Cell 53:531, 1988); e mesmo nesse artigo incomum com um vírus especialmente projetado, a freqüência dessas inserções foi estimada em apenas uma a cada 4000 eventos de inserção. O segundo exemplo é uma publicação bem recente e controvertida (Slattery et al., Mol Biol Evol 17:825, 2000) que interpreta, a meu ver incorretamente, duas inserções idênticas de um SINE no mesmo local (um intron do gene Smcy) num gato doméstico e num lince como representativas de inserções independentes, ao invés de refletirem uma única inserção de um ancestral felino comum. (John Woodmorappe absteve-se de citar quaisquer dados ao ser desafiado a fornecer exemplos de inserções independentes. No entanto, caso os leitores deste ensaio estejam cientes de outros indícios de inserções independentes de um elemento idêntico numa posição idêntica em qualquer modelo de laboratório, eu apreciaria receber as citações adequadas e atualizarei este ensaio de forma a refleti-los.) Numerosíssimas inserções de ocorrência natural têm sido documentadas em elementos TY do levedo, drosophyla gypsy e elementos P, retrovírus e transgenes murinos, e inserções do HIV humano -- todas sem que tenham sido relatadas inserções independentes idênticas. Se organismos independentes da mesma espécie (ou seja, com genomas mais idênticos que o do homem versus chimpanzé) quase nunca adquirem o mesmo pesudogene ou retroposon na mesma posição, é difícil levar a sério a hipótese de que, por exemplo, as mesmas sete inserções Alu nas mesmas posições no mesmo locus da (alpha) globina do homem e do chimpanzé (veja seção 4.4 acima) pudessem ter ocorrido como 14 eventos independentes.

5.10 Um pseudogene não poderia ter sido transmitido por um vírus de uma espécie para outra, levando a pseudogenes compartilhados? Uma proposta seguindo essa linha foi sugerida pelo anti-evolucionista Pat Kohli e parece superficialmente plausível. Sabe-se que vários vírus, inclusive retrovírus, ocasionalmente colhem seqüências de nucleotídeos de uma célula "doadora", que pode então, após a reinfecção de uma nova célula, ser inserido no DNA da nova célula "receptora". De fato, sabe-se que esse mecanismo tem conseqüências significativas: se o DNA transmitido inclui uma versão mutada de determinados genes-chave, que regulam a divisão celular, esta seqüência de DNA pode agir como um oncogene e causar malignidade na célula receptora (Bishop, Cell 42:23, 1985). Teoricamente, uma seqüência de pseudogene ou retroposon poderia ser capturada por um vírus e então ser transmitida através das espécies por esse mecanismo, resultando na existência de seqüências inúteis idênticas compartilhadas entre duas espécies. Na verdade, já foram relatados exemplos raros de aparente transferência de retroposons através de espécies (por exemplo, entre duas espécies de mosca-das-frutas [Jordan et al, PNAS 96: 12621, 1999] ou de cobras venenosas para ruminantes [Kordis e Gubensek, PNAS 95:10704, 1998]). No entanto, não é provável que essa seja a explicação para a maioria dos pseudogenes/retroposons, por pelo menos três razões.

Em primeiro lugar, pseudogenes/retroposons em comum são geralmente encontrados em posições exatamente homólogas no DNA de cada espécie. Isso é quase sempre verdadeiro no caso dos pseudogenes clássicos, que se situam bem próximos ao gene funcional, e também é verdadeiro para seqüências Alu, como as mencionadas no aglomerado do gene da globina, e para os pseudogenes processados cuja localização foi determinada (por exemplo, o pseudogene processado épsilon da imunoglobulina humana, mencionado acima [Ueda, et al, EMBO J 1:1539, 1982; Tanabe et al. Cytogenet Cell Genet 73:92, 1996]). Sítios alvo para a inserção viral podem compartilhar certas características de seqüências locais (Craigie in Trends in Genetics 8:187, 1992; Knoblauch et al., J Virol 70:3788, 1996; Stevens e Griffith, PNAS 91:5557, 1994), mas essas características ocorrem bastante freqüentemente e são geralmente dispersas pelo DNA da célula receptora. Além dos dois artigos mencionados na seção 5.9, não há nenhum precedente ou mecanismo conhecido para que um segmento de DNA viralmente transferido se direcione para uma localização alvo específica no DNA da célula receptora, como seria necessário para que um pseudogene representando uma inserção viral ocorresse na mesma localização que a seqüência do doador hipotético. Logo, as localizações em comum de pseudogenes/retroposons, com respeito ao DNA que o cerca, depõem fortemente contra um modelo de transmissão através de espécies como esse.

Em segundo lugar, se a maioria dos pseudogenes/retroposons compartilhados representassem transferência mediada viralmente de uma espécie para outra, poder-se-ia esperar encontrar seqüências virais próximas a pseudogenes na espécie "receptora". Essas seqüências virais estão presentes regularmente em exemplos conhecidos de transmissão viral de DNA de uma célula para outra, inclusive em inserções de construções retrovirais criadas por engenharia; mas não são encontradas seqüências virais associadas com a maioria dos pseudogenes/retroposons, exceto retrovírus endógenos.

Por fim, várias árvores genealógicas foram geradas através da comparação entre espécies da presença ou ausência de inserções LINE ou Alu em locais específicos no genoma, um exercício similar ao mostrado na Figura 5 acima (Malik et al, Mol Biol Evol 16: 793, 1999; Hamdi et al J Mol Biol 284:861, 1999); as árvores genealógicas derivadas de retroposons se mostraram precisamente congruentes às previamente estabelecidas, que eram baseadas em similaridades de seqüências e características anatômicas. Se a transferência através de espécies explicasse a maioria dos retroposons compartilhados, não seria esperada nenhuma congruência.

Em uma pesquisa auxiliada por computador na literatura científica, consegui encontrar apenas dois exemplos de pseudogenes para os quais a transmissão viral foi ao menos temporariamente cogitada como mecanismo de origem, em ambos os casos, com indícios particularmente fracos (Gruskin et al., PNAS 84:1605, 1987 e Robins et al., J Biol Chem 261:18, 1986). Convido os leitores que estiverem a par de outros exemplos a enviá-los por e-mail, para a inclusão em futuras atualizações deste artigo. Por enquanto, os indícios depõem contra a transferência entre espécies mediada viralmente como mecanismo geral para explicar pseudogenes/retroposons compartilhados.

5.11 O criacionista L. J. Gibson também se referiu aos pseudogenes em um artigo publicado (Origins 21:91, 1994). O artigo de Gibson se resume a dois pontos, um similar ao discutido na seção 5.2 acima e um ponto filosófico adicional. Ele observa que o argumento dos pseudogenes compartilhados se apoia na presunção de "que Deus não criaria seqüências não-funcionais similares em espécies separadas," que ele chama de "um argumento teológico [o qual] dificilmente pode ser assunto da ciência" e que exigiria sustentação nas Escrituras para ter credibilidade. Como a Bíblia não menciona --logo deixa em aberto-- a possibilidade de que Deus poderia ter criado seqüências não funcionais no DNA, Gibson acredita que ninguém possa descartar a idéia de que Deus de fato criou mesmo essas seqüências individualmente, à medida que criou cada espécie, inclusive as não funcionais que agora encontramos compartilhadas entre diferentes espécies.

Deve-se mencionar entre parênteses que o argumento de Gibson enfraquece a própria interpretação dos criacionistas da similaridade entre espécies, citada no início deste ensaio (seção 1.2). Como discutimos, os criacionistas afirmaram que as árvores de similaridades, baseadas em informações das seqüências, não precisam ser aceitas como prova de proximidades evolucionárias, porque seria de se supor que espécies independentemente criadas por um projetista inteligente exibissem padrões idênticos de aparente parentesco. A crítica de Gibson se aplica igualmente bem contra esse argumento criacionista, já que a Bíblia não menciona os planos de Deus para similaridades de seqüências.

No entanto, como discutido anteriormente, essa idéia criacionista de seqüências similares projetadas para funções similares ao menos intuitivamente faz algum sentido. Em contraste, Gibson propõe uma hipótese ad hoc claramente inaceitável quando sugere que um projetista poderia ter colocado inserções não funcionais de retroposons --imitando todas as características das que se retroposicionam aleatoriamente em laboratório-- nas mesmas posições do DNA de espécies criadas independentemente; essa idéia merece tanto crédito quanto a alegação de que itens falsos em um catálogo se devem a enganos independentes, ao invés de plágio. A hipótese de Gibson não defende um criador tomando decisões compreensíveis de projeto e sim um criador tão imprevisível que poderia ser o autor de qualquer descoberta científica tradicionalmente interpretada como não projetada --exceto se a Bíblia especificamente declare o contrário. Logo, a lógica de Gibson daria apoio às seguintes afirmações, por não haver nada especificamente em contrário da Bíblia: (1) Deus criou os fósseis com a aparência de restos mortais de animais que nunca viveram e os incrustou em rochas. (2) Deus criou elementos radioativos nas rochas que falsamente sugeririam idades mais avançadas que suas idades reais. (3) Deus criou o universo 6.000 anos atrás com a luz das estrelas a caminho dos nossos olhos, mas com as propriedades que esperaríamos de uma luz que deixou as estrelas há bilhões de anos. Em outras palavras, a lógica de Gibson nos convida a rejeitar qualquer argumento científico em favor da evolução, se este argumento não for especificamente confirmado pela Bíblia. A visão de Gibson pode ser internamente coerente, mas claramente exige que a veracidade da Bíblia seja aceita pela fé, como base para se julgar os méritos das conclusões científicas e assim se afasta da verdadeira ciência, que é baseada no teste de hipóteses, lógica indutiva e conclusões baseadas em dados observados. Se um cientista vir um retroposon se inserindo no laboratório, como resultado de vários parâmetros bioquímicos conhecidos, a navalha de Occam o desencoraja de postular uma mão inteligente guiando sua criação. Se encontrarmos outras inserções no nosso DNA com características idênticas às que surgem sob observação, assumimos que as do nosso DNA surgiram através de um mecanismo similar. Sabemos que essas inserções que surgem sob observação laboratorial podem ser usadas para rastrear a linhagem de animais de laboratório e que outras inserções naturais podem ser usadas para rastrear populações na natureza; não temos nenhuma razão que nos desencoraje de utilizar inserções similares para rastrear as linhagens de diferentes espécies. Este raciocínio indutivo é fundamental à paleontologia, à datação radioativa, à astronomia, à física, à medicina e a qualquer outro campo da ciência. Se achar que o mérito de um argumento científico depende do quão bem confirmado pela Bíblia ele é, Gibson pode simplesmente descartar a evolução diretamente porque ela conflita com o Gênesis e evitar o incômodo de ter que lidar com todos os detalhes das observações e deduções científicas individuais nas quais ela se baseia. Essa abordagem "a Bíblia em primeiro lugar" pode ser adequada para a religião, mas é inaceitável como ciência.

6. Testando o modelo

Uma das características da ciência que a distinguem da crença religiosa revelada (e os evolucionistas dos criacionistas) é a convicção de que os novos conhecimentos sobre o passado podem ser obtidos através da análise racionalmente planejada do mundo moderno. Os criacionistas muitas vezes afirmam que, como a origem das espécies ocorreu num passado distante, não há nenhum modo cientificamente válido para se estudar o processo hoje, logo a evolução não é uma ciência real, testável experimentalmente. No entanto, mesmo sem experiências reais, uma hipótese científica pode ser testada se ela sugerir uma predição não-trivial, que possa ser confirmada ou provada falsa, pela coleta de mais dados.

De fato, a interpretação dos pseudogenes processados descrita aqui representa uma hipótese que pode ser testada, por apresentar uma implicação bem impressionante: a partir da comparação entre duas seqüências de nucleotídeos de uma única espécie --isto é, as seqüências de um pseudogene processado e do gene funcional do qual ele é derivado-- seria possível prever quais outras espécies compartilhariam os mesmos pseudogenes e quais não. Para compreender a lógica de uma predição como esta, leve em conta o fato de que se um pseudogene processado surgiu em uma espécie antiga, devem ser encontradas cópias deste pseudogene nos descendentes modernos dessa espécie. Logo, conforme o modelo evolucionário, se soubermos quando um pseudogene processado humano surgiu e pudermos assim fixar sua origem a uma posição específica na "árvore" evolucionária atualmente aceita, poderemos prever que o mesmo pseudogene processado seria encontrado nas espécies modernas que se derivaram a partir desse ponto na árvore, mas não em quaisquer outros ramos.

De fato, existe uma maneira de se estimar quando um dado pseudogene processado se formou. Acontece que as mutações "silenciosas" --ou seja, mutações que n&&atillde;o têm nenhum efeito sobre a sobrevivência do organismo (como todas as mutações em pseudogenes inúteis)-- acumulam-se a uma taxa bastante uniforme. Essa taxa foi estimada através do exame do número de diferenças "silenciosas" entre seqüências não-funcionais correspondentes em duas espécies e da comparação desse número com a data aproximada da divergência das mesmas duas espécies conforme o indicado pelo registro fóssil. Dada essa taxa de mutação e o número de diferenças de seqüência entre um pseudogene processado específico e seu gene funcional de origem (da mesma espécie), pode-se estimar a data da origem do pseudogene; então, baseado nessa data, pode-se produzir predições a respeito de quais outras espécies modernas carregariam o mesmo pseudogene. Estas predições podem ser testadas através da busca pelo pseudogene em várias espécies.

Por exemplo, o pseudogene processado épsilon humano, discutido anteriormente (seção 4.3). O número de diferenças de nucleotídeos entre esse pseudogene e o gene funcional, sugere que ele teria surgido há aproximadamente 40 milhões de anos. Logo, a interpretação evolucionária dos pseudogenes processados, apresentada neste ensaio, preveria que os camundongos e coelhos (que se acredita terem divergido da linhagem humana de 70 a 80 milhões de anos atrás, antes da origem aparente do pseudogene) não deveriam carregá-lo. Por outro lado, seria esperado que os macacos antropóides e os macacos do Velho Mundo --cujas datas estimadas de divergência da linhagem humana (5-10 e 30 milhões de anos atrás, respectivamente) estão ambas após a origem aparente do pseudogene-- o carregassem. Indícios disponíveis confirmam todas essas predições e são também coerentes com previsões similares sobre a distribuição entre a espécie de outros pseudogenes processados (veja por exemplo Anagnou et al. PNAS 81:5170, 1984 a respeito da diidrofolato redutase, e Craig et al. Gene 99:217,1991 a respeito da triosefosfato isomerase).

Através de lógica similar, é possível estimar a idade da inserção de um retrovírus endógeno, comparando as seqüências do LTR "direito" e "esquerdo" (veja a seção 2.2.2.d acima). Como o LTR "esquerdo" é copiado da seqüência "direita" no instante da inserção, os dois LTRs compartilham seqüências idênticas no momento em que a cópia do retrovírus se origina. Após a inserção, os dois LTRs acumulam mutações independentemente, e logo o número de seqüências diferentes entre os dois pode ser usado para se estimar a idade de uma inserção específica de retrovírus. Quando as idades de vários retrovírus endógenos humanos foram recentemente estimadas, usando esta abordagem, a distribuição prevista de cópias compartilhadas na espécie  foi confirmada (Johnson & Coffin, PNAS 96:10254, 1999).

Mais pseudogenes processados e retrovírus endógenos compartilhados certamente serão descobertos, e só o tempo dirá o quão acertadamente previsões evolucionárias como essas serão confirmadas. Exemplos repetidos deste tipo de predição e confirmação podem fornecer provas convincentes da evolução, ainda que alguns tipos de experiências indiretas, como estudos em dinossauros vivos, sejam impossíveis. (Caso os leitores saibam de outros exemplos de pseudogenes processados ou outros retroposons cuja distribuição em diferentes espécies confirme ou contrarie a "árvore genealógica" atualmente aceita, eu apreciaria ser informado sobre esses casos por e-mail, e revisarei esta correspondência conforme for apropriado.)

7. Conclusão

As seqüências não funcionais compartilhadas descritas aqui provam que homens e macacos tiveram um ancestral comum? Na verdade, nenhum conhecimento científico se baseia em provas irrefutáveis do tipo das que apóiam teoremas matemáticos. Pelo contrário, a ciência avança através do acúmulo de pistas investigadas por detetives persistentes (os cientistas) que tentam fazer deduções lógicas e imparciais a partir delas. Como um júri a quem são apresentadas estas pistas, podemos tentar chegar ao veredito mais provável, apesar de reconhecermos que nossos fatos são incompletos; não há "testemunhas" vivas da longa história da evolução, por isso devemos fazer o melhor possível com as pistas que temos à mão. No "caso das seqüências não funcionais compartilhadas," um júri imparcial certamente concluiria que a cópia de um ancestral comum seria a explicação mais provável, coerente com a interpretação evolucionária. Essa conclusão seguiria a lógica da lei de direitos autorais do mundo real, na qual erros em comum são aceitos como prova de cópia. A forte aceitação dessa conclusão entre os cientistas é indicada pelo fato de que nenhuma explicação alternativa foi proposta na literatura científica para explicar o compartilhamento amplamente disseminado de tantas seqüências sem função entre espécies. Assim, se aceitarmos os indícios da ciência, concluiríamos que a descendência comum de espécies diferentes a partir de um ancestral comum ("macroevolução" na terminologia criacionista) realmente ocorreu.

À medida que novos exemplos de pseudogenes e retroposons compartilhados são descobertos pelos geneticistas moleculares, estas informações se juntam ao imenso corpo de pistas fornecidas por outras disciplinas que, coletivamente, já fornecem provas mais que suficientes da evolução. Apesar dessas provas impressionantes, nenhum cientista acredita que todas as respostas estejam na evolução ou que nossa compreensão atual dos pseudogenes e retroposons esteja imune a revisões à luz de futuros conhecimentos. Na verdade, cientistas em laboratórios por todo o mundo continuam a sondar os genes de várias espécies, comparando os dados da genética molecular com o registro fóssil e refinando nosso conhecimento a respeito da história da nossa espécie.

No estágio atual dessa interminável pesquisa, os indícios sugerem o que para mim é uma idéia impressionante: como uma Pedra de Roseta ou Manuscrito do Mar Morto biológico, o nosso próprio DNA -- informação equivalente a uma Enciclopédia Britânica em cada célula do nosso corpo-- contém um registro do passado que estamos aprendendo a ler neste momento. Esse registro, refletindo milhões de anos de história genética, inclui resquícios de acidentes genéticos que ocorreram antes que nossos ancestrais vagassem pelas planícies da África, resquícios que agora compartilhamos com outros descendentes desses mesmos ancestrais: os gorilas e chimpanzés modernos.