© Eduardo César, João Alexandre e Miguel Boyayan |
Lado a lado: matemática desvenda parentesco entre espécies |
Cada vez é mais rápido e fácil ler o DNA completo de qualquer ser vivo, com os equipamentos modernos. Mas mesmo essa evolução da tecnologia ainda não tornou banal comparar genomas para avaliar semelhanças entre espécies e montar uma árvore da vida. “Com os métodos atuais, os computadores demoram muito para comparar o material genético integral de um conjunto com mais de vinte espécies”, avalia o matemático João Meidanis, do Instituto de Informática da Universidade Estadual de Campinas (Unicamp). Não satisfeito com a solução habitual de buscar aproximações para dar sentido aos dados, ele e seu aluno Pedro Feijão desenvolveram um método novo para comparar genomas, que em setembro passará por uma prova de fogo: será apresentado a colegas do mundo todo no workshop Algoritmos em Bioinformática, nos Estados Unidos.
O que torna tão lenta a análise dos dados não é mais obter as sequências, mas compará-las. Isso porque cada genoma é representado por bilhões de letras enfileiradas (cerca de 3 bilhões, no caso humano). Os métodos de comparação entre espécies usam representações matemáticas dos modelos de como as mutações naturais aos poucos substituem letras ou quebram essa longa cadeia que volta a emendar-se em outro ponto – uma contabilidade extenuante até para os computadores mais possantes.
A fórmula proposta pela dupla de matemáticos simula uma situação em que o genoma seria quebrado num só ponto e depois emendado outra vez de maneira aleatória. Se isso acontece sucessivas vezes, a sequência genética é aos poucos embaralhada. Daí vem o nome single-cut-or-join (único corte ou ligação) que batiza o método. O processo simula o tipo mais comum de rearranjo genético, em que um trecho do DNA fica invertido. Se a vírgula da frase anterior fosse o ponto de ruptura, a frase poderia virar “ociténeg ojnarraer ed mumoc siam opit o alumis ossecorp O, em que um trecho do DNA fica invertido” ou “em que um trecho do DNA fica invertido, O processo simula o tipo mais comum de rearranjo genético”, entre outras possibilidades. “Essa é uma das formas de alteração mais comuns no genoma”, explica Meidanis, “pois ela preserva trechos intactos e assim mantém propriedades genéticas”. O programa que ele desenvolveu faz uma série de cortes aleatórios no genoma selecionado e determina a semelhança com outro genoma pelo número de cortes necessários para que o primeiro fique igual ao segundo. Ao comparar o material genético de várias espécies – com esse método é possível comparar até 100 genomas em poucos dias – o programa de Meidanis e Feijão produz uma árvore filogenética que mostra o parentesco entre os seres vivos comparados.
Continua no link