Uma inteligência artificial (IA) criada por pesquisadores da Alemanhã é uma esperança para decodificar camadas secretas do DNA e revelar sobre o que nos torna humano.
Chamado de GROVER, o novo modelo de linguagem trata o DNA como se fosse um texto. Assim, ela consegue aprender as regras e extrair informações funcionais sobre as sequências misteriosas.
Para treinar a ferramenta, a equipe criou uma espécie de dicionário com as letras do código genético e fragmentou o DNA em ‘palavras’. Assim, a IA conseguiu ler os fragmentos e prever as sequências seguintes. A descoberta pode acelerar a medicina personalizada e revolucionar a genômica no mundo.
Dicionário do DNA
Segundo Anna Poetsch, líder do grupo de pesquisa do Centro de Biotecnologia (Biotec) da Universidade Técnica de Dresden, o DNA é muito parecido à linguagem.
“Ele tem quatro letras que constroem sequências e as sequências carregam um significado. No entanto, diferentemente de uma linguagem, o DNA não tem palavras definidas”, explicou.
A equipe partiu das letras que compõem os genes, A, T, G e C, para criar combinações e começar o treinamento. “Analisamos todo o genoma e procuramos combinações de letras que ocorrem com mais frequência. Começamos com duas letras e revisamos o DNA, repetidamente, para construí-lo até as combinações de múltiplas letras mais comuns. Dessa forma, em cerca de 600 ciclos, fragmentamos o DNA em ‘palavras’ que permitem que GROVER tenha o melhor desempenho quando se trata de prever a próxima sequência”, disse Anna.
Leia mais notícia boa
- Melhores amigas fazem teste de DNA e descobrem que são irmãs
- Homem preso 12 anos injustamente por estupro é inocentado e solto após DNA
- DNA descoberto pode trazer de volta tigre extinto há 16 anos
Informações importantes
Além de extrair informações importantes, o GROVER também identificou promotores de genes ou sítios de ligações de proteínas no DNA.
“É fascinante que, ao treinar GROVER apenas com sequência de DNA, sem nenhuma anotação de funções, somos realmente capazes de extrair informações sobre a função biológica. Para nós, isso mostra que a função, incluindo algumas das informações epigenéticas, também é codificada na sequência”, contou Melissa.
Os testes vão continuar e a máquina deve revelar mais informações sobre as diferentes camadas do código genético.
No DNA, estão informações importantes sobre o que nos torna humanos, nossas predisposições a doenças e respostas a tratamentos.
“Acreditamos que entender as regras do DNA por meio de um modelo de linguagem nos ajudará a descobrir as profundezas do significado biológico oculto no DNA, avançando tanto a genômica quanto a medicina personalizada”, finalizou Anna.
‘Falando’ o código genético
Os modelos de aprendizado de máquina, como GPT, possuem a capacidade de serem aplicados em vários contextos.
“O DNA é o código da vida. Por que não tratá-lo como uma linguagem?”, indagou a pesquisadora.
Com o dicionário pronto, o grupo aplicou o GROVE para extrair significado biológico do DNA.
“GROVER aprendeu as regras do DNA. Em termos de linguagem, estamos falando sobre gramática, sintaxe e semântica. Para o DNA isso significa aprender as regras que governam as sequências, a ordem dos nucleotídeos e sequências, e o significado das sequências. Como os modelos GPT aprendem línguas humanas, GROVER basicamente aprendeu como ‘falar’ DNA”, explicou Melissa Sanabria, outra pesquisadora do projeto.