Ao analisar dados bacterianos, os pesquisadores descobriram milhares de novos sistemas CRISPR raros que possuem uma série de funções e podem permitir edição de genes, diagnósticos e muito mais.
Agora, cientistas do Instituto McGovern de Pesquisa do Cérebro do MIT, do Broad Institute do MIT e Harvard e do Centro Nacional de Informações sobre Biotecnologia (NCBI) dos Institutos Nacionais de Saúde desenvolveram um novo algoritmo de busca que identificou 188 tipos de novos sistemas CRISPR raros em genomas bacterianos, abrangendo milhares de sistemas individuais. O trabalho aparece hoje na Science .
O algoritmo, que vem do laboratório do pesquisador pioneiro do CRISPR, Professor Feng Zhang , usa abordagens de agrupamento de big data para pesquisar rapidamente grandes quantidades de dados genômicos. A equipe usou seu algoritmo, chamado Fast Locality-Sensitive Hashing-based clustering (FLSHclust) para extrair três grandes bancos de dados públicos que contêm dados de uma ampla gama de bactérias incomuns, incluindo aquelas encontradas em minas de carvão, cervejarias, lagos antárticos e saliva de cachorro. . Os cientistas descobriram um número e uma diversidade surpreendentes de sistemas CRISPR, incluindo alguns que podem fazer edições no DNA em células humanas, outros que podem ter como alvo o RNA e muitos com uma variedade de outras funções.
Os novos sistemas poderiam ser potencialmente aproveitados para editar células de mamíferos com menos efeitos fora do alvo do que os atuais sistemas Cas9. Eles também poderão um dia ser usados como diagnóstico ou servir como registros moleculares de atividade dentro das células.
Os investigadores dizem que a sua pesquisa destaca um nível sem precedentes de diversidade e flexibilidade do CRISPR e que provavelmente ainda existem muitos mais sistemas raros a serem descobertos à medida que as bases de dados continuam a crescer.
“A biodiversidade é um grande tesouro e, à medida que continuamos a sequenciar mais genomas e amostras metagenómicas, há uma necessidade crescente de ferramentas melhores, como o FLSHclust, para pesquisar esse espaço de sequência para encontrar as gemas moleculares”, diz Zhang, co- autor sênior do estudo e professor de neurociência James e Patricia Poitras no MIT, com nomeações conjuntas nos departamentos de Ciências do Cérebro e Cognitivas e Engenharia Biológica. Zhang também é pesquisador do Instituto McGovern de Pesquisa do Cérebro do MIT, membro central do instituto Broad e investigador do Howard Hughes Medical Institute. Eugene Koonin, um distinto investigador do NCBI, também é co-autor sênior do estudo.
Procurando por CRISPR
CRISPR, que significa repetições palindrômicas curtas agrupadas regularmente interespaçadas, é um sistema de defesa bacteriana que foi desenvolvido em muitas ferramentas para edição e diagnóstico de genoma.
Para extrair bancos de dados de sequências de proteínas e ácidos nucleicos para novos sistemas CRISPR, os pesquisadores desenvolveram um algoritmo baseado em uma abordagem emprestada da comunidade de big data. Essa técnica, chamada hashing sensível à localidade, agrupa objetos que são semelhantes, mas não exatamente idênticos. A utilização desta abordagem permitiu à equipa investigar milhares de milhões de sequências de proteínas e ADN – do NCBI , da sua base de dados Whole Genome Shotgun e do Joint Genome Institute – em semanas, enquanto os métodos anteriores que procuravam objectos idênticos teriam levado meses. Eles projetaram seu algoritmo para procurar genes associados ao CRISPR.
“Este novo algoritmo permite-nos analisar dados num período de tempo suficientemente curto para que possamos realmente recuperar resultados e fazer hipóteses biológicas”, diz Soumya Kannan PhD '23, que é co-autor do estudo. Kannan era estudante de graduação no laboratório de Zhang quando o estudo começou e atualmente é pós-doutorado e Junior Fellow na Universidade de Harvard. Han Altae-Tran PhD '23, estudante de pós-graduação no laboratório de Zhang durante o estudo e atualmente pós-doutorado na Universidade de Washington, foi o outro co-autor do estudo.
“Esta é uma prova do que você pode fazer quando melhora os métodos de exploração e usa o máximo de dados possível”, diz Altae-Tran. “É realmente emocionante poder melhorar a escala em que pesquisamos.”
Novos sistemas
Em sua análise, Altae-Tran, Kannan e seus colegas notaram que os milhares de sistemas CRISPR que encontraram se enquadravam em algumas categorias existentes e em muitas categorias novas. Eles estudaram vários dos novos sistemas com mais detalhes no laboratório.
Eles encontraram várias novas variantes de sistemas CRISPR Tipo I conhecidos, que usam um RNA guia com 32 pares de bases de comprimento, em vez do guia de 20 nucleotídeos do Cas9. Devido aos seus RNAs-guia mais longos, esses sistemas Tipo I poderiam ser potencialmente usados para desenvolver uma tecnologia de edição genética mais precisa e menos propensa à edição fora do alvo. A equipe de Zhang mostrou que dois desses sistemas poderiam fazer pequenas edições no DNA das células humanas. E como esses sistemas Tipo I são semelhantes em tamanho ao CRISPR-Cas9, eles provavelmente poderiam ser entregues a células de animais ou humanos usando as mesmas tecnologias de entrega de genes usadas hoje para CRISPR.
Um dos sistemas Tipo I também mostrou “atividade colateral” – ampla degradação de ácidos nucleicos após a proteína CRISPR se ligar ao seu alvo. Os cientistas usaram sistemas semelhantes para fazer diagnósticos de doenças infecciosas, como o SHERLOCK , uma ferramenta capaz de detectar rapidamente uma única molécula de DNA ou RNA. A equipe de Zhang acredita que os novos sistemas também poderiam ser adaptados para tecnologias de diagnóstico.
Os pesquisadores também descobriram novos mecanismos de ação para alguns sistemas CRISPR Tipo IV e um sistema Tipo VII que visa precisamente o RNA, que poderia potencialmente ser usado na edição de RNA. Outros sistemas poderiam ser potencialmente utilizados como ferramentas de registo – um documento molecular de quando um gene foi expresso – ou como sensores de actividade específica numa célula viva.
Dados de mineração
Os cientistas dizem que seu algoritmo poderia ajudar na busca por outros sistemas bioquímicos. “Esse algoritmo de busca pode ser usado por qualquer pessoa que queira trabalhar com esses grandes bancos de dados para estudar como as proteínas evoluem ou para descobrir novos genes”, diz Altae-Tran.
Os pesquisadores acrescentam que suas descobertas ilustram não apenas o quão diversos são os sistemas CRISPR, mas também que a maioria é rara e encontrada apenas em bactérias incomuns. “Alguns destes sistemas microbianos foram encontrados exclusivamente na água das minas de carvão”, diz Kannan. “Se alguém não estivesse interessado nisso, talvez nunca tivéssemos visto esses sistemas. Ampliar nossa diversidade de amostragem é realmente importante para continuar expandindo a diversidade do que podemos descobrir.”
Nenhum comentário:
Postar um comentário