Os sistemas de computação que parecem gerar atividade semelhante à do cérebro podem ser o resultado de pesquisadores que os orientam para um resultado específico.
As redes neurais, um tipo de sistema de computação vagamente modelado na organização do cérebro humano, formam a base de muitos sistemas de inteligência artificial para aplicações como reconhecimento de fala, visão computacional e análise de imagens médicas.
No campo da neurociência, os pesquisadores costumam usar redes neurais para tentar modelar o mesmo tipo de tarefas que o cérebro realiza, na esperança de que os modelos possam sugerir novas hipóteses sobre como o próprio cérebro executa essas tarefas. No entanto, um grupo de investigadores do MIT defende que se deve ter mais cautela na interpretação destes modelos.
Numa análise de mais de 11.000 redes neurais que foram treinadas para simular a função das células da grade – componentes-chave do sistema de navegação do cérebro – os pesquisadores descobriram que as redes neurais só produziam atividade semelhante à da grade quando recebiam restrições muito específicas que não são encontrados em sistemas biológicos.
“O que isto sugere é que, para obter um resultado com células de grelha, os investigadores treinam os modelos necessários para incorporar esses resultados com escolhas de implementação específicas e biologicamente implausíveis”, diz Rylan Schaeffer, antigo investigador associado sénior do MIT.
Sem essas restrições, a equipe do MIT descobriu que muito poucas redes neurais geravam atividades semelhantes às das células da grade, sugerindo que esses modelos não geram necessariamente previsões úteis sobre como o cérebro funciona.
Schaeffer, que agora é estudante de pós-graduação em ciência da computação na Universidade de Stanford, é o principal autor do novo estudo , que será apresentado na Conferência de 2022 sobre Sistemas de Processamento de Informações Neurais este mês. Ila Fiete, professora de ciências cerebrais e cognitivas e membro do Instituto McGovern de Pesquisa do Cérebro do MIT, é a autora sênior do artigo. Mikail Khona, estudante de pós-graduação em física do MIT, também é autor.
Modelando células de grade
As redes neurais, que os pesquisadores usam há décadas para realizar uma variedade de tarefas computacionais, consistem em milhares ou milhões de unidades de processamento conectadas entre si. Cada nó possui conexões de intensidades variadas com outros nós da rede. À medida que a rede analisa grandes quantidades de dados, a força dessas conexões muda à medida que a rede aprende a executar a tarefa desejada.
Neste estudo, os pesquisadores se concentraram em redes neurais que foram desenvolvidas para imitar a função das células da grade cerebral, encontradas no córtex entorrinal do cérebro dos mamíferos. Juntamente com as células locais, encontradas no hipocampo, as células da grelha formam um circuito cerebral que ajuda os animais a saber onde estão e como navegar para um local diferente.
Foi demonstrado que as células de local disparam sempre que um animal está em um local específico, e cada célula de local pode responder a mais de um local. As células da grade, por outro lado, funcionam de maneira muito diferente. À medida que um animal se move através de um espaço como uma sala, as células da grade disparam apenas quando o animal está em um dos vértices de uma rede triangular. Diferentes grupos de células da grade criam redes de dimensões ligeiramente diferentes, que se sobrepõem. Isto permite que as células da grade codifiquem um grande número de posições exclusivas usando um número relativamente pequeno de células.
Este tipo de codificação de localização também permite prever a próxima localização de um animal com base num determinado ponto de partida e numa velocidade. Em vários estudos recentes, os pesquisadores treinaram redes neurais para realizar a mesma tarefa, conhecida como integração de caminhos.
Para treinar redes neurais para realizar essa tarefa, os pesquisadores fornecem a elas um ponto de partida e uma velocidade que varia com o tempo. O modelo essencialmente imita a atividade de um animal vagando por um espaço e calcula posições atualizadas à medida que ele se move. À medida que o modelo executa a tarefa, os padrões de atividade de diferentes unidades da rede podem ser medidos. A atividade de cada unidade pode ser representada como um padrão de disparo, semelhante aos padrões de disparo dos neurônios no cérebro.
Em vários estudos anteriores, os investigadores relataram que os seus modelos produziram unidades com padrões de actividade que imitam de perto os padrões de disparo das células da grelha. Esses estudos concluíram que representações semelhantes a células de grade surgiriam naturalmente em qualquer rede neural treinada para realizar a tarefa de integração de caminho.
No entanto, os investigadores do MIT encontraram resultados muito diferentes. Numa análise de mais de 11.000 redes neurais que treinaram em integração de caminhos, descobriram que, embora quase 90% delas tenham aprendido a tarefa com sucesso, apenas cerca de 10% dessas redes geraram padrões de atividade que poderiam ser classificados como semelhantes a células de grade. . Isso inclui redes nas quais apenas uma única unidade alcançou uma pontuação alta na grade.
Os estudos anteriores tinham maior probabilidade de gerar atividade semelhante a uma grade de células apenas devido às restrições que os pesquisadores incorporam nesses modelos, de acordo com a equipe do MIT.
“Estudos anteriores apresentaram a história de que se você treinar redes para integração de caminhos, obterá células de grade. O que descobrimos é que, em vez disso, é preciso fazer uma longa sequência de escolhas de parâmetros, que sabemos serem inconsistentes com a biologia, e então, com uma pequena porção desses parâmetros, você obterá o resultado desejado”, diz Schaeffer.
Mais modelos biológicos
Uma das restrições encontradas em estudos anteriores é que os pesquisadores exigiram que o modelo convertesse a velocidade em uma posição única, relatada por uma unidade de rede que corresponde a uma célula local. Para que isso acontecesse, os pesquisadores também exigiram que cada célula local correspondesse a apenas um local, o que não é como as células biológicas funcionam: estudos demonstraram que as células locais no hipocampo podem responder a até 20 locais diferentes, e não apenas a um.
Quando a equipe do MIT ajustou os modelos para que as células locais fossem mais parecidas com células locais biológicas, os modelos ainda eram capazes de realizar a tarefa de integração de caminho, mas não produziam mais atividades semelhantes às das células da grade. A atividade semelhante à célula da grade também desapareceu quando os pesquisadores instruíram os modelos a gerar diferentes tipos de resultados de localização, como localização em uma grade com eixos X e Y, ou localização como distância e ângulo em relação a um ponto inicial.
“Se a única coisa que você pedir a esta rede é integrar o caminho e impor um conjunto de requisitos muito específicos, não fisiológicos, à unidade de leitura, então será possível obter células de grade”, diz Fiete. “Mas se você relaxar qualquer um desses aspectos desta unidade de leitura, isso degradará fortemente a capacidade da rede de produzir células de grade. Na verdade, geralmente não o fazem, embora ainda resolvam a tarefa de integração do caminho.”
Portanto, se os pesquisadores ainda não soubessem da existência das células da grade e orientassem o modelo para produzi-las, seria muito improvável que elas surgissem como uma consequência natural do treinamento do modelo.
Os pesquisadores dizem que suas descobertas sugerem que é necessária mais cautela ao interpretar modelos de redes neurais do cérebro.
“Quando você usa modelos de aprendizagem profunda, eles podem ser uma ferramenta poderosa, mas é preciso ser muito cauteloso ao interpretá-los e determinar se eles estão realmente fazendo previsões de novo, ou mesmo esclarecendo o que o cérebro está otimizando. ”, diz Fiete.
Kenneth Harris, professor de neurociência quantitativa na University College London, diz esperar que o novo estudo encoraje os neurocientistas a serem mais cuidadosos ao afirmar o que pode ser mostrado pelas analogias entre as redes neurais e o cérebro.
“As redes neurais podem ser uma fonte útil de previsões. Se quiser aprender como o cérebro resolve um cálculo, você pode treinar uma rede para realizá-lo e depois testar a hipótese de que o cérebro funciona da mesma maneira. Quer a hipótese seja confirmada ou não, você aprenderá alguma coisa”, diz Harris, que não esteve envolvido no estudo. “Este artigo mostra que a 'pós-dição' é menos poderosa: as redes neurais têm muitos parâmetros, portanto, fazê-las replicar um resultado existente não é tão surpreendente.”
Ao usar esses modelos para fazer previsões sobre como o cérebro funciona, é importante levar em conta restrições biológicas conhecidas e realistas ao construir os modelos, dizem os pesquisadores do MIT. Eles agora estão trabalhando em modelos de células da grade que esperam gerar previsões mais precisas de como funcionam as células da grade no cérebro.
“Os modelos de aprendizagem profunda nos darão uma visão sobre o cérebro, mas somente depois de injetar muito conhecimento biológico no modelo”, diz Khona. “Se você usar as restrições corretas, os modelos poderão fornecer uma solução semelhante à do cérebro.”
A pesquisa foi financiada pelo Office of Naval Research, pela National Science Foundation, pela Simons Foundation por meio da Simons Collaboration on the Global Brain e pelo Howard Hughes Medical Institute por meio do programa de bolsistas do corpo docente. Mikail Khona foi apoiado pela MathWorks Science Fellowship.
Nenhum comentário:
Postar um comentário