Novas pesquisas indicam que a aprendizagem por transferência pode acelerar significativamente a busca por novas físicas, reduzindo a necessidade de simulações caras. No entanto, a dependência de padrões estabelecidos pode fazer com que a IA ignore fenómenos genuinamente novos, de acordo com um estudo publicado no Journal of Cosmology and Astroparticle Physics (JCAP).
O modelo padrão da cosmologia, conhecido como ΛCDM, explica muitas características do universo, mas não é abrangente. Novas observações levantaram questões sobre conceitos como neutrinos massivos, gravidade modificada e evolução da energia escura. Investigar isso requer extensas simulações de computador, que são computacionalmente caras e demoradas.
A equipe de pesquisa teve como objetivo determinar se a aprendizagem por transferência poderia aumentar a eficiência da simulação. A aprendizagem por transferência permite que uma IA aplique conhecimento desde tarefas mais simples até tarefas mais complexas, reduzindo assim os custos. Inicialmente, a IA foi treinada em simulações básicas de ΛCDM antes de fazer a transição para modelos mais complexos que incorporavam possíveis novas físicas.
Adrian Bayer, coautor do Flatiron Institute e da Universidade de Princeton, descreveu este método como um atalho para o treinamento tradicional em IA. “Normalmente, as pessoas treinam a IA diretamente nas simulações computacionalmente mais caras. Em vez disso, o que fazemos é primeiro usar simulações ΛCDM mais simples e menos dispendiosas para dar à IA uma ideia do que está acontecendo”, disse Bayer.
Essa estratégia de pré-treinamento ajudou a IA a gerenciar a complexidade sem ficar sobrecarregada. O estudo descobriu que a aprendizagem por transferência reduziu o número de simulações dispendiosas necessárias em mais de dez vezes em alguns casos.
Os investigadores também identificaram um desafio conhecido como transferência negativa, que ocorre quando a IA interpreta mal novas informações com base no seu conhecimento pré-existente. A IA muitas vezes teve dificuldade para discernir novos efeitos quando eles se assemelhavam a padrões alinhados com os parâmetros ΛCDM existentes. Isto ficou evidente em simulações envolvendo neutrinos massivos, onde a IA enfrentou dificuldade em diferenciar novas assinaturas daquelas que já tinha associado a parâmetros conhecidos.
Veena Krishnaraj, principal autora do estudo, explicou que a transferência negativa resulta de degenerescências físicas subjacentes nos modelos. “Diferentes processos físicos podem produzir assinaturas observáveis muito semelhantes”, observou ela, indicando a necessidade de cautela na interpretação dos resultados da IA.
O estudo enfatiza os benefícios potenciais e as limitações da aprendizagem por transferência no domínio da física. Embora o pré-treinamento possa agilizar a análise de dados, pode prejudicar a capacidade da IA de reconhecer descobertas inovadoras. A próxima fase envolverá a aplicação da técnica de aprendizagem por transferência a observações astronômicas reais.
Os pesquisadores prevêem que a aprendizagem por transferência será fundamental para as próximas pesquisas cosmológicas destinadas a coletar dados de alta precisão. O artigo intitulado “Transfer Learning Beyond the Standard Model”, de autoria de Veena Krishnaraj e colegas, foi publicado agora no JSTAT.




