As simulações de dinâmica molecular (MD) são uma pedra angular da química e biologia modernas, mas automatizá -las permaneceu um desafio – até agora.
Pesquisadores da Universidade de Rochester e Futurehouse Inc., incluindo Quintina Campbell, Sam Cox, Jorge Medina, Brittany Watterson e Andrew D. White, introduziram o MDCrow: Automatando os fluxos de trabalho de dinâmica molecular com modelos de idiomas grandes-um agente de IA projetado para projetado para Otimize tarefas complexas de MD usando modelos de idiomas grandes (LLMS).
MDCROW se integra 40 ferramentas projetadas por especialistas Para lidar com todas as etapas de um fluxo de trabalho de MD – desde a preparação de arquivos de entrada até a execução de simulações e analisando os resultados. Ao contrário das tentativas anteriores limitadas a ecossistemas de software específicos, o MDCrow foi projetado para ampla adaptabilidade. Emprega Raciocínio da cadeia de pensamento Para interagir com as ferramentas dinamicamente, otimizando os fluxos de trabalho sem exigir uma extensa intervenção humana.
O desafio de automatizar simulações de MD
As simulações de MD exigem ajuste meticuloso de parâmetrosdesde a seleção de campos de força até o gerenciamento de etapas complexas de pré e pós-processamento. Embora os avanços computacionais tenham melhorado a acessibilidade, A automação completa permaneceu ilusória Devido à tomada de decisão altamente especializada envolvida. Esforços anteriores, como Radonpy e Pyautofep, focados em domínios estreitos ou integrações de ferramentas rígidas necessárias. Mdcrow muda isso por Combinando a adaptabilidade do LLMS com ferramentas especializadas para MDcriando um sistema que pode generalizar em diferentes aplicações científicas.
Como funciona o MDCrow
Construído usando o Langchain Framework e um prompt de estilo ReactMdcrow funciona como um Assistente orientado a LLM que seleciona e executa de forma autônoma dentro de um ambiente controlado. Interage com as ferramentas em quatro áreas -chave:
- Recuperação de informações: Acesso a literatura, bancos de dados e estruturas de proteínas para informar os parâmetros de simulação.
- PDB e manuseio de proteínas: Limpeza e processamento de arquivos PDB para simulações moleculares.
- Execução da simulação: Executando simulações de MD usando o OpenMM, lidando automaticamente com erros.
- Análise e visualização: Gerando insights de saídas de simulação, incluindo análises estruturais e avaliações de estabilidade.
A principal inovação é a capacidade de Mdcrow de adaptar -se dinamicamente à complexidade da tarefa. Seja realizando uma limpeza de estrutura simples ou orquestrando simulações em várias etapas com análises complexas, o sistema refina sua abordagem com base em resultados anteriores e feedback em tempo real.
Estamos realmente testando a IA 3D? O estudo revela uma grande falha nos benchmarks 3D
Benchmarking mdcrow
Para avaliar os recursos do MDCrow, a equipe de pesquisa testou 25 tarefas de aumento da complexidadecomparando seu desempenho em diferentes LLMs, incluindo GPT-4O, LLAMA3-405B e CLAUDE-3 OPUS.
Os resultados são impressionantes:
- Mdcrow, alimentado pelo GPT-4O, concluiu com êxito 72% das tarefasSuperando as configurações padrão LLM padrão.
- LLAMA3-405B, uma alternativa de código aberto, alcançou 68% de conclusãoprovando uma solução não proprietária viável.
- LLMs básicos sem as ferramentas especializadas da MDCrow alcançadas apenas 28% de precisãodestacando a importância dos fluxos de trabalho projetados por especialistas.
- O estilo rápido teve pouco impacto nos modelos de alto desempenho Mas afetou significativamente os mais fracos, reforçando a necessidade de raciocínio estruturado em tarefas científicas complexas.
Mdcrow representa a Grande passo em direção a simulações moleculares totalmente autônomasmas seu impacto se estende além dos fluxos de trabalho do MD. Por permitindo que a IA lida com tarefas computacionais intrincadas e em várias etapasMdcrow demonstra como os LLMs podem servir como assistentes científicosacelerando a descoberta em química, ciência dos materiais e bioengenharia.
O estudo também mostra a importância de Colaboração Humana-AI. Enquanto o MDCROW automatiza processos de rotina, seu recurso interativo de “bate -papo” permite que os cientistas refinar os fluxos de trabalho em tempo realorientando a IA a uma solução de problemas mais complexa.
A pesquisa é de código aberto, com código disponível em Github.
Crédito da imagem em destaque: Kerem Gülen/Midjourney