Você já se perguntou como pode navegar em um novo bairro com bastante facilidade ou descobrir um projeto complexo em casa? Você provavelmente o gerencia sem suar, encontrar seu caminho ou alinhar as etapas sem mapear todas as opções. Agora, pense em inteligência artificial. Embora a IA possa esmagar jogos específicos ou números de crocantes, construir uma IA que navega no mundo real bagunçado e parcialmente conhecido como nós ainda é um enorme desafio. Por que somos tão bons nesse planejamento complexo, muitas vezes encontrando soluções que parecem impossivelmente difíceis para os computadores? E por que os testes de laboratório às vezes nos mostram seguindo caminhos que não são tecnicamente os ‘melhores’ absolutos?
Esse quebra -cabeça é essencial para entender a inteligência, tanto a nossa quanto o tipo artificial. A IA padrão costuma ver o planejamento como explorando uma árvore gigante de ramificação de opções e resultados. Quanto maior a árvore, mais difícil o problema. Mas os humanos claramente não operam dessa maneira. Parece que não carregamos um plano perfeito e detalhado do mundo. Uma equipe de pesquisadores da Universidade de Dalhousie, Universidade de Waterloo, MIT e Universidade de Cornell, tem uma ideia alternativa fascinante. E se nossos mapas mentais não forem como imagens estáticas, mas mais como programas de computador flexíveis?
Marta Kryven, Cole Wyeth, Aidan Curtis e Kevin Ellis sugerem que nosso talento para o planejamento vem de uma crença central: O mundo geralmente segue padrões previsíveis. Em vez de memorizar todos os últimos detalhes, talvez criemos modelos mentais usando programas compactos que capturam repetição, simetria e pedaços reutilizáveis. Pense em reconhecer o layout padrão dos pisos de escritório ou a maneira como as ruas geralmente formam grades. Essa ideia de “conceitos como programas” impede nossos cérebros como constantemente procurando o código subjacente do mundo para navegar com eficiência. Vamos mergulhar em seus estudar.
Por que as plantas e a força bruta ficam aquém
Por que pensar em mapas como programas potencialmente um divisor de águas? Veja como a IA típica lida com o planejamento, especialmente quando não possui todas as informações. Essa situação é frequentemente modelada como um POMDP ou processo de decisão de Markov parcialmente observável. Encontrar a melhor solução geralmente envolve o cálculo de chances para todos os cenários possíveis e planejamento em toda essa incerteza. Essa abordagem se torna rapidamente esmagadoramente complexa, mesmo para ambientes bastante simples. Simplesmente não parece a maneira suave da maneira como os humanos se localizam.
Além disso, há essa desconexão estranha. Lidamos com a complexidade estruturada da vida real muito bem. Pense grades da cidade, móveis modulares, trilhas em um parque. Mas coloque as pessoas em tarefas de laboratório simplificadas projetadas sem estrutura clara e geralmente não seguem o caminho “ideal” matematicamente. Os pesquisadores costumavam atingir isso até limites mentais, como apenas pensar alguns passos à frente. Mas Kryven e seus colegas pensam que isso pode perder o ponto. Talvez não não sejamos planejadores falhos. Talvez estejamos incrivelmente bons planejadores especificamente para o tipo estruturado de mundo em que realmente vivemos. Procuramos padrões e os usamos.
Os pesquisadores da IA tentaram combater a complexidade com estratégias como o planejamento hierárquico (dividindo grandes problemas em pequenos) ou reconhecendo estados de jogo semelhantes. Mas aprender e usar automaticamente o tipo de conhecimento estrutural do “senso comum” que temos continua sendo um grande obstáculo.
Conheça o GMP: planejando como um codificador
Para testar sua idéia, os pesquisadores construíram um modelo de computador chamado planejamento modular generativo, ou GMP. Este modelo funciona sobre o princípio dos mapas cognitivos como programas. Não armazena uma imagem exata de um lugar. Em vez disso, descobre um programa simples que captura sua estrutura básica.
O GMP tem duas partes principais:
- O gerador de mapa (GMM): Esta parte olha para um mapa, como um labirinto em seu experimento, e tenta escrever o programa mais simples que pode reconstruí -lo. Aqui está uma reviravolta realmente interessante. Os pesquisadores usaram um modelo de idioma grande, GPT-4, para este trabalho. Não é para planejar, mas para escrever código. Eles levaram o LLM a identificar repetindo padrões visuais no labirinto. Então, o LLM escreveu o código Python definindo esses pedaços e explicando como combiná -los (mover, girar, mudar) para recriar o mapa. O sistema prefere programas simples que reutilizam pedaços com eficiência. Segue um princípio que favorece a explicação mais compactada, procurando essencialmente o código mais elegante que descreve a estrutura do mapa.
- O Planejador Modular (FP): Depois que o GMM cria um mapa do programa feito de pedaços reutilizáveis, o módulo FP descobre como se locomover. Em vez de calcular um caminho enorme e complexo para todo o mapa, ele planeja uma rota eficiente dentro de cada tipo de pedaço apenas uma vez. Então, toda vez que se depara com o mesmo tipo de pedaço novamente, simplesmente puxa e reutiliza o plano que já fez. Isso economiza uma tonelada de poder de computação e memória. Para ir de um pedaço para outro, ele segue em direção ao pedaço inexplorado mais próximo, assumindo para iniciantes que o gol (como a saída do labirinto) poderia estar em qualquer lugar.
Essa maneira de planejar é inteligente em cada módulo. Encontra o melhor caminho dentro daquela peça reconhecida. Mas conectar esses caminhos locais inteligentes pode levar a uma rota global que é um pouco mais longa do que se um planejador analisasse o mapa inteiro perfeitamente. Essa possibilidade de rotas inteligentes, eficientes, mas talvez um pouco indiretas, era exatamente o tipo de comportamento humano que os pesquisadores estavam observando.
Então, as pessoas realmente planejam como o modelo GMP? A equipe usou uma tarefa de pesquisa de labirinto para descobrir. Trinta participantes navegaram 20 labirintos diferentes em um computador, vendo o mundo a partir de uma visão em primeira pessoa. Partes do labirinto estavam escondidas até se aproximarem o suficiente. O objetivo deles: encontre a saída oculta, marcada por um azulejo vermelho.
Estes não eram apenas labirintos. Eles foram projetados especificamente com estruturas claras e repetidas. Eles tinham layouts modulares feitos de peças distintas, como certas formas da sala ou seções do corredor. Essa configuração foi perfeita para ver se as pessoas explorariam naturalmente o módulo por módulo, ou se tivessem atalhos atravessando os módulos se isso parecesse matematicamente mais curto, como os planejadores ideais tradicionais poderiam prever.
A equipe comparou os caminhos das pessoas a três modelos diferentes:
- GMP: O novo modelo, apostando em pesquisa modular com base nesses mapas semelhantes ao programa.
- Utilidade esperada: O planejador “ideal” padrão, calculando o caminho mais curto absoluto, dada a incerteza.
- Utilitário com desconto: Um modelo que imita o planejamento com um tempo de atenção limitado (olhando apenas alguns passos à frente), que explicaram bem o comportamento humano em não estruturado Mazes antes.
Os Mazes foram projetados para que os modelos tradicionais geralmente sugerissem caminhos não modulares, facilitando a ver qual estratégia as pessoas preferem.
Somos planejadores modulares
As descobertas foram bem claras. As pessoas usaram esmagadoramente estratégias modulares. Eles exploraram o pedaço de Mazes estruturado por pedaços, movendo -se sistematicamente de uma seção reconhecida para a próxima próxima. Isso não foi apenas um acaso; Era o padrão consistente entre diferentes designs de labirinto e a maioria dos participantes.
Os pesquisadores analisaram atentamente “decisões discriminatórias”. Esses foram pontos no labirinto em que o modelo GMP sugeriu um movimento diferente dos modelos tradicionais. Nesses momentos importantes, O GMP fez um trabalho significativamente melhor prevendo o que as pessoas realmente faria. As pessoas não estavam apenas sendo aleatoriamente ineficientes; Eles estavam sendo sistematicamente modular. O comportamento deles alinhou lindamente com a estratégia que você esperaria se eles estivessem usando mapas mentais semelhantes ao programa.
Uma das partes realmente legais deste estudo é como eles usaram o LLM. Não estava tomando decisões. Estava agindo como um substituto para o humano Percepção estrutural. Como os LLMs são treinados em montanhas de escrita e código humanos, eles parecem absorver maneiras comuns de maneiras que os humanos estruturam as coisas, incluindo espaços. Quando solicitado a escrever um programa para o labirinto, o GPT-4 criou quebras estruturais, os pedaços e as regras, que correspondiam à maneira como as pessoas navegaram mais tarde.
Isso sugere que o LLMS pode ser útil para mais do que apenas gerar texto. Eles poderiam potencialmente nos ajudar a entender as suposições internas e os atalhos mentais, os “vieses indutivos”, nós, humanos, usamos para entender tudo. Aqui, ajudou a traduzir um labirinto visual em uma estrutura útil e semelhante a um código, perfeita para um planejamento eficiente.
Pesquisa: uma tabela periódica para aprendizado de máquina
Mudando como pensamos sobre mapas mentais e ai
Esta pesquisa desafia a antiga idéia de mapas cognitivos como imagens simples e estáticas em nossas cabeças. Pensar neles como programas generativos ativos faz sentido computacional. Ele explica como lidamos com o mundo real complexo e incerto, com capacidade cerebral limitada. Isso explica nossa eficiência em lugares estruturados, e talvez até por que às vezes seguimos caminhos que não são matematicamente perfeitos, mas são muito mais fáceis de descobrir e lembrar.
Para inteligência artificial, isso oferece um caminho prático a seguir. O modelo GMP mostra o poder de encontrar a estrutura primeiro e depois planejar modularmente. Os agentes de IA construídos dessa maneira podem navegar em ambientes complexos e parcialmente conhecidos com muito mais eficiência, precisando de muito menos memória e poder de processamento. Aponta para a IA que planeja mais como nós, detectando padrões em vez de apenas triturar possibilidades.
Claro, ainda existem perguntas. O modelo GMP atual faz suposições simples sobre a movimentação entre os pedaços. Pesquisas futuras precisam explorar como podemos priorizar determinadas áreas com base em experiência passada ou metas atuais. Como ajustamos nossos programas mentais quando o mundo não corresponde às nossas expectativas? Quanto nossos objetivos influenciam as estruturas que percebemos? Mesmo com essas perguntas em aberto, este estudo nos dá uma nova e poderosa maneira de pensar em como encontramos nosso caminho.
No final, sugere algo profundo sobre nós. Nossa incrível capacidade de navegar e agir de maneira eficaz em nosso mundo complexo pode se resumir aos nossos cérebros sendo os especialistas em padrões, constantemente identificando o código subjacente da realidade estruturada ao nosso redor e representando-o não apenas como uma cena, mas como um programa pronto para ser executado.