DeepMind tem introduzido Genie 2, um modelo avançado de IA capaz de gerar mundos 3D interativos a partir de simples descrições de texto e imagens. Anunciado em 4 de dezembro de 2024, o sucessor do Genie 1 cria diversos ambientes virtuais, permitindo aos usuários interagir de forma dinâmica por meio de controles de teclado e mouse, simulando ações como pular e nadar. Ele é treinado em vários vídeos e pode modelar interações, física e comportamento de NPCs.
DeepMind lança Genie 2, uma IA revolucionária para mundos 3D
Genie 2 tem a capacidade de visualizar uma vasta gama de cenas 3D, oferecendo funcionalidades semelhantes aos videogames AAA. Ao processar prompts, o modelo pode produzir ambientes consistentes, incluindo perspectivas em primeira pessoa e isométricas que duram entre 10 a 20 segundos, com algumas se estendendo por até um minuto. As afirmações da DeepMind afirmam que o modelo lembra partes de uma cena além da visão imediata, renderizando-as com precisão ao reaparecer. Isso contrasta com modelos existentes, como o simulador Minecraft da Decart, que muitas vezes lutam com consistência e resolução.
Essas GPUs Battlemage Intel vazadas são feras dos jogos
O elemento fundamental do Genie 2 envolve o processamento de uma imagem de referência combinada com um prompt de texto, agilizando a geração de ambientes altamente interativos. Por exemplo, um prompt como “Um robô humanóide fofo na floresta” permite que o modelo crie uma cena correspondente. A inclusão de interações complexas, como permitir aos jogadores estourar balões ou navegar pelos ambientes, mostra seu robusto mecanismo de física. Apesar de tais capacidades, surgem preocupações em relação à interpretação da entrada do modelo, especialmente se ele replica inadvertidamente elementos do jogo protegidos por direitos autorais devido à falta de detalhes em relação às fontes de dados de treinamento.
As implicações de propriedade intelectual decorrentes dos dados de treinamento do Genie 2 levantam questões significativas. A DeepMind se beneficia do amplo acesso do Google ao YouTube, possivelmente utilizando conteúdo de vídeo para treinamento de modelos. Esse acesso leva a especulações sobre a geração de reproduções não licenciadas dos jogos observados, o que pode se tornar objeto de exame jurídico. À medida que o modelo de IA confunde os limites da originalidade, a preocupação com a replicação não autorizada torna-se cada vez maior.
Descobertas de um COM FIO A investigação destacou que grandes empresas, incluindo a Activision Blizzard, estão empregando tecnologias de IA para agilizar processos, levando potencialmente à perda de empregos. A introdução do Genie 2 pode complicar ainda mais o cenário, onde as ferramentas de IA aceleram o desenvolvimento ao mesmo tempo que desafiam os cargos tradicionais.
DeepMind enfatiza o papel do Genie 2 no desenvolvimento de diversas tarefas de avaliação para agentes de IA. Embora os requisitos de computação e as perspectivas de comercialização do modelo permaneçam desconhecidos, os avanços contínuos apontam para uma relação em evolução entre a IA e o design de jogos. Vários relatórios indicam um influxo de investimento em tecnologias de modelos mundiais, significando uma mudança fundamental tanto na investigação de IA como nas experiências de jogos interactivos. Esta tendência repercute num fascínio crescente pelo potencial da IA para remodelar as indústrias criativas.
Os esforços concentrados de contratação da DeepMind destacam o compromisso com desenvolvimentos pioneiros. O seu recrutamento estratégico de talentos de outras empresas líderes em IA reforça a sua intenção de permanecer na vanguarda das tecnologias generativas de IA.
Créditos de imagem e vídeo em destaque: Google DeepMind