O Google tem anunciado o lançamento de dois modelos generativos de IA, Veo e Imagen 3, disponíveis para empresas que usam Vertex AI, sua plataforma em nuvem para ferramentas de IA. O Veo foi projetado para gerar vídeos de alta definição a partir de imagens e prompts de texto, enquanto o Imagen 3 se concentra na produção de imagens realistas a partir de simples entradas de texto.
Google lança modelos generativos de IA Veo e Imagen 3 para empresas
Veo, desenvolvido pelo Google DeepMind, gera vídeos com pessoas e animais de aparência realista. Os usuários podem criar conteúdo enviando uma imagem vinculada a um prompt de texto ou inserindo apenas texto. Atualmente, o Veo estará acessível para empresas selecionadas por meio de uma visualização privada. Produz videoclipes em 1080p com duração de até seis segundos, suportando 24 ou 30 quadros por segundo. De acordo com Warren Barkley, diretor sênior de gerenciamento de produtos do Google Cloud, a resposta empresarial à IA generativa tem sido extremamente positiva, com relatórios indicando um aumento de receita de 86% entre as empresas que integraram essas tecnologias.
Incitar: Timelapse da aurora boreal dançando no céu do Ártico, estrelas brilhando, paisagem coberta de neve
Vídeo: Google
Imagem 3também lançado recentemente, é apontado como o modelo de geração de imagens da mais alta qualidade do Google. Ele pode criar imagens fotorrealistas e oferece recursos avançados de edição, como adicionar, remover ou estender elementos em uma imagem. A partir da próxima semana, todos os clientes da Vertex AI terão acesso ao Imagen 3. Marcas como Cadbury, Oreo e Milka estão entre as primeiras a utilizar esses modelos em suas estratégias de marketing.
Ambos os modelos incorporam marcas d’água digitais para evitar desinformação e atribuição incorreta, utilizando a tecnologia SynthID do Google DeepMind. Além disso, incluem salvaguardas integradas para evitar o uso indevido e a geração de conteúdo prejudicial. É importante ressaltar que nenhum dos modelos é treinado com base nos dados do cliente.
Capacidades e limitações do Veo
A disponibilidade do Veo em versão prévia privada permitirá que empresas como Quora e Mondelez International explorem aplicações criativas, como a geração de conteúdo de vídeo para suas plataformas. A capacidade do Veo de criar cenas com estilos visuais específicos é um de seus recursos de destaque. Ele pode produzir conteúdo dinâmico, incluindo fotos de paisagens e vídeos com lapso de tempo. No entanto, o modelo não está isento de falhas. Questões como o desaparecimento de objetos e a física irrealista, como a marcha-atrás de veículos, realçam as suas limitações atuais.
Incitar: Um movimento rápido derrubou uma rua residencial suburbana ladeada por árvores. Dia com céu azul claro. Cores saturadas, alto contraste
Vídeo: Google
Veo foi treinado em uma ampla variedade de filmagens para aprimorar suas capacidades. Quando questionado sobre suas fontes de treinamento, Barkley mencionou que “pode” incluir conteúdo do YouTube, de acordo com acordos com criadores de conteúdo. Ele enfatizou que o Google se concentra no uso de dados selecionados e de alta qualidade, aderindo aos padrões de segurança e proteção. Tal como acontece com outros modelos de IA, surgem preocupações sobre direitos autorais e conteúdo proprietário, especialmente com o potencial dos modelos produzirem cópias quase idênticas de trabalhos existentes.
O Google afirma que implementou filtros em nível de prompt para gerenciar resultados potencialmente prejudiciais. Além disso, a empresa planeja indenizar a produção do Veo no Vertex AI assim que estiver disponível para o público geral, oferecendo alguma proteção para empresas que utilizam a ferramenta.
O Google está gradualmente integrando o Veo em seu conjunto de produtos, como evidenciado pela sua introdução no Google Labs no início deste ano, após os anúncios iniciais. Em setembro, o modelo foi incorporado ao YouTube Shorts, permitindo aos criadores produzir facilmente cenas de fundo e breves videoclipes.
Crédito da imagem em destaque: Google DeepMind