OpenAI tem lançado Sora, um modelo de IA de texto para vídeo, disponibilizando-o para usuários nos EUA e em muitos outros países. Lançado em fevereiro, Sora permite aos usuários gerar vídeos a partir de prompts de texto, animar imagens e remixar vídeos. Opera sob um modelo de assinatura escalonada, oferecendo acesso limitado a não assinantes.
Como usar o OpenAI Sora agora?
Sora é acessível através Sora.com para usuários ChatGPT, oferecendo diferentes recursos com base nos níveis de assinatura. Os assinantes do ChatGPT Plus podem criar até 50 vídeos em resoluções de até 720p, enquanto os assinantes do ChatGPT Pro pagam US$ 200 por mês para geração ilimitada de vídeos, resolução de 1080p e recursos adicionais, como uploads simultâneos e downloads sem marca d’água. A disponibilidade pública do produto segue uma semana de suspensão do serviço devido ao acesso não autorizado a backdoor criado por artistas que protestavam contra as práticas da OpenAI.
A OpenAI enfatizou que os vídeos gerados via Sora apresentarão marcas d’água visíveis e metadados C2PA para identificar suas origens de IA. Os usuários devem confirmar que o conteúdo enviado não inclui menores, conteúdo explícito ou material protegido por direitos autorais. O uso indevido da plataforma pode levar ao banimento de contas, já que a OpenAI visa equilibrar a expressão criativa com medidas contra atividades ilegais.
O evento de lançamento da OpenAI apresentou as funcionalidades do Sora, incluindo uma página “explorar” onde os usuários podem visualizar vídeos criados por outros e um recurso “storyboards” permitindo a criação de vídeos a partir de prompts sequenciais. O serviço também inclui uma ferramenta de “remix” para modificar resultados gerados por IA e combinar recursos visuais. No entanto, a OpenAI reconheceu que as capacidades do Sora não são perfeitas, citando as respostas dos primeiros testadores como variando entre impressionantes e exibindo “estranhos defeitos visuais”.
Embora apresente um desempenho mais rápido na versão Turbo em comparação com a prévia de fevereiro, Sora luta com física realista e ações complexas por longos períodos. A OpenAI reconhece estas restrições, mas enfatiza a sua intenção de dar tempo à sociedade para explorar as possibilidades da tecnologia e co-criar normas para uma utilização responsável à medida que as capacidades de geração de vídeo avançam.
Vídeo: OpenAI
A transparência e a segurança continuam sendo fundamentais para a implementação do Sora. Cada vídeo gerado pelo Sora inclui metadados C2PA para verificar sua origem, juntamente com marcas d’água visíveis para distinguir o conteúdo de IA. A OpenAI também implementou salvaguardas avançadas para bloquear o uso indevido prejudicial, incluindo conteúdo como material de abuso sexual infantil (CSAM) e deepfakes sexuais. Por enquanto, o recurso que permite uploads de imagens está restrito a um pequeno grupo de testadores sob rígidas políticas de moderação. A OpenAI planeja refinar seus esforços de mitigação de deepfake antes de expandir ainda mais o acesso, incorporando insights de red-teaming e parcerias com ONGs para garantir um ambiente seguro e confiável.
YouTube exige respostas sobre os dados de treinamento de Sora
Ainda não está claro se o Sora estará disponível no Reino Unido ou em outras partes da Europa, já que a OpenAI está lidando com questões de conformidade relacionadas às leis de direitos autorais e proteção de dados. A empresa tem sofrido escrutínio sobre suas práticas, incluindo reclamações de artistas alegando exploração relacionada ao teste do modelo Sora.
Em resumo, a ferramenta de conversão de texto em vídeo da OpenAI, Sora, oferece recursos como geração de vídeos a partir de prompts de texto, animação de imagens e remixagem de conteúdo gerado por IA, tornando a criação de vídeos mais acessível e interativa. No entanto, não é isento de limitações – Sora luta com física realista, ações complexas de longa duração e às vezes produz defeitos visuais. Embora a versão Turbo ofereça geração mais rápida e resoluções mais altas, essas imperfeições destacam sua natureza inicial. A OpenAI implementou salvaguardas, incluindo marcas d’água e metadados, para garantir a transparência e evitar o uso indevido, com o objetivo de equilibrar a criatividade com o uso responsável da IA à medida que a tecnologia evolui.
O lançamento da Sora destaca as preocupações constantes no campo da geração de vídeo por IA, onde as capacidades estão evoluindo rapidamente, mas podem levar ao uso indevido para desinformação ou deepfakes. A OpenAI se comprometeu a limitar algumas formas de conteúdo, bloqueando uploads que incluam nudez ou representações prejudiciais.
Crédito da imagem em destaque: OpenAI