Disponível no Amazon Bedrock, a linha Amazon Nova inclui Nova Micro, um modelo de conversão de texto em texto altamente eficiente, Nova Lite, Nova Pro e Nova Premier — modelos multimodais que processam texto, imagens e vídeos para gerar conteúdo de texto.
A Amazon também revelou dois modelos adicionais: Tela Amazon Novaprojetado para produzir visuais com qualidade de estúdio e Carretel Amazon Novaque gera vídeos de nível profissional.
Rohit Prasad, vice-presidente sênior de Inteligência Geral Artificial da Amazon, destacou a perspectiva única da Amazon, dizendo:
“Na Amazon, usamos quase 1.000 aplicativos de IA. Isso nos dá uma compreensão de alto nível de onde os desenvolvedores continuam a enfrentar desafios. Nossos novos modelos do Amazon Nova visam ajudar os desenvolvedores dentro e fora da Amazon a superar essas barreiras. Eles oferecem recursos excepcionais de inteligência e geração de conteúdo, ao mesmo tempo em que aprimoram a latência, a relação custo-benefício, a personalização, a geração aumentada de recuperação (RAG) e as funcionalidades baseadas em agentes.”
Amazon Nova: Inteligência e velocidade em ação
A linha Nova inclui quatro modelos: Amazon Nova Micro leva com latência e custo ultrabaixos, tornando-o ideal para aplicativos somente de texto que exigem respostas rápidas. Os três modelos restantes ultrapassam os limites da IA multimodal:
- Amazon Nova Lite é uma opção econômica para processar imagens, vídeo e texto em velocidades notáveis.
- Amazon Nova Pro combina precisão, velocidade e eficiência de custos para uma ampla gama de tarefas, oferecendo recursos avançados em diversas modalidades.
- Amazon Nova Premier permanece como o modelo multimodal mais poderoso da Amazon, destacando-se em tarefas complexas de raciocínio e servindo como um “professor” ideal para destilar modelos menores e especializados.
Amazon Nova Micro, Nova Lite e Nova Pro já estão disponíveis para uso geral, enquanto o Nova Premier será lançado no primeiro trimestre de 2025.
Resultados de benchmark de desempenho
Os modelos Nova foram rigorosamente testados em relação aos padrões de referência da indústria. Os resultados mostram que esses modelos têm desempenho consistente ou superior às alternativas líderes.
- Amazon Nova Micro entregou resultados competitivos, igualando ou superando Meta LLaMa 3,1 8B em 11 benchmarks e Google Gemini 1,5 Flash-8B em 12 benchmarks. Com uma velocidade de saída líder do setor de 210 tokens por segundo, é ideal para aplicações que exigem respostas rápidas.
- Amazon Nova Lite demonstrou forte desempenho em benchmarks, incluindo precisão para tarefas de texto e vídeo, gráficos e compreensão de documentos, destacando-se em testes VATEX, ChartQA e DocVQA.
- Amazon Nova Pro demonstrou seus recursos superando o OpenAI GPT-4o em 17 dos 20 benchmarks e fornecendo resultados excepcionais para fluxos de trabalho RAG, acompanhamento de instruções e tarefas baseadas em agentes.
Suporta tarefas de longo contexto, multilíngues e multimodais
Os modelos Amazon Nova Micro, Lite e Pro oferecem suporte a mais de 200 idiomas. A Nova Micro lida com contextos de entrada de até 128.000 tokens, enquanto a Nova Lite e a Nova Pro suportam até 300.000 tokens ou processamento de vídeo de 30 minutos. A Amazon planeja expandir isso para mais de 2 milhões de tokens no início de 2025.
Desempenho econômico e de alta velocidade
Os modelos Amazon Nova são projetados para oferecer velocidade e eficiência de custos excepcionais. Em comparação com outros modelos de alto desempenho em suas classes de inteligência no Amazon Bedrock, Nova Micro, Nova Lite e Nova Pro são pelo menos 75% mais econômico ao mesmo tempo que oferece o desempenho mais rápido.
Integração perfeita com Amazon Bedrock
Os modelos do Amazon Nova integram-se diretamente ao Amazon Bedrock, o serviço totalmente gerenciado da AWS que oferece aos clientes acesso a modelos básicos dos principais provedores de IA e da própria Amazon por meio de uma única chamada de API. Com o Bedrock, os desenvolvedores podem testar e avaliar facilmente os modelos Nova junto com outras opções para determinar o melhor ajuste para suas aplicações.
Personalização através de ajuste fino
Os modelos do Amazon Nova oferecem suporte ao ajuste fino personalizado, permitindo que os clientes melhorem a precisão guiando os modelos com exemplos de seus próprios dados. Os modelos aprendem o que é mais importante para um cliente – seja texto, imagens ou vídeos – e o Amazon Bedrock fornece respostas personalizadas e ajustadas.
Destilação eficiente para modelos menores e especializados
Além do ajuste fino, o Nova oferece suporte destilação modelopermitindo a transferência de conhecimento de modelos grandes e de alta capacidade para modelos menores, mais rápidos e mais econômicos, sem sacrificar a precisão.
Melhorando a precisão com geração aumentada de recuperação
Os modelos Amazon Nova integram-se perfeitamente com Bases de conhecimento da Amazon Bedrockpermitindo que a geração aumentada de recuperação (RAG) forneça respostas com base nos dados da própria organização para os mais altos níveis de precisão.
Otimizado para aplicativos de agente
Projetados para se destacarem em tarefas de várias etapas, os modelos Nova são otimizados para aplicações baseadas em agentes que exigem interação com sistemas e dados proprietários por meio de múltiplas APIs.
Conteúdo visual com qualidade de produção
Tela Amazon Nova gera imagens de qualidade profissional a partir de prompts de texto ou imagem, com controles integrados para edição, ajustes de cores e layouts. As salvaguardas integradas incluem marca d’água e moderação de conteúdo para garantir o uso responsável da IA. Nas avaliações, o Nova Canvas superou modelos como OpenAI DALL·E 3 e Stable Diffusion.
Carretel Amazon Nova capacita os clientes a criar vídeos de alta qualidade a partir de texto e imagens. Projetado para publicidade, marketing e conteúdo educacional, permite controle sobre estilos visuais, ritmo e efeitos de câmera. A Nova Reel superou consistentemente os concorrentes, com os revisores preferindo sua produção em vez da Runway Gen-3 Alpha. Embora atualmente suporte vídeos de seis segundos, o Nova Reel se expandirá para a geração de vídeos de dois minutos nos próximos meses.
Olhando para o futuro: Fala e modelos multimodais para multimodais
No primeiro trimestre de 2025, a Amazon planeja lançar um modelo de fala para fala projetado para transformar aplicativos de IA para interações de voz naturais. O modelo interpretará a linguagem falada, o tom e o ritmo para fornecer respostas semelhantes às humanas com latência mínima.
Além disso, a Amazon está desenvolvendo um modelo multimodal para multimodal capaz de receber texto, imagens, áudio e vídeo como entradas e produzir resultados em qualquer uma dessas modalidades. Este modelo, previsto para meados de 2025, simplificará aplicações que exigem tradução de conteúdo, edição e compreensão multimodal.
Adoção antecipada
Várias organizações líderes já estão adotando os modelos Nova:
- SEIVA integra modelos Nova ao SAP AI Core para potencializar soluções baseadas em IA em automação, personalização e planejamento da cadeia de suprimentos.
- Deloitte está aproveitando os recursos avançados de personalização da Nova para fornecer serviços de IA generativos personalizados em todo o mundo.
- Dentsu Digital Inc. usa o Nova Reel para agilizar a produção de vídeos criativos, reduzindo os prazos das campanhas de semanas para dias.
- Musixmatch incorpora Nova Reel em sua plataforma para ajudar artistas emergentes a gerar vídeos musicais de alta qualidade.
- 123RF está simplificando os processos de design para criadores de conteúdo com Nova Canvas e Nova Reel.
- Caylent usa modelos Nova para acelerar fluxos de trabalho de compreensão de vídeo para clientes de mídia, esportes e varejo.
- Palantir Technologies integra o Nova Pro com seu sistema de ontologia para aprimorar os fluxos de trabalho de tomada de decisão baseados em IA em todos os setores.
- Obturador incorpora o Nova Canvas em seu AI Image Generator para oferecer uma solução intuitiva para criação de conteúdo visual de alta qualidade.
AWS lançou detalhes Cartões de serviço de IA para modelos Nova, proporcionando transparência sobre casos de uso, limitações e práticas responsáveis de IA: