Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

A atualização do Snorkel Flow oferece uma abordagem totalmente nova para gerenciamento de dados corporativos

byEmre Çıtak
25 Abril 2024
in Sem categoria
Share on FacebookShare on Twitter

Um dos desafios contínuos mais importantes para as empresas que desenvolvem IA é a integração de grandes quantidades de dados empresariais nos seus modelos de IA.

Esses dados são a força vital de muitas aplicações de IA, mas seu gerenciamento pode ser um processo complexo e demorado. Snorkel Flow, uma atualização recente da plataforma Snorkel AI, visa agilizar esse processo para empresas que buscam aproveitar Lhama 3um poderoso modelo de IA da Meta AI, e IA de Gêmeosoutro modelo avançado de IA do Google.

Por que o gerenciamento de dados corporativos é crucial?

Os dados empresariais abrangem uma ampla gama de informações coletadas pelas empresas durante suas operações diárias. Isso pode incluir dados de clientes, registros financeiros, resultados de campanhas de marketing, dados de sensores de máquinas e muito mais. O gerenciamento eficaz desses dados é crucial por vários motivos.

Primeiro, permite que as empresas identifiquem tendências e padrões que, de outra forma, poderiam passar despercebidos. Por exemplo, ao analisar o histórico de compras do cliente, uma empresa pode descobrir quais produtos são frequentemente comprados juntos, permitindo-lhes personalizar promoções e estratégias de colocação de produtos.

Em segundo lugar, os dados empresariais podem ser usados ​​para melhorar a tomada de decisões. Por exemplo, uma instituição financeira pode analisar dados históricos de empréstimos para desenvolver modelos de avaliação de risco mais precisos. Finalmente, os dados empresariais são essenciais para treinar modelos de IA. Esses modelos exigem grandes quantidades de dados rotulados para aprender e executar tarefas de maneira eficaz.

Gerenciamento de dados corporativos do Snorkel Flow
Os dados empresariais são cruciais para aplicações de IA, pois permitem a identificação de tendências, melhoram a tomada de decisões e fornecem dados rotulados para treinamento de modelos (Crédito da imagem)

No entanto, gerenciar esses dados pode ser um desafio significativo. Os dados empresariais geralmente residem em vários formatos e locais, dificultando o acesso e a integração. O processo de rotulagem de dados para treinamento em IA também pode ser caro e demorado.

Aqui é onde Fluxo de mergulho com snorkel entra.

Controlando o dilúvio de dados

Snorkel Flow é uma atualização da plataforma Snorkel AI projetada para simplificar a integração de dados corporativos com modelos de IA, especialmente Llama 3 e Gemini AI. O Snorkel usa uma técnica chamada rotulagem fraca, que permite aos usuários aproveitar dados não rotulados para fins de treinamento. Isto é conseguido através da definição de heurísticas, ou “funções de rotulagem” que podem atribuir rótulos automaticamente a pontos de dados com base em critérios específicos.

Por exemplo, imagine uma empresa que deseja treinar um modelo de IA para identificar tickets de suporte ao cliente que requerem atenção urgente. Uma função de rotulagem poderia ser criada para identificar tickets contendo palavras-chave ou frases específicas, como “urgente” ou “crítico”. Embora esses rótulos possam não ser perfeitos, eles ainda podem ser valiosos para treinar o modelo de IA.

O Snorkel Flow baseia-se neste conceito, introduzindo um fluxo de trabalho simplificado para gerenciar o processo de rotulagem de dados. Ele permite aos usuários definir funções de rotulagem, gerenciar fontes de dados e monitorar a qualidade dos rótulos gerados. Isto pode reduzir significativamente o tempo e os recursos necessários para preparar dados empresariais para treinamento em IA.

Gerenciamento de dados corporativos do Snorkel Flow
A nova atualização do Snorkel AI aborda desafios em dados corporativos usando técnicas de rotulagem fracas, permitindo que os usuários aproveitem dados não rotulados para treinamento, definindo funções de rotulagem com base em critérios específicos (Crédito da imagem)

Integrações expandidas de LLM e fontes de dados

Em um postagem no blog, Snorkel AI explicou em detalhes as inovações que trouxeram para o Snorkel Flow. Aqui estão as características do renovado Snorkel Flow:

  • Integrações LLM: Snorkel Flow agora oferece suporte ao ajuste fino não apenas de modelos estabelecidos, mas também da família Gemini do Google e do Llama 3 da Meta. Isso amplia as opções para as empresas escolherem o LLM mais adequado às suas necessidades.
  • Integrações de fontes de dados: Novas integrações com Databricks Unity Catalog, Vertex AI e Microsoft Azure Machine Learning simplificam o acesso aos dados para fins de rotulagem, curadoria e desenvolvimento. As empresas podem aproveitar sua infraestrutura de dados existente no Snorkel Flow.

Suporte de dados multimodais (Beta)

  • Processamento de imagem: Snorkel Flow introduz funções de rotulagem programática para imagens (atualmente em beta). Isso permite que as empresas aproveitem dados de imagem juntamente com dados de texto para treinamento LLM. As empresas podem usar esse recurso para extrair insights de dados visuais e integrá-los às suas soluções de IA.

Segurança e acessibilidade aprimoradas

  • Controle de acesso baseado em função (RBAC): este recurso concede aos administradores controle granular sobre o acesso aos dados no Snorkel Flow. Isso garante que informações confidenciais sejam protegidas, restringindo o acesso a usuários e fontes de dados específicos.
    Processamento de documentos aprimorado:
  • Fluxo de trabalho PDF baseado no Foundation Model (FM): Snorkel Flow agora inclui uma interface de usuário de solicitação de PDF dedicada para rotular PDFs. Isso aproveita modelos básicos avançados para agilizar o processo de extração de insights valiosos de documentos complexos.

Integração LLM simplificada:

  • SDK aprimorado: O SDK atualizado permite uma integração mais fácil com vários serviços LLM personalizados, proporcionando às empresas mais flexibilidade em seu processo de desenvolvimento de IA.
  • Integração de blocos de dados: A compatibilidade perfeita com o Catálogo Unity do Databricks permite a implantação sem esforço de modelos em fluxos de trabalho existentes. Integração semelhante está disponível com Vertex AI e Azure Machine Learning.

Anotação de dados simplificada

  • Anotação multitarefa (R2 Release Preview): esse recurso, atualmente em versão prévia, permite que PMEs (especialistas no assunto) anote dados para diversas tarefas em um único projeto. Isso melhora a eficiência, reduzindo o tempo de configuração do projeto e simplificando os fluxos de trabalho.
Gerenciamento de dados corporativos do Snorkel Flow
Snorkel AI agora se integra a modelos LLM poderosos, como Llama 3 da Meta AI e Gemini AI do Google (Crédito da imagem)

Integração com Llama 3 e Gemini AI

O Snorkel Flow integra-se especificamente com Llama 3 e Gemini AI, dois poderosos modelos de IA. Llama 3, desenvolvido pela Meta AI, é um modelo de linguagem factual, treinado em um enorme conjunto de dados de texto e código. Isso permite compreender e responder a consultas complexas de forma informativa. Já o Gemini AI é um modelo de linguagem generativa, capaz de criar diversos formatos de texto criativo, como poemas, códigos, roteiros, peças musicais, e-mail, cartas, etc.

Ao integrar o Snorkel Flow a esses modelos, as empresas podem aproveitar o poder da IA ​​para extrair insights de seus dados corporativos e automatizar diversas tarefas. Por exemplo, o Llama 3 pode ser usado para analisar avaliações de clientes e identificar temas ou reclamações comuns. Enquanto isso, a Gemini AI pode ser usada para gerar textos criativos de marketing ou descrições de produtos com base em dados existentes.

Ao simplificar o processo de rotulagem de dados e oferecer compatibilidade com modelos poderosos como Llama 3 e Gemini AI, o Snorkel Flow tem o potencial de desbloquear novas possibilidades para empresas que buscam aproveitar o poder da IA.


Crédito da imagem em destaque: rawpixel.com/Freepik

Related Posts

O artigo de pesquisa da Apple revela Matrix3D para geração de conteúdo 3D

O artigo de pesquisa da Apple revela Matrix3D para geração de conteúdo 3D

14 Maio 2025
Lightricks revela o modelo de vídeo LTX 13B para geração de vídeo HQ AI

Lightricks revela o modelo de vídeo LTX 13B para geração de vídeo HQ AI

14 Maio 2025
Seu próximo PS5 pode obter um novo preço de tarifa de tarifa

Seu próximo PS5 pode obter um novo preço de tarifa de tarifa

14 Maio 2025
Android recebe um novo visual radical com material três expressivos

Android recebe um novo visual radical com material três expressivos

14 Maio 2025
Xai sente falta de seu próprio prazo de segurança de IA, e agora

Xai sente falta de seu próprio prazo de segurança de IA, e agora

14 Maio 2025
Android Auto agora é alimentado pelo Google Gemini

Android Auto agora é alimentado pelo Google Gemini

14 Maio 2025

Recent Posts

  • O artigo de pesquisa da Apple revela Matrix3D para geração de conteúdo 3D
  • Lightricks revela o modelo de vídeo LTX 13B para geração de vídeo HQ AI
  • Seu próximo PS5 pode obter um novo preço de tarifa de tarifa
  • Android recebe um novo visual radical com material três expressivos
  • Xai sente falta de seu próprio prazo de segurança de IA, e agora

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.