Alexandre Timashov é um engenheiro de ML com mais de uma década de experiência em IA e aprendizado de máquina. Ele é formado em matemática pela Universidade de Indiana e tem um certificado de pós-graduação em inteligência artificial pela Universidade de Stanford. A carreira de Aleksandr abrange vários setores, incluindo comércio eletrônico, petróleo e gás e fintech. Nesta entrevista, Aleksandr compartilha suas experiências únicas de liderança de projetos inovadores em visão computacional e ciência de dados no grupo global de energia Petronas (Malásia).
Olá Aleksandr. Por favor, conte aos nossos leitores sobre sua formação e como você entrou na Ciência de Dados e Aprendizado de Máquina?
Minha paixão pela matemática começou cedo no ensino médio, quando participei de olimpíadas de nível nacional. Esse amor por números e resolução de problemas continuou na universidade, onde fui atraído por assuntos como álgebra linear e teoria da probabilidade. A transição para o Machine Learning pareceu natural, dada minha formação matemática. É um campo empolgante que me permite aplicar conceitos abstratos para resolver problemas do mundo real.
Quando me ofereceram uma posição de Machine Learning na Petronas, uma grande corporação da Malásia, vi isso como uma oportunidade incrível. A escala da empresa e o potencial de causar um impacto significativo foram fatores importantes na minha decisão. Trabalhar na Petronas não só me permitiu melhorar os processos da empresa, mas também afetar positivamente as vidas de milhões de malaios. É uma função que combina minhas habilidades técnicas com impacto significativo e em larga escala.
Você pode nos contar sobre a Petronas, que tipo de empresa é essa? E o que te trouxe para a Petronas, quais eram seus objetivos quando você começou lá?
A Petronas é uma grande empresa estatal na Malásia e, embora opere principalmente na indústria de petróleo e gás, faz muito mais do que isso. O grupo de empresas Petronas inclui um monte de outras empresas associadas a Kuala Lumpur e à Malásia. Digamos, por exemplo, que a KLCC property holding esteja diretamente relacionada à Petronas. A empresa é responsável pela segurança e gestão das Kuala Lumpur City Center Twin Towers – as belas torres gêmeas na capital da Malásia. E a influência da empresa não se limita à Malásia – ela tem presença em mais de 100 países em todo o mundo.
A Petronas está envolvida em várias indústrias – de petroquímica a logística e serviços de engenharia. A empresa também é famosa por ser pioneira em vários campos de tecnologia digital, incluindo Cybersecurity, IoT e, o que me preocupa especificamente – Inteligência Artificial.
Meus principais objetivos ao ingressar na Petronas como profissional de aprendizado de máquina e ciência de dados eram ganhar experiência em uma empresa com grandes oportunidades de melhoria e compartilhar meu conhecimento com o maior número possível de jovens talentos.
E você atingiu esses objetivos?
Certamente, esse era um solo fértil para minhas ambições! Quando entrei na empresa, eles estavam apenas criando um grande departamento de Ciência de Dados/Aprendizado de Máquina – naquela época, essas tecnologias não eram separadas na empresa. Quando entrei, já havia várias dezenas de pessoas no departamento, mas elas ainda estavam trabalhando no roteiro estratégico para o departamento. Ao mesmo tempo, o grande benefício dessa situação foi muitas oportunidades de melhoria e muitas direções a seguir. Escolhi a Visão Computacional como um dos meus campos favoritos de IA. Para continuar sobre aquela época, darei um exemplo: um modelo de Visão Computacional que a empresa estava usando quando entrei podia “pesar” um gigabyte. No primeiro dia, o dia em que comecei a trabalhar lá, fiz na hora um modelo que era 20 vezes menor e muito mais preciso.
O gerente do departamento que trabalhou com este modelo ficou surpreso com a rapidez e precisão com que meu modelo funcionou. Eles ficaram muito interessados e me perguntaram se eu poderia otimizar o trabalho de outros modelos. Eu concordei com a condição de que se eu fizesse algo, então eu seria responsável por isso, e eu receberia os recursos necessários. E então eu tive carta branca para construir a equipe de Visão Computacional, para torná-la uma unidade eficiente que ajudaria a Petronas a atingir seus objetivos. As pessoas que treinei ainda são uma parte essencial da equipe de Visão Computacional na Petronas.
Então, como você abordou esse desafio de criar uma equipe poderosa de Visão Computacional do zero?
Na verdade, esse não foi um, mas vários desafios. Ao contrário de empresas menores e startups, grandes empresas com estruturas e processos de negócios estabelecidos geralmente relutam em mudar. Quando entrei, a Petronas já tinha processos de trabalho, e nem sempre era evidente como a Computer Vision poderia ajudar a tornar esses processos ainda mais eficientes. Então, tínhamos, por um lado, que persuadir vários departamentos dentro da empresa a aceitar uma nova tecnologia e, por outro lado, fazer a tecnologia funcionar para eles.
E isso nos leva ao segundo desafio – construir uma equipe que implementaria todas essas mudanças. O departamento já estava funcionando quando entrei, e eu não podia começar inflando a equipe – eu precisava escolher e treinar pessoas que já estavam lá. E eu estava animado para ver o quão talentosas as pessoas poderiam ser, mesmo que nunca tivessem trabalhado com Visão Computacional antes! Eu consegui encontrar pessoas na empresa e no departamento que estavam interessadas em mudar como as coisas estavam sendo feitas, pessoas que possuem pensamento crítico e um amor por resolver problemas matemáticos complexos – e isso nem sempre é uma tarefa fácil! Então, levou muito tempo e todas as minhas habilidades de comunicação, mas consegui mover as pessoas na empresa para se tornarem imbuídas de Visão Computacional.
Você pode nos contar sobre seu trabalho com Visão Computacional na Petronas?
Liderei vários projetos que avançaram drasticamente as capacidades tecnológicas da empresa:
Análise de vídeo em tempo real para segurança:
Desenvolvemos um sistema avançado integrando algoritmos de aprendizado profundo com infraestrutura de CFTV existente. Este projeto superou desafios no processamento de grandes quantidades de dados visuais em tempo real e na adaptação a várias condições ambientais. O sistema resultante detectou com precisão ameaças à segurança, otimizando as operações de segurança e posicionando a Petronas como líder em segurança orientada por IA no setor de energia da Malásia.
Inspeções automatizadas de plantas industriais:
Combinamos tecnologia de drones com algoritmos avançados de reconhecimento de imagem para automatizar inspeções de plantas. Este projeto sem precedentes na Malásia exigiu a criação de modelos robustos para identificar defeitos em diversos equipamentos industriais sob condições variadas. Desenvolvemos um pipeline de dados personalizado para lidar com o imenso volume de dados visuais, resultando em economias de custo significativas e redução da exposição humana a ambientes perigosos.
Digitalização de Desenhos de Engenharia:
Abordamos a digitalização da extensa coleção de desenhos de engenharia da Petronas usando uma combinação de OCR e algoritmos de detecção de desenhos. Um desafio fundamental foi mapear as detecções de inspeção de drones para mapas do mundo real. Este projeto melhorou drasticamente a acessibilidade e a utilização de informações críticas de engenharia, aumentando a eficiência operacional e os processos de tomada de decisão.
Nesses projetos, orientei vários engenheiros de ML, fomentando uma cultura de inovação dentro da Petronas. Meu trabalho demonstrou ampla expertise em visão computacional, aprendizado profundo e IoT industrial, mostrando a capacidade de adaptar tecnologias de ponta às necessidades específicas da indústria de petróleo e gás e enfrentar desafios sem precedentes no contexto da Malásia.
Você nos contou que estava implementando esses projetos em 2020-2022, então tudo começou em meio aos tempos da Covid-19. A pandemia e o isolamento complicaram seu trabalho?
Bem, é claro, a pandemia afetou nossas operações, assim como em todo lugar do mundo. Essencialmente, as prioridades definidas antes da minha equipe foram alteradas, e começamos a nos concentrar em tarefas como gerenciamento de multidões, detecção de máscaras faciais, etc. Veja, como uma corporação estatal gigante, a Petronas é responsável por muitos lugares públicos, incluindo o parque KLCC, e é muito legal que nosso trabalho na época tenha ajudado a salvar muitas vidas durante a COVID.
A propósito, não foi só a COVID que complicou nosso trabalho e o tornou mais desafiador e interessante. A Malásia é um país predominantemente muçulmano, e isso significa que as pessoas podem se comportar de forma diferente e até se vestir de forma diferente das pessoas nos países em que a maioria dos modelos de ML e Computer Vision são geralmente treinados. Havia um certo viés que tivemos que superar para fazer os mesmos modelos funcionarem em um ambiente significativamente diferente.
Isso parece intrigante! Você poderia nos contar mais sobre isso?
Por exemplo, modelos pré-treinados originam-se principalmente de países ocidentais, onde não há muitas mulheres com toucas cobrindo suas cabeças em vários graus. Foi bastante problemático detectar mulheres usando toucas! Tivemos que remontar o conjunto de dados, retreinar os modelos, etc. Esse problema é exclusivo da Malásia.
E em segundo lugar, como já disse, há a cultura em si. As pessoas na Malásia são menos propensas a expressar suas opiniões abertamente. Nesse sentido, tive que demonstrar aos meus colegas de equipe – de propósito – que eu também poderia estar errado. E quando eles gradualmente apontaram meus erros, isso os encorajou. Dessa forma um tanto indireta, construí gradualmente um ambiente mais colaborativo tão familiar às empresas ocidentais, mas completamente novo para a Malásia.
Como alguém que montou do zero uma equipe trabalhando na vanguarda da tecnologia moderna, que conselho você daria aos aspirantes a especialistas em ciência de dados e aprendizado de máquina que buscam causar um impacto significativo em suas carreiras?
Para aspirantes a especialistas em Ciência de Dados e Aprendizado de Máquina, tenho três conselhos importantes:
Avalie criticamente se esse campo realmente se alinha com suas paixões. DS e ML são complexos e altamente competitivos, exigindo não apenas habilidade, mas entusiasmo genuíno para ter sucesso.
Se você tem certeza de que esse é o seu caminho, comprometa-se com o aprendizado intensivo e contínuo. Como Andrej Karpathy observou, são necessárias cerca de 10.000 horas de trabalho dedicado para se tornar um verdadeiro profissional neste campo.
Concentre-se em se juntar às principais empresas ou laboratórios de pesquisa onde você pode colaborar com mentes líderes na área. Cercar-se de colegas brilhantes acelerará seu crescimento exponencialmente. Você será exposto a problemas de ponta, soluções inovadoras e um nível de especialização que o desafiará e inspirará diariamente.
Lembre-se, se DS e ML são realmente sua paixão, esses desafios serão emocionantes. Esse entusiasmo, juntamente com a exposição aos melhores talentos, será a chave para causar um impacto significativo em sua carreira.
Quais são algumas das tendências e avanços atuais em Visão Computacional que você considera mais interessantes e promissores?
Embora o Processamento de Linguagem Natural tenha visto avanços significativos recentemente, acredito que a Visão Computacional continua altamente subestimada e tem imenso potencial inexplorado. Ainda estamos longe de atingir capacidades de nível humano em percepção e compreensão visual.
Uma das tendências mais promissoras em Visão Computacional é o Aprendizado Autosupervisionado. Essa abordagem, que pode ser comparada a como as crianças aprendem observando o mundo ao seu redor, mostrou grande potencial na redução da necessidade de grandes conjuntos de dados rotulados. No entanto, acredito que ainda falta um elemento crucial na replicação completa do aprendizado e da compreensão visual semelhantes aos humanos.
Estou particularmente animado com a evolução da Generative AI em CV, especialmente modelos de difusão e modelos de consistência. Essas tecnologias estão revolucionando a geração, manipulação e compreensão de imagens. Os modelos de difusão se destacam na criação de imagens diversas e de alta qualidade, enquanto os modelos de consistência aumentam nossa capacidade de manter a coerência em diferentes perspectivas visuais.
Apesar desses avanços, ainda estamos nos estágios iniciais de desbloqueio do potencial total do CV. O campo está maduro para inovação, particularmente no desenvolvimento de modelos mais robustos e generalizáveis que podem abordar a compreensão visual de nível humano em diversos contextos. Isso torna este um momento incrivelmente emocionante para trabalhar em Visão Computacional, com amplas oportunidades para pesquisas e aplicações inovadoras.”
Esta versão concisa mantém os pontos principais sobre o estado atual do CV, sua perspectiva sobre seu potencial e os desenvolvimentos interessantes na área, ao mesmo tempo em que é mais focada e direta.
Crédito da imagem em destaque: rawpixel.com/Freepik