Logo for Addvisor Group

Engenheiro de MLOps Sênior

Key Facts

Remote From: 
Full time
Portuguese

Other Skills

  • Troubleshooting (Problem Solving)
  • Communication
  • Teamwork
  • Detail Oriented
  • Problem Solving

Roles & Responsibilities

  • Experiência sólida em MLOps e operações de GenAI/soluções baseadas em agentes em produção.
  • Fortes habilidades em observabilidade (logs, métricas e tracing) e instrumentação de pipelines de IA.
  • Experiência em gerenciamento de incidentes, solução de problemas e análise de causa raiz (RCA) com escalonamento.
  • Inglês avançado (fluência em comunicação técnica) e capacidade de trabalhar com equipes de Engenharia e Ciência de Dados.

Requirements:

  • Executar e seguir os Procedimentos Operacionais Padrão (POPs) para GenAI e soluções baseadas em agentes em produção; monitorar a integridade da plataforma, o desempenho do modelo e os pipelines de inferência; assegurar a estabilidade e a disponibilidade dos serviços de IA em todos os ambientes.
  • Investigar e resolver incidentes analisando logs, rastreamentos e métricas; realizar análise de causa raiz (RCA) e documentar as descobertas; atuar dentro dos processos de escalonamento definidos.
  • Utilizar ferramentas de observabilidade (logs, métricas, tracing) para detectar anomalias e problemas de desempenho; apoiar a melhoria contínua do monitoramento, alertas e painéis de controle; garantir a instrumentação adequada das cargas de GenAI e MLOps.
  • Apoiar operações de tempo de execução de aplicativos baseados em LLM e fluxos de trabalho baseados em agentes; monitorar o desempenho da inferência (latência, taxa de transferência, custo) e garantir adesão às diretrizes de confiabilidade e melhores práticas operacionais.

Job description

Buscamos um(a) Engenheiro(a) de MLOps para dar suporte às operações e à manutenção de soluções GenAI e agentes em produção. O profissional será responsável por executar procedimentos operacionais padrão (POPs), monitorar a integridade do sistema e solucionar problemas usando ferramentas de observabilidade e logs para garantir a confiabilidade, o desempenho e a escalabilidade de aplicações baseadas em IA.

Principais Responsabilidades


Operações e Suporte
* Executar e seguir os Procedimentos Operacionais Padrão (POPs) estabelecidos para GenAI e soluções baseadas em agentes em produção
* Monitorar a integridade da plataforma, o desempenho do modelo e os pipelines de inferência
* Garantir a estabilidade e a disponibilidade dos serviços de IA em todos os ambientes
Gerenciamento de Incidentes e Solução de Problemas
* Investigar e resolver incidentes analisando logs, rastreamentos e métricas
* Realizar análise de causa raiz (ACR) e documentar as descobertas
* Agir dentro dos processos de escalonamento definidos quando necessário
Observabilidade e Monitoramento
* Utilizar ferramentas de observabilidade (logs, métricas, rastreamento) para detectar anomalias e problemas de desempenho
* Apoiar a melhoria contínua do monitoramento, alertas e painéis de controle
* Garantir a instrumentação adequada das cargas de trabalho de GenAI e ML
Operações de GenAI e Agentes
* Apoiar as operações de tempo de execução de aplicativos baseados em LLM e fluxos de trabalho baseados em agentes
* Monitorar o desempenho da inferência (latência, taxa de transferência, custo)
* Garantir a adesão às diretrizes, padrões de confiabilidade e melhores práticas operacionais Práticas de Melhoria Contínua
* Identificar oportunidades para automatizar tarefas operacionais e melhorar a eficiência
* Contribuir para a evolução de Procedimentos Operacionais Padrão (POPs), manuais de execução e estruturas operacionais
* Colaborar com as equipes de Engenharia e Ciência de Dados para melhorar a confiabilidade do sistema.

 

Modelo de Trabalho: Remoto

Inglês: Avançado 

Related jobs

Other jobs at Addvisor Group

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.