Logo for Leega

AI Engineer (Sênior) — Agentes, Plataforma & RAG

Key Facts

Remote From: 
Full time
Senior (5-10 years)
Portuguese

Other Skills

  • Teamwork
  • Problem Solving
  • Accountability

Roles & Responsibilities

  • Experience building generative AI applications in production (agents or RAG)
  • Python and API design (FastAPI/FastMCP)
  • Knowledge of LangGraph, LangChain frameworks, and structured function calling (Pydantic)
  • Experience with RAG and vector databases (Qdrant or similar)

Requirements:

  • Build AI agent platforms and govern generative AI distribution
  • Orchestrate agents using LangGraph with memory states
  • Maintain and evaluate quality verification systems
  • Operate and optimize LiteLLM gateway for cost and latency

Job description

JOB DESCRIPTION


A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes. 

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!  

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro. 

Cadastre-se agora mesmo em nossas vagas!


RESPONSIBILITIES AND ASSIGNMENTS


Sobre a oportunidade

Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. O princípio que rege tudo: a inteligência vem do modelo, mas a confiança vem da estrutura em volta dele — por isso o coração do sistema é uma camada semântica determinística (Cube.js) que impede o modelo de inventar números, somada a verificação e governança de ponta a ponta. 


Seus Desafios 

  • Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver). 
  • Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real. 
  • Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos. 
  • Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade. 
  • Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência. 
  • Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM. 
  • Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse). 


Você atua na fronteira entre IA e negócio, colaborando com as áreas de dados, engenharia e as operações que consomem os agentes. 


REQUIREMENTS AND QUALIFICATIONS


Stack & Ferramentas 

  • Agentes & estado: LangGraph, LangChain (Supervisor/ReAct), PostgresSaver
  • Modelos & gateway: LiteLLM (multi-provider, Bedrock), Hugging Face
  • Fine-tuning & serving: PEFT (LoRA/QLoRA), quantização, destilação, vLLM
  • RAG & busca: Qdrant, re-ranking; GraphRAG/Neo4j sob demanda 
  • Conhecimento & tools: Cube.js (semantic layer), MCP/FastMCP, n8n
  • Governança & eval: Presidio, Langfuse, LLM-as-judge, OpenTelemetry
  • Harness & dev: Claude Code (skills, subagentes, CLAUDE.md), Python/FastAPI 


O que Buscamos 

Essenciais 

  • Experiência construindo aplicações de IA generativa em produção (agentes ou RAG). • Python e design de APIs (FastAPI/FastMCP). 
  • Frameworks de agentes (LangGraph, LangChain) e function calling estruturado (Pydantic). 
  • RAG e vector databases (Qdrant ou similares). 
  • Gateways/roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).
  • Fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serving (vLLM). 
  • Autoria de skills e agentes para o Claude Code — central nesta posição.


Diferenciais 

  • Camadas semânticas (Cube.js) como fonte de recuperação determinística.
  • Fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM. 
  • Guardrails de PII (Presidio) e defesa contra prompt injection. 
  • Observabilidade e avaliação (Langfuse, LLM-as-judge, evals). 
  • GraphRAG / Neo4j como evolução híbrida sob demanda. 
  • Plataformas de automação (n8n) e integração com sistemas corporativos.

ADDITIONAL INFORMATION


  • Trabalho Remoto
  • Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Onde a inteligência humana amplifica o poder dos dados


Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.

Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.


Artificial Intelligence Engineer Related jobs

Other jobs at Leega

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.