Job description

JOB DESCRIPTION

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.

Cadastre-se agora mesmo em nossas vagas!

RESPONSIBILITIES AND ASSIGNMENTS

Sobre a oportunidade

Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. O princípio que rege tudo: a inteligência vem do modelo, mas a confiança vem da estrutura em volta dele — por isso o coração do sistema é uma camada semântica determinística (Cube.js) que impede o modelo de inventar números, somada a verificação e governança de ponta a ponta.

Seus Desafios

Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver).
Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real.
Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos.
Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade.
Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência.
Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM.
Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse).

Você atua na fronteira entre IA e negócio, colaborando com as áreas de dados, engenharia e as operações que consomem os agentes.

REQUIREMENTS AND QUALIFICATIONS

Stack & Ferramentas

Agentes & estado: LangGraph, LangChain (Supervisor/ReAct), PostgresSaver
Modelos & gateway: LiteLLM (multi-provider, Bedrock), Hugging Face
Fine-tuning & serving: PEFT (LoRA/QLoRA), quantização, destilação, vLLM
RAG & busca: Qdrant, re-ranking; GraphRAG/Neo4j sob demanda
Conhecimento & tools: Cube.js (semantic layer), MCP/FastMCP, n8n
Governança & eval: Presidio, Langfuse, LLM-as-judge, OpenTelemetry
Harness & dev: Claude Code (skills, subagentes, CLAUDE.md), Python/FastAPI

O que Buscamos

Essenciais

Experiência construindo aplicações de IA generativa em produção (agentes ou RAG). • Python e design de APIs (FastAPI/FastMCP).
Frameworks de agentes (LangGraph, LangChain) e function calling estruturado (Pydantic).
RAG e vector databases (Qdrant ou similares).
Gateways/roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).
Fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serving (vLLM).
Autoria de skills e agentes para o Claude Code — central nesta posição.

Diferenciais

Camadas semânticas (Cube.js) como fonte de recuperação determinística.
Fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM.
Guardrails de PII (Presidio) e defesa contra prompt injection.
Observabilidade e avaliação (Langfuse, LLM-as-judge, evals).
GraphRAG / Neo4j como evolução híbrida sob demanda.
Plataformas de automação (n8n) e integração com sistemas corporativos.

ADDITIONAL INFORMATION

Trabalho Remoto
Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Onde a inteligência humana amplifica o poder dos dados

Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.

Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.

AI Engineer (Sênior) — Agentes, Plataforma & RAG

Role overview

Qualifications

Responsibilities

Key facts

Hard skills

Other skills

About the company

Company details

Links

Your match analysis

Job description

JOB DESCRIPTION

RESPONSIBILITIES AND ASSIGNMENTS

REQUIREMENTS AND QUALIFICATIONS

ADDITIONAL INFORMATION

Onde a inteligência humana amplifica o poder dos dados

Apply once. Then go straight to the hiring manager.

Artificial Intelligence Engineer Related jobs

Principal AI Engineer

Senior AI Engineer

Senior Engineer, AI Systems

Applied AI Engineer

AI Engineering Lead

Other jobs at Leega

Engenheiro DataOps Sênior (AWS)

Product Owner Sênior - Foco em IA e Automação

Cientista de Dados Pleno (Foco em IA Generativa / GenAI)

Reach out to the hiring manager directly.