Solid knowledge of data science, machine learning, and application development.
Practical experience in end-to-end retrieval-augmented generation (RAG) pipelines and production-grade coding in Python and JavaScript.
Experience with cloud platforms (Azure, AWS, GCP) and LLM orchestration tools (LangChain, LlamaIndex, OpenAI Agents SDK, Semantic Kernel SDK, Pydantic AI SDK).
Requirements:
Design, develop, and optimize end-to-end RAG pipelines (data ingestion, chunking, embedding generation, and retrieval) and orchestrate LLMs using frameworks like LangChain and LlamaIndex.
Build and manage vector database infrastructure (Pinecone, ChromaDB, FAISS, pgvector, Weaviate) and evaluate models on accuracy, latency, groundedness, and cost.
Apply prompt engineering to reduce model hallucinations and improve response quality; develop Agentic AI solutions with guardrails, from scratch or with existing frameworks.
Collaborate with Data Engineers and Full-Stack Developers to deliver complete AI-powered applications; monitor Generative AI market trends and advance responsible AI practices (bias detection, safe responses, PII handling).
Job description
Este é um cargo remoto.
Oportunidade: Engenheiro de IA - Pleno/Sênior Requisitos Obrigatórios: Forte domínio de Python e SQL. Conhecimento sólido em: Data Science Machine Learning Desenvolvimento de aplicações Experiência prática na construção de pipelines RAG end-to-end. Experiência com: LLMs Modelos de embeddings arquitetura Transformer Capacidade de desenvolver código de nível de produção em: Python JavaScript Experiência com plataformas de cloud: Microsoft Azure AWS Google Cloud Platform Experiência com ferramentas de orquestração de LLMs, como: LangChain LlamaIndex OpenAI Agents SDK Semantic Kernel SDK Pydantic AI SDK Conhecimento de técnicas de tokenização, como: BPE SentencePiece tiktoken Experiência em desenvolvimento de APIs e model serving, utilizando: FastAPI Flask Experiência com integração de dados corporativos utilizando Model Context Protocol (MCP). Requisitos Desejáveis: Experiência com CI/CD e práticas de DevOps. Experiência mais ampla em engenharia de software, além de IA. Experiência com modelos multimodais (visão + texto). Familiaridade com ferramentas de MLOps ou LLMOps, como: MLflow Langfuse Portfólio técnico comprovado: GitHub projetos pessoais contribuições open source. Atividades: Projetar, desenvolver e otimizar pipelines de RAG, incluindo: Ingestão de dados Chunking Geração de embeddings Recuperação de informação (retrieval) Integrar e orquestrar Large Language Models (LLMs) utilizando frameworks como: LangChain LlamaIndex Desenvolver e gerenciar infraestruturas de bancos de dados vetoriais, como: Pinecone ChromaDB FAISS pgvector Weaviate Construir frameworks de avaliação de modelos, considerando: precisão latência groundedness custo de execução Aplicar técnicas de Prompt Engineering para: reduzir alucinações de modelos melhorar a qualidade das respostas Desenvolver soluções de Agentic AI com mecanismos de controle (guardrails), seja do zero ou utilizando frameworks existentes. Colaborar com Data Engineers e Desenvolvedores Full Stack para entregar aplicações de IA completas. Acompanhar as evoluções do mercado de IA Generativa, propondo novas ferramentas, técnicas e boas práticas. Apoiar práticas de IA responsável, incluindo: detecção de vieses controle de respostas seguras tratamento de dados sensíveis (PII). Idioma: Inglês Avançado Modelo de atuação: Remoto Tempo de alocação: Indeterminado