Key Facts

Remote From:

Full time

Portuguese

Hard Skills

Large Language Modeling Python (Programming Language) Embedding Prompt Engineering FastAPI Application Programming Interface (API) Flask (Web Framework) Production Code Application Development JavaScript (Programming Language) +22 more

Other Skills

•
Collaboration
•
Communication
•
Teamwork
•
Problem Solving

Roles & Responsibilities

Strong proficiency in Python and SQL.
Solid knowledge of data science, machine learning, and application development.
Practical experience in end-to-end retrieval-augmented generation (RAG) pipelines and production-grade coding in Python and JavaScript.
Experience with cloud platforms (Azure, AWS, GCP) and LLM orchestration tools (LangChain, LlamaIndex, OpenAI Agents SDK, Semantic Kernel SDK, Pydantic AI SDK).

Requirements:

Design, develop, and optimize end-to-end RAG pipelines (data ingestion, chunking, embedding generation, and retrieval) and orchestrate LLMs using frameworks like LangChain and LlamaIndex.
Build and manage vector database infrastructure (Pinecone, ChromaDB, FAISS, pgvector, Weaviate) and evaluate models on accuracy, latency, groundedness, and cost.
Apply prompt engineering to reduce model hallucinations and improve response quality; develop Agentic AI solutions with guardrails, from scratch or with existing frameworks.
Collaborate with Data Engineers and Full-Stack Developers to deliver complete AI-powered applications; monitor Generative AI market trends and advance responsible AI practices (bias detection, safe responses, PII handling).

Runtalent

About Runtalent

Há quase duas décadas, a Runtalent se consolidou como uma referência no mercado de tecnologia, proporcionando soluções inovadoras em TI para empresas B2B que buscam se manter competitivas na corrida pela transformação digital de seus negócios. Oferecemos uma variedade de serviços, como alocação de profissionais, squads ágeis e gestão de times e serviços. Além disso, dispomos de um banco de talentos com mais de 30 mil profissionais especializados em múltiplas áreas, aptos a atuar em projetos de TI por tempo determinado ou indeterminado, agregando soluções para diversos cenários de negócios. Para os nossos colaboradores, conhecidos como Runners, oferecemos suporte e investimento em qualificações técnicas e programas de realocação, para que possam desempenhar suas atividades da melhor forma possível. Venha fazer parte da Runtalent e transforme seu negócio com a ajuda de nossos serviços especializados em tecnologia.

Company type: SME

Founded: 2018

Company size: 501 - 1000

Website LinkedIn See all jobs →

Job description

Este é um cargo remoto.

Oportunidade: Engenheiro de IA - Pleno/Sênior
Requisitos Obrigatórios:
Forte domínio de Python e SQL.
Conhecimento sólido em: Data Science Machine Learning Desenvolvimento de aplicações
Experiência prática na construção de pipelines RAG end-to-end.
Experiência com: LLMs Modelos de embeddings arquitetura Transformer
Capacidade de desenvolver código de nível de produção em: Python JavaScript
Experiência com plataformas de cloud: Microsoft Azure AWS Google Cloud Platform
Experiência com ferramentas de orquestração de LLMs, como: LangChain LlamaIndex OpenAI Agents SDK Semantic Kernel SDK Pydantic AI SDK Conhecimento de técnicas de tokenização, como: BPE SentencePiece tiktoken
Experiência em desenvolvimento de APIs e model serving, utilizando: FastAPI Flask
Experiência com integração de dados corporativos utilizando Model Context Protocol (MCP).
Requisitos Desejáveis:
Experiência com CI/CD e práticas de DevOps.
Experiência mais ampla em engenharia de software, além de IA.
Experiência com modelos multimodais (visão + texto).
Familiaridade com ferramentas de MLOps ou LLMOps, como: MLflow Langfuse Portfólio técnico comprovado: GitHub projetos pessoais contribuições open source.
Atividades:
Projetar, desenvolver e otimizar pipelines de RAG, incluindo: Ingestão de dados Chunking Geração de embeddings
Recuperação de informação (retrieval)
Integrar e orquestrar Large Language Models (LLMs) utilizando frameworks como: LangChain LlamaIndex
Desenvolver e gerenciar infraestruturas de bancos de dados vetoriais, como: Pinecone ChromaDB FAISS pgvector Weaviate
Construir frameworks de avaliação de modelos, considerando: precisão latência groundedness custo de execução
Aplicar técnicas de Prompt Engineering para: reduzir alucinações de modelos melhorar a qualidade das respostas
Desenvolver soluções de Agentic AI com mecanismos de controle (guardrails), seja do zero ou utilizando frameworks existentes.
Colaborar com Data Engineers e Desenvolvedores Full Stack para entregar aplicações de IA completas.
Acompanhar as evoluções do mercado de IA Generativa, propondo novas ferramentas, técnicas e boas práticas.
Apoiar práticas de IA responsável, incluindo: detecção de vieses controle de respostas seguras tratamento de dados sensíveis (PII).
Idioma: Inglês Avançado
Modelo de atuação: Remoto
Tempo de alocação: Indeterminado

Ready to apply?

APPLY