Logo for Ci&T

[JOB-29751] Senior Engenheiro(a) de Dados Sênior — IA Generativa, Dados e MDM, Brasil

Key Facts

Remote From: 
Full time
Senior (5-10 years)
Portuguese

Other Skills

  • Governance
  • Proactivity
  • Intellectual Curiosity
  • Problem Solving
  • Communication
  • Collaboration

Roles & Responsibilities

  • Solid experience as a Data Engineer or Senior Data Engineer
  • Strong knowledge in Python for data engineering and automation
  • Experience with Databricks, PySpark, and Spark
  • Experience with real-time data processing, preferably with Kafka

Requirements:

  • Develop, optimize, and maintain scalable data pipelines using Databricks, Spark, and PySpark
  • Act on the integration, transformation, treatment, and availability of large-scale customer data
  • Design and implement data solutions supporting intelligent systems based on Generative AI and multi-agents
  • Support the identification of patterns, inconsistencies, and improvement opportunities in customer data

Job description

Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,000 clientes durante nossos 30 anos de história. Inteligência Artificial é nossa realidade.

Importante: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.

Estamos em busca de uma pessoa para atuar como Engenheiro(a) de Dados Sênior em um projeto estratégico voltado à concepção, construção e evolução de soluções inteligentes baseadas em IA Generativa, agentes e multiagentes, aplicadas ao domínio de Cadastro de Clientes, com foco em integração, processamento, análise autônoma de dados, identificação de padrões, geração de recomendações e suporte à tomada de decisão.

O profissional será responsável por transformar dados cadastrais em inteligência acionável, utilizando engenharia de dados, Analytics avançado, Machine Learning, LLMs, Databricks, PySpark e soluções em ambientes cloud, apoiando a evolução do Golden Record, da qualidade de dados e da governança de MDM.

Além disso, atuará na construção e sustentação de pipelines escaláveis, processamento de dados em ambiente Big Data, produtização de modelos de Machine Learning e aplicação de boas práticas de desenvolvimento, versionamento e qualidade.

Essência do papel:

Não buscamos apenas um profissional para construir pipelines isolados.

Buscamos um Engenheiro de Dados Sênior capaz de estruturar, integrar, transformar e disponibilizar dados com inteligência, utilizando dados, IA e engenharia para apoiar recomendações, automações e ações sobre o Cadastro de Clientes, gerando valor mensurável para o negócio.

Principais tecnologias e competências envolvidas:

* IA Generativa e LLMs
* Arquiteturas de agentes e multiagentes
* RAG, agentes autônomos e workflows inteligentes
* Machine Learning aplicado
* Analytics avançado
* Python
* SQL
* Databricks com PySpark
* Spark
* Azure Databricks
* GCP e Gemini
* Processamento de dados em tempo quase real com Kafka
* MLOps e produtização de modelos no Databricks
* Esteiras de CI/CD com GitHub e GitHub Actions
* Qualidade de dados, governança e MDM
* Golden Record e dados cadastrais
* Experiência com metodologias ágeis

Principais responsabilidades:

* Desenvolver, otimizar e manter pipelines de dados escaláveis utilizando Databricks, Spark e PySpark.
* Atuar na integração, transformação, tratamento e disponibilização de dados cadastrais em larga escala.
* Construir e manter produtos de dados em ambiente Big Data na nuvem, assegurando escalabilidade, performance, confiabilidade e qualidade.
* Trabalhar com dados do domínio de Cadastro de Clientes, apoiando iniciativas relacionadas a Golden Record, qualidade de dados, governança e MDM.
* Projetar e implementar soluções de dados que apoiem sistemas inteligentes baseados em IA Generativa, agentes e multiagentes.
* Preparar, estruturar e disponibilizar dados para consumo por modelos de Machine Learning, LLMs, agentes autônomos e workflows inteligentes.
* Apoiar a construção de agentes e multiagentes capazes de analisar dados cadastrais em larga escala.
* Apoiar a identificação de padrões, inconsistências, gaps, duplicidades, anomalias e oportunidades de melhoria em dados cadastrais.
* Desenvolver mecanismos de dados para geração de alertas, recomendações explicáveis e suporte à tomada de decisão.
* Aplicar técnicas de Analytics e Machine Learning para detecção de anomalias, classificação, clusterização e scoring de dados cadastrais.
* Apoiar estratégias de qualificação, enriquecimento, priorização e governança de dados.
* Utilizar IA Generativa para apoiar a geração, evolução, validação e explicação de regras de negócio.
* Explorar e apoiar a implementação de arquiteturas como RAG, agentes autônomos, multiagentes e workflows inteligentes.
* Atuar com processamento de dados em tempo quase real utilizando Kafka.
* Apoiar a produtização de modelos de Machine Learning no Databricks, aplicando conceitos de MLOps.
* Criar, manter e evoluir esteiras de CI/CD utilizando GitHub e GitHub Actions.
* Garantir boas práticas de desenvolvimento, assegurando que as soluções sigam padrões de qualidade, eficiência, manutenibilidade e governança.
* Otimizar o uso dos dados disponíveis para maximizar seu valor para as áreas de negócio e tecnologia.
* Colaborar com equipes de MDM, Dados, Tecnologia e Negócio, garantindo que as soluções desenvolvidas sejam mensuráveis, governáveis e aplicáveis.
* Apoiar refinamentos técnicos e funcionais, garantindo clareza, viabilidade e aderência das histórias às necessidades do projeto.
* Apoiar a construção de histórias de usuário claras, bem definidas e tecnicamente viáveis.
* Participar do desenho AS-IS e TO-BE, documentando processos atuais e futuros, identificando débitos técnicos, riscos e oportunidades de melhoria.
* Desenvolver histórias refinadas e aprovadas, garantindo qualidade, eficiência e aderência aos padrões técnicos.
* Atuar na identificação de débitos técnicos e propor melhorias contínuas em arquitetura, processos, dados e soluções.
* Trabalhar em parceria com focais de dados e de negócio para garantir alinhamento entre soluções técnicas, melhores práticas e necessidades estratégicas.

Qualificações necessárias:

Conhecimentos técnicos:

* Experiência sólida como Engenheiro(a) de Dados, Engenheiro(a) de Dados Sênior ou papel equivalente.
* Forte conhecimento em Python para engenharia de dados, automação, análise de dados e apoio a soluções de IA.
* Sólido conhecimento em SQL e exploração de dados estruturados.
* Experiência com Databricks, PySpark e Spark.
* Experiência na construção, otimização e sustentação de pipelines de dados escaláveis.
* Experiência em ambientes cloud, preferencialmente Azure Databricks e GCP.
* Conhecimento ou experiência com Gemini para apoio a soluções GenAI.
* Conhecimento em IA Generativa, LLMs e aplicações inteligentes baseadas em dados.
* Conhecimento em arquiteturas de agentes, multiagentes e sistemas autônomos.
* Vivência com RAG, workflows inteligentes, recomendação baseada em dados e automação cognitiva.
* Experiência com técnicas de Machine Learning aplicado, incluindo anomalias, classificação, clustering e scoring.
* Experiência com processamento de dados em tempo quase real, preferencialmente com Kafka.
* Experiência com produtização de modelos de Machine Learning no Databricks e práticas de MLOps.
* Experiência com esteiras de CI/CD, especialmente GitHub e GitHub Actions.
* Domínio de boas práticas de engenharia de dados, versionamento, testes, revisão de código e qualidade de dados.
* Conhecimento em lógica de programação, desenvolvimento de aplicações e otimização de performance.
* Capacidade de transformar problemas de negócio em soluções de dados, analíticas e inteligentes.
* Experiência em squads ágeis e metodologias ágeis.

Diferenciais:

* Experiência com dados críticos, como clientes, identidade, cadastro ou KYC.
* Conhecimento em qualidade de dados, governança, MDM e Golden Record.
* Experiência prática com multiagentes, automação cognitiva ou sistemas baseados em decisões autônomas.
* Vivência em ambientes regulados.
* Conhecimento em estratégias de enriquecimento, deduplicação, matching e consolidação de dados cadastrais.
* Experiência com uso de IA no desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado.

Qualidades comportamentais:

* Proatividade e curiosidade analítica.
* Interesse por inovação, IA e novas tecnologias.
* Perfil hands-on, com autonomia para conduzir atividades técnicas complexas.
* Capacidade analítica para interpretar bases de dados, regras de negócio, padrões e anomalias.
* Habilidade de resolução de problemas, identificando causas, riscos, impactos e alternativas.
* Perfil consultivo, trazendo ideias, soluções e melhorias para o projeto sem aguardar apenas direcionamentos.
* Visão 360º, entendendo o projeto como um todo e avaliando impactos técnicos, operacionais e de negócio.
* Comunicação assertiva, com clareza, confiança e respeito.
* Boa capacidade de interação com áreas técnicas, de negócio, dados, MDM e governança.
* Foco em resultados, produtividade e melhoria contínua.
* Capacidade de colaboração com times técnicos e de negócio.

Nossos benefícios:

- Plano de saúde e odontológico;
- Vale alimentação e refeição;
- Auxílio-creche;
- Licença parental estendida;
- Parceria com academias e profissionais de saúde e bem-estar via Wellhub (Gympass)  TotalPass;
- Participação nos Lucros e Resultados (PLR);
- Seguro de Vida;
- Plataforma de aprendizagem contínua (CI&T University);
- Clube de descontos;
- Plataforma online gratuita dedicada à promoção da saúde física, mental e bem-estar;
- Curso gestante e parentalidade responsável;
- Parceria com plataformas de cursos online;
- Plataforma para aprendizagem de idiomas;
- E muitos outros

Mais detalhes sobre os nossos benefícios aqui: https://ciandt.com/br/pt-br/carreiras

Na CI&T, a inclusão começa no primeiro contato. Se você é pessoa com deficiência, é importante apresentar o seu laudo durante o processo seletivo. Consulte quais dados são necessários conter no laudo clicando aqui. Assim, podemos garantir o suporte e as adaptações que você merece. Se ainda não tem o laudo caracterizador, não se preocupe: podemos te apoiar para obtê-lo.

Temos um time dedicado de Saúde e Bem-estar, especialistas em inclusão e grupos de afinidade que estarão com você em todas as etapas. Conte com a gente para fazer essa jornada lado a lado.

Related jobs

Other jobs at Ci&T

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.