Este é um cargo remoto.
Oportunidade: Engenheiro de dados Sênior
Requisitos:
Perfil analítico com visão sistêmica (end-to-end) dos dados
• Senso de dono, autonomia e responsabilidade na execução
• Domínio de:
o Modelagem de Dados (relacional e dimensional)
o SQL (performance, tuning e otimização de queries)
• Experiência com ambientes em nuvem:
o Azure / Microsoft Fabric (Lakehouse, Warehouse, Modelo Semântico)
o AWS (Glue, Lambda, S3)
• Desenvolvimento de pipelines com:
o Python
o Manipulação de dados em JSON e formatos semi-estruturados
• Experiência com ingestão e organização de dados em Data Lake:
o Camadas: Landing Zone / Raw / Trusted
o Conhecimento em infraestrutura como código: Terraform
• Conhecimento em Power BI (modelagem semântica e performance)
Desejáveis:
• Experiência sólida com ODI para construção de processos de carga no Teradata:
o Camadas: Stage, Relacional, Dimensional e Views
• Experiência com Purview (governança, catálogo e lineage)
• Conhecimento em GCP (BigQuery, Dataflow ou similares)
• Experiência com arquiteturas modernas:
o Lakehouse (Delta, Parquet, Iceberg)
• Experiência com:
o Orquestração de pipelines (Airflow, Glue Workflows, Fabric Pipelines)
o Versionamento (Git)
o Práticas de DataOps / CI-CD
• Conhecimento em:
o Monitoramento e observabilidade de pipelines o FinOps (gestão de custos em cloud)
Responsabilidades principais:
• Realizar análises junto às áreas demandantes:
o Entender processos de negócio
o Mapear fluxo de dados ponta a ponta
• Participar da definição da solução técnica:
o Arquitetura de ingestão, transformação e consumo de dados
o Escolha das tecnologias mais adequadas
• Desenhar e evoluir modelos de dados:
o Estruturas dimensionais e analíticas
o Camadas de dados (DW e Data Lake)
• Desenvolver e manter pipelines de dados:
o ODI (Teradata)
o AWS (Glue, Lambda) o Fabric (pipelines modernos)
• Garantir: o Qualidade, confiabilidade e integridade dos dados
o Performance e otimização dos processos
o Governança e rastreabilidade (lineage)
• Atuar na integração entre ambientes: o On-premise (Teradata) e Cloud (AWS / Fabric / GCP)
• Apoiar times de BI e Analytics: Disponibilização de dados para consumo (Power BI, modelos semânticos)
• Contribuir com boas práticas e evolução da plataforma de dados:
o Padronização
o Melhoria contínua
o Suporte técnico a times menos experientes
Modelo de atuação: Remoto