📍 Modalidad: Remoto
💰 Tarifa: 30k – 35k
🧠 Experiencia: 2 – 3 años
🌍 Idioma: Inglés alto (imprescindible)
🚫 Guardias: No requeridas
Buscamos un/a Data Engineer especializado/a en Databricks y PySpark para incorporarse a un proyecto de analítica de datos en entorno cloud, trabajando con arquitecturas modernas basadas en Azure.
La persona seleccionada participará en el diseño, desarrollo y optimización de pipelines de datos, asegurando la calidad, eficiencia y escalabilidad de los procesos analíticos.
Desarrollo de pipelines de datos en Databricks utilizando PySpark para procesamiento de grandes volúmenes de información.
Implementación de soluciones de ingesta, transformación y almacenamiento de datos en Azure Data Lake Storage Gen2 (ADLS Gen2).
Creación y mantenimiento de notebooks en Databricks, orientados a procesos ETL/ELT.
Gestión y optimización de clusters de Databricks para ejecución eficiente de jobs distribuidos.
Orquestación de procesos de datos mediante Databricks Jobs.
Desarrollo de consultas avanzadas en SQL para análisis, validación y explotación de datos.
Implementación de procesos de CI/CD para despliegue de pipelines y notebooks.
Control de versiones y colaboración mediante Git.
Colaboración con equipos técnicos en entornos Agile.
Experiencia en Databricks (notebooks, clusters y jobs).
Sólidos conocimientos en PySpark (nivel avanzado / P5).
Experiencia en Azure Data Lake Storage Gen2 (ADLS Gen2).
Dominio de SQL para tratamiento de datos.
Experiencia con Git y procesos CI/CD.
Nivel de inglés alto (imprescindible).
Conocimientos en Python para procesamiento de datos.
Experiencia con nuevas funcionalidades de Databricks como:
Delta Live Tables (DLT)
Liquid Clustering
Optimización de Delta Lake
Experiencia en entornos cloud Azure y arquitectura de datos moderna.
Databricks · PySpark · SQL · ADLS Gen2 · Azure · Git · CI/CD · Python · Delta Lake

Sauce

Trepp, Inc.

HyrEzy Talent Solutions LLP

EVT

Idexx

Grupo TECDATA Engineering

Grupo TECDATA Engineering

Grupo TECDATA Engineering