Match score not available

Data Engineer H/F

Remote: 
Full Remote
Salary: 
115 - 192K yearly
Work from: 

Offer summary

Qualifications:

Master's in Big Data or Computer Engineering with strong data interest, Proficiency in SQL and NoSQL databases, as well as related concepts, Experience with collaborative development tools such as Git and Jupyter Notebooks, Familiarity with Big Data stack (Airflow, Spark, Hadoop), Preferred knowledge of AWS services (Lambda, EMR, S3).

Key responsabilities:

  • Optimizing Datalake maintenance and updating data flows
  • Developing data pipelines for analysis in collaboration with BI and Data Science teams
  • Leading end-to-end project management for clients: data collection, preprocessing, modeling, deployment
  • Suggesting new solutions, participating in technical qualifications, and enhancing data infrastructure
  • Creating and implementing reporting tools like Power BI, managing metadata, and documentation
SOCOTEC logo
SOCOTEC XLarge https://www.socotec.fr/
10001 Employees
See more SOCOTEC offers

Job description

Description de l'entreprise

Let's SOCOTEC your potential !

Leader dans son secteur, SOCOTEC est le seul groupe international 100% dédié, depuis 70  ans, à la gestion des risques et au conseil technique dans la construction, l’immobilier et  les infrastructures. Pour accompagner sa croissance, SOCOTEC recrute 1500 nouveaux collaborateurs en 2023.

Travailler chez SOCOTEC, c’est partager un métier au service d’une vision positive : inventer ensemble la ville de demain, plus sûre, durable et inclusive. Notre politique RSE faisant partie intégrante de notre stratégie d'entreprise, nous nous sommes fixés des objectifs concrets à horizon 2024 :

  • Faire partie des entreprises ayant obtenu la certification Great Place to Work.
  • 33% de notre chiffre d’affaires issu de missions contribuant à réduire l’impact environnemental de nos clients (GreenTrust).
  • La réduction de 15% de notre empreinte carbone.

Rejoignez notre communauté d’experts 

Description du poste

SOCOTEC Monitoring France, leader dans le domaine de l'inspection et de la certification, offre des services dans les secteurs de la construction, des infrastructures et de l'industrie.

Le Data & AI Hub SOCOTEC, composé de spécialistes en Data Engineering et Data Science, est chargé non seulement de la gestion et de l'optimisation des données, mais aussi de la mise en place de traitements et d'analyses de données. Nous développons des applications basées sur les données pour soutenir les activités métiers de SOCOTEC.

Nous recherchons un(e) alternant(e) Data Engineer pour intégrer notre équipe Data SOCOTEC.

En intégrant l'équipe, vous participerez activement à la maintenance et à l'optimisation de notre Datalake, ainsi qu'à la création et à la mise à jour des flux de données. Vous serez responsable de la documentation et de la validation de ces flux, ainsi que de la création et de la mise en place d'outils de reporting tels que Power BI. Vous proposerez également de nouvelles solutions, participerez aux qualifications techniques et contribuerez à l'amélioration continue de notre infrastructure data.

 

Vous travaillerez sur trois missions principales :

  • Au sein de l’entité Socotec Monitoring France (20%), vous participerez à la définition de la stratégie optimale de données pour Socotec Monitoring (structuration, processus, open data, achats de données externes)
  • Pour le compte du groupe Socotec (60%), vous participez à la construction du Data Lake à l’échelle monde. Votre objectif sera de développer les flux de donner pour leur analyse en lien avec les équipes BI et Data Science. Vous apprendrez à organiser et ordonnancer les flux d’extraction, de transformation et de chargement des données en garantissant leur fiabilité, leur disponibilité, etc.
  • Auprès des clients (20%), vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement.

Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de codes et documentations techniques.

Le stack technique utilisée :

  • Amazon Web Services (AWS)
  • Apache Airflow comme ordonnanceur
  • Spark pour les pipelines ETL
  • Gitlab pour versionner les sources
  • Kubernetes
  • DeltaLake
  • S3
  • Gérer les metadata avec OpenMetadata
  • Power BI, l’outil de BI, géré avec les équipes BI

Qualifications
  • Master en Big Data ou diplôme d'ingénieur en informatique avec une forte appétence pour la data
  • Maîtrise des bases de données SQL et NoSQL, ainsi que des concepts associés
  • Connaissance de la stack Big Data (Airflow, Spark, Hadoop)
  • Expérience avec les outils collaboratifs de développement (Git, GitLab, Jupyter Notebooks, etc.)
  • Connaissance appréciée des services AWS (Lambda, EMR, S3)
  • Intérêt marqué pour les technologies innovantes
  • Esprit d'équipe
  • Anglais courant, y compris un bon niveau technique

Informations complémentaires

En rejoignant notre équipe Data, vous aurez l'opportunité de travailler sur des projets innovants autour de notre Datalake, un élément central de notre stratégie data.

Cet poste vous permettra de faire partie de notre équipe de Data Engineers et de contribuer activement à nos initiatives data. Rejoignez-nous pour transformer les données en valeur ajoutée, développer des solutions pratiques et participer à des projets stimulants au sein d'une entreprise leader de son secteur.

  • Basé à Palaiseau (91)
  • Rémunération à définir selon profil
  • A pourvoir dès que possible
  • Permis B apprécié
  • Tickets restaurants et prise en charge à 75% de l’abonnement des transports

 

Required profile

Experience

Spoken language(s):
French
Check out the description to know which languages are mandatory.

Other Skills

  • Verbal Communication Skills
  • Analytical Thinking

Data Engineer Related jobs