Data engineer F/H

Le/la data engineer est un développeur informatique qui a pour mission de mettre en place la collecte et la mise à disposition des données au sein de l’entreprise. Il/elle est également en charge d’industrialiser et mettre en production des traitements sur les données (par exemple : mise à disposition de tableaux de bord, intégration de modèles statistiques) en lien avec les équipes métiers et les équipes qui les analysent.

Autres intitulés

  • Ingénieur data/big data H-F
  • Développeur data H-F
  • Machine learning engineer H-F
  • Ingénieur en développement big data H-F

MOTS CLEFS

  • Développement informatique
  • Système d’information
  • Structuration de la donnée
  • Big data
icone user

Activités

Acheminement de la donnée

  • Recueillir les besoins métiers des différentes unités demandeuses et utilisatrices de solutions de collecte et stockage de la donnée.
  • Développer les solutions techniques de collecte de la donnée via des API.
  • Développer des solutions techniques de stockage de la donnée (Hadoop).
  • Réaliser les tests unitaires et d’intégration.
  • Mettre en place et maintenir les batchs, c’est-à-dire les automatisations d’une série de traitements.


Mise à disposition des données aux équipes utilisatrices

  • Industrialiser et automatiser le nettoyage de la donnée selon les spécifications retenues.
  • Gérer, maintenir et documenter de multiples bases de données (via l’importation de données externes en open data ou de données internes par exemple).
  • Gérer le cycle de vie de la donnée conformément aux directives inscrites dans le RGPD.
  • Assurer le suivi de production et la maintenance.


Mise en production de modèles statistiques dans les applications

  • Développer l’industrialisation de modèles statistiques ou de machine learning.
  • Implémentation du suivi de la validité du modèle statistique.
  • Assurer le suivi de production et la maintenance.


Suivi des projets de développement

  • Établir les spécifications techniques à partir de l’analyse des besoins.
  • Reporter l’activité auprès du chef de projet.

ACTIVITÉS ÉVENTUELLES

  • Automatiser la création de tableaux de bord aux équipes métiers (envoi de fichiers via des applications dédiées).
  • Assurer une veille technologique sur les outils big data.
  • Écrire la documentation relative aux bases de données (règles de gestion, dictionnaire des variables…).

VARIABILITÉ DES ACTIVITÉS

Les data engineers ont la possibilité de se spécialiser techniquement, même si cela ne représente pas la majorité des cas. Les champs de spécialisation touchent à l’intelligence artificielle (auquel cas les data engineers qui s’occupent d’industrialiser de tels modèles sont appelé(e)s machine learning engineers) ou bien dans les techniques de stream (temps réel). Pour ce qui concerne l’industrialisation de modèles de machine learning, ils/elles doivent notamment avoir des connaissances en statistiques et mathématiques.

Aussi, du fait de leurs compétences dans le champ de la manipulation des données mais aussi parfois des statistiques, les data engineers peuvent avoir à intervenir sur la partie traitement de données lorsque l’entreprise qui les recrute ne dispose pas de compétences en data science. De la même façon, ils/elles peuvent aussi avoir à cartographier et à documenter les données disponibles lorsque ce travail n’est pas pris en charge par une équipe de maîtrise d’ouvrage. C’est d’ailleurs très souvent le cas pour les entreprises de petite taille et/ou pour des entreprises moins matures dans la mise en place d’une organisation data centric.

Les entreprises n’embauchent pas toujours de data engineers en interne. Un certain nombre d’entre eux/elles sont recruté(e)s via des sociétés de services et ils/elles doivent, de fait, pouvoir s’adapter rapidement aux contextes de travail dans lesquels ils/elles interviennent pour remplir leurs missions. Dans ce cas-là, ils/elles peuvent aussi être en relation directe avec des commerciaux afin de calibrer en termes de coûts et délais de livraison, leurs interventions.

RATTACHEMENT HIÉRARCHIQUE

  • Chef de projet data
  • Responsable d’équipe data
  • Chef de projet informatique
  • Architecte big data

CONTEXTE ET FACTEURS D’ÉVOLUTION DU MÉTIER

Aujourd’hui, avec l’afflux massif de données, les entreprises se voient offrir des opportunités nouvelles, et ce, quel que soit leur secteur d’activité. Les données sont ainsi incontournables pour piloter la satisfaction client, les services après-vente, la gestion des fraudes. L’implémentation de plus en plus régulière de capteurs dans les outils de production permet également de prédire des pannes ou d’automatiser les processus industriels. Certaines entreprises s’orientent vers des organisations dites data centric, avec la constitution d’équipe et/ou mobilisation de compétences techniques dédiées et valorisent la dissémination de la culture des données.

Les data engineers sont confronté(e)s à de nombreuses évolutions technologiques, ce qui leur demande de constamment s’adapter, se former et d’être capables de travailler avec ces nouveaux outils.

icone user

Profil

Diplômes requis

  • Formation de niveau Bac +5
    • Master 2 en informatique, en data science, ou en statistiques
    • École d’ingénieurs en informatique, en data science, ou en statistiques
  • Formation de niveau Bac +2 en statistiques ou informatique avec une expérience en développement et manipulation de données


Durée d’expérience

Pour les diplômés Bac +2, une expérience professionnelle de quelques années est demandée. Les data engineers peuvent aussi bien être recrutés en tant que débutant ou confirmé : la majorité des entreprises valorisent cependant l’expérience, que ce soit en tant que data engineer ou en tant que développeur BI ou back-end.

icone user

Compétences requises

Compétences techniques

  • Maîtrise de l’environnement Hadoop/Hive/Spark (que ce soit en local ou dans le cloud)
  • Maîtrise des bases de données et gestion de bases de données (SQL/NoSQL)
  • Maîtrise de langages de programmation (C++, Scala, Java, Python…)
  • Maîtrise d’un outil de gestion de flux (Kafka, Flink…)
  • Maîtrise les méthodes de développement agile
  • Connaissance de la réglementation concernant les données personnelles et des principes de cybersécurité
  • Maîtrise des systèmes d’exploitation (Unix, Windows…)
  • Connaissance des solutions de manipulation des données ETL/LET


Aptitudes professionnelles

  • Esprit d’équipe
  • Sens du délai et des résultats
  • Organisation
  • Rigueur
  • Curiosité sectorielle et goût pour l’innovation
icone user

Rémunération

Rémunération annuelle brute (fixe + variable) proposée dans les offres d'emploi : 80 %  sont comprises entre 35 k€ et 60 k€  (moyenne 47 k€)