Data scientist F/H

Le/la data scientist développe des algorithmes d’apprentissage automatique selon les besoins des équipes métiers. Ses compétences en statistiques lui permettent de construire des modèles de machine learning et ses connaissances en informatique l’aident à anticiper leur mise en production. En amont de ces deux missions, il/elle est également en charge de structurer et d’analyser les données qu’il/elle utilise.

Autres intitulés

  • Ingénieur data scientist H-F

MOTS CLEFS

  • Bases de données
  • Machine learning
  • Intelligence artificielle
  • Modèles statistiques
icone user

Activités

Extraction et structuration des données

  • Extraire les données nécessaires à l’analyse (Web scraping, API…).
  • Définir des règles de gestion de nettoyage des bases de données (formatage, suppression des doublons…).
  • Définir des règles de gestion de structuration des différentes bases de données entre elles.
  • Écrire et rédiger les spécifications d’automatisation des règles de gestion à la DSI ou à la maîtrise d’ouvrage.
  • Maîtriser la qualité des données tout au long de leur traitement.
  • Déterminer ou construire les variables importantes à introduire dans les modèles statistiques.


Élaboration des algorithmes d’intelligence artificielle

  • Analyser les données en utilisant des méthodes statistiques classiques.
  • Créer et tester des algorithmes d’apprentissage automatique (machine learning, deep learning…).
  • Construire les données d’entraînement des modèles.
  • Réaliser une amélioration continue des modèles.


Industrialisation des modèles d’intelligence artificielle dans les applications

  • Industrialiser les modèles d’apprentissage automatique et des modèles statistiques.
  • Prendre part aux vérifications lors des mises en production (recette).
  • Définir les règles de gestion pour la maintenance des modèles (monitoring).


Participation active aux projets

  • Participer aux ateliers d’expression des besoins internes.
  • Comprendre précisément les problématiques métiers et les traduire de manière analytique.
  • Communiquer les résultats et les solutions avec les équipes métiers.


Veille technologique sur les outils de data science

  • Effectuer une veille sur les nouvelles technologies et solutions logicielles de data science.
  • Rechercher et expérimenter de nouvelles méthodes de modélisation et de data science.

VARIABILITÉ DES ACTIVITÉS

Le secteur d’activité de l’entreprise détermine fortement la finalité des activités des data scientists. Dans le secteur de la banque et de la finance, leur travail consiste à élaborer des modèles de détection de fraudes, dont les résultats sont directement exploités par les équipes opérationnelles. Dans le secteur du commerce ou du marketing, ils/elles jouent un rôle dans la construction des modèles de recommandation d’achat. Dans les secteurs automobile, médical ou militaire, des attentes fortes existent en matière de machine learning pour améliorer la reconnaissance d’image ou vocale.

Bien que la finalité des activités soit parfois différente, les techniques et méthodes du/de la data scientist sont similaires d’un secteur à l’autre. À noter qu’en tant que consultant(e), le/la data scientist peut aussi être amené(e) à travailler sur des sujets extrêmement variables. Une capacité d’adaptation et surtout de compréhension des problématiques est alors exigée. Il/elle doit ainsi avoir des connaissances très larges sur les méthodologies et les statistiques applicables et connaître les bonnes pratiques du métier.

RATTACHEMENT HIÉRARCHIQUE

  • Directeur/directrice des systèmes d’information
  • Directeur/directrice des études et de la recherche
  • IT data director
  • Chief technical officer

CONTEXTE ET FACTEURS D’ÉVOLUTION DU MÉTIER

Aujourd’hui, avec l’afflux massif de données, les entreprises se voient offrir des opportunités nouvelles, et ce, quel que soit leur secteur d’activité. Les données sont ainsi incontournables pour piloter la satisfaction client, les services après-vente, la gestion des fraudes. L’implémentation de plus en plus régulière de capteurs dans les outils de production permet également de prédire des pannes ou d’automatiser les processus industriels. Certaines entreprises s’orientent vers des organisations dites data centric, avec la constitution d’équipe et/ou mobilisation de compétences techniques dédiées et valorisent la dissémination de la culture des données.

Les data scientists ont pour rôle de créer des algorithmes d’apprentissage automatique (appelés aussi des algorithmes d’intelligence artificielle) afin de produire des résultats qui seront réinjecter dans les systèmes opérationnels et qui permettent, à partir de modes de calcul automatisés/programmés, de prendre des décisions en temps réel. L’industrialisation de ces modèles est le point de mire des data scientists qui doivent également avoir des compétences dans le développement informatique. Cette double expertise en statistiques et en développement informatique rend ce profil rare pour les entreprises.

Les évolutions du métier sont technologiques, avec une mise à jour constante des logiciels et des méthodes statistiques à la pointe, et réglementaires, avec l’obligation de respecter de nouvelles lois comme le RGPD.

icone user

Profil

Diplômes requis

  • Formation de niveau Bac +5
    • Diplôme d’école d’ingénieurs avec des spécialisations en statistiques ou informatiques
    • Master en data science ou en statistiques/économétrie avec des spécialisations en informatique
    • Master en big data
  • Formation de niveau Bac +8
    • Doctorat en informatique, en mathématiques, en statistiques ou en modélisation des données


Durée d’expérience

Bien que des postes soient accessibles à des débutants, les profils d’au moins trois années d’expérience peuvent être privilégiés afin d’embaucher un profil complet (maîtrise des statistiques et de l’informatique).

icone user

Compétences requises

Compétences techniques

  • Expertise en algorithme et méthodes de machine learning et de deep learning
  • Maîtrise des différentes architectures de réseaux neuronaux et les environnements/librairies de développement associés (TensorFlow, PyTorch, Caffe, Keras, Onnx…)
  • Maîtrise des différents systèmes d’exploitation (Unix, Windows…)
  • Maîtrise de l’environnement Hadoop/Spark
  • Maîtrise en bases de données et gestion de bases de données (SQL/NoSQL)
  • Maîtrise de langages de programmation (C++, Java, Python, R…)


Aptitudes professionnelles

  • Rigueur
  • Sens de l’écoute et de la communication
  • Esprit de synthèse et d’analyse
  • Pédagogie
  • Curiosité sectorielle et goût pour l’innovation
icone user

Rémunération

Rémunération annuelle brute (fixe + variable) proposée dans les offres d'emploi : 80 % sont comprises entre 35 k€ et 60 k€  (moyenne 46 k€)