Missions principales
Extraction et structuration des données
- Extraire les données nécessaires à l’analyse (Web scraping, API…).
- Définir des règles de gestion de nettoyage des bases de données (formatage, suppression des doublons…).
- Définir des règles de gestion de structuration des différentes bases de données entre elles.
- Écrire et rédiger les spécifications d’automatisation des règles de gestion à la DSI ou à la maîtrise d’ouvrage.
- Maîtriser la qualité des données tout au long de leur traitement.
- Déterminer ou construire les variables importantes à introduire dans les modèles statistiques.
Élaboration des algorithmes d’intelligence artificielle
- Analyser les données en utilisant des méthodes statistiques classiques.
- Créer et tester des algorithmes d’apprentissage automatique (machine learning, deep learning…).
- Construire les données d’entraînement des modèles.
- Réaliser une amélioration continue des modèles.
Industrialisation des modèles d’intelligence artificielle dans les applications
- Industrialiser les modèles d’apprentissage automatique et des modèles statistiques.
- Prendre part aux vérifications lors des mises en production (recette).
- Définir les règles de gestion pour la maintenance des modèles (monitoring).
Participation active aux projets
- Participer aux ateliers d’expression des besoins internes.
- Comprendre précisément les problématiques métiers et les traduire de manière analytique.
- Communiquer les résultats et les solutions avec les équipes métiers.
Veille technologique sur les outils de data science
- Effectuer une veille sur les nouvelles technologies et solutions logicielles de data science.
- Rechercher et expérimenter de nouvelles méthodes de modélisation et de data science.
Variabilité des missions
Le secteur d’activité de l’entreprise détermine fortement la finalité des activités des data scientists. Dans le secteur de la banque et de la finance, leur travail consiste à élaborer des modèles de détection de fraudes, dont les résultats sont directement exploités par les équipes opérationnelles. Dans le secteur du commerce ou du marketing, ils/elles jouent un rôle dans la construction des modèles de recommandation d’achat. Dans les secteurs automobile, médical ou militaire, des attentes fortes existent en matière de machine learning pour améliorer la reconnaissance d’image ou vocale.
Bien que la finalité des activités soit parfois différente, les techniques et méthodes du/de la data scientist sont similaires d’un secteur à l’autre. À noter qu’en tant que consultant(e), le/la data scientist peut aussi être amené(e) à travailler sur des sujets extrêmement variables. Une capacité d’adaptation et surtout de compréhension des problématiques est alors exigée. Il/elle doit ainsi avoir des connaissances très larges sur les méthodologies et les statistiques applicables et connaître les bonnes pratiques du métier.
Rattachement hiérarchique
- Directeur/directrice des systèmes d’information
- Directeur/directrice des études et de la recherche
- IT data director
- Chief technical officer
Contexte et facteurs d’évolution du métier
Aujourd’hui, avec l’afflux massif de données, les entreprises se voient offrir des opportunités nouvelles, et ce, quel que soit leur secteur d’activité. Les données sont ainsi incontournables pour piloter la satisfaction client, les services après-vente, la gestion des fraudes. L’implémentation de plus en plus régulière de capteurs dans les outils de production permet également de prédire des pannes ou d’automatiser les processus industriels. Certaines entreprises s’orientent vers des organisations dites data centric, avec la constitution d’équipe et/ou mobilisation de compétences techniques dédiées et valorisent la dissémination de la culture des données.
Les data scientists ont pour rôle de créer des algorithmes d’apprentissage automatique (appelés aussi des algorithmes d’intelligence artificielle) afin de produire des résultats qui seront réinjecter dans les systèmes opérationnels et qui permettent, à partir de modes de calcul automatisés/programmés, de prendre des décisions en temps réel. L’industrialisation de ces modèles est le point de mire des data scientists qui doivent également avoir des compétences dans le développement informatique. Cette double expertise en statistiques et en développement informatique rend ce profil rare pour les entreprises.
Les évolutions du métier sont technologiques, avec une mise à jour constante des logiciels et des méthodes statistiques à la pointe, et réglementaires, avec l’obligation de respecter de nouvelles lois comme le RGPD.