Comment devenir Professionnel de la Data ?
En bref
- Salaire : 40k à 110k € brut/an en France (2026)
- Niveau d'études : Bac+3 à Bac+5 (3 à 5 ans)
- Domaine : Tech & Intelligence Artificielle
- Conditions d'exercice : Bureau
- Code ROME : M1402
Le professionnel de la data — catégorie qui regroupe data analyst, data engineer, data scientist, analytics engineer, machine learning engineer et data product manager — exploite la donnée pour éclairer les décisions stratégiques et construire des produits intelligents. Il collecte, nettoie, modélise, visualise et exploite des volumes parfois colossaux de données (hundreds of TB à plusieurs PB) pour en extraire de la valeur : prévisions de ventes, segmentation client, détection de fraude, recommandations personnalisées, modèles prédictifs, moteurs d'intelligence artificielle. Selon son rôle précis, il intervient sur le pipeline de données (ingestion, stockage, transformation), l'analytique métier (dashboards, reporting, études ad hoc), la science des données (modèles statistiques, machine learning, deep learning) ou la mise en production (MLOps, monitoring modèles, feature stores). Les codes ROME associés couvrent M1402 — Conseil en organisation et management d'entreprise, M1805 — Études et développement informatique et M1811 — Data analysis.
En 2026, selon Numeum, l'OPIIEC, l'Apec et l'association Data Scientists France, la filière data emploie environ 85 000 professionnels en France (data analysts, data engineers, data scientists, ML engineers, analytics engineers confondus), avec plus de 18 000 postes ouverts par an selon France Travail et un taux de tension supérieur à 90 %. Le secteur pèse 14 Md€ en France (rapport Numeum 2025). Les recruteurs se répartissent entre cabinets de conseil (Quantmetry, Sia Partners Data, Ekimetrics, Artefact, OCTO Technology Data, Capgemini Invent, Accenture Data & AI), éditeurs spécialisés (Dataiku 1 200 collab., Snowflake France, Databricks France, Hugging Face, Mistral AI, LightOn, Criteo), scale-ups du Next40/FT120 (Doctolib, Back Market, ContentSquare, Alan, PayFit, Qonto), GAFAM France (Google Research Paris, Meta AI Paris, AWS AI/ML, Microsoft France), grands comptes (BNP Paribas, AXA, L'Oréal, Orange, SNCF, Total Energies, Carrefour, Decathlon, Auchan) et le secteur public (INSEE, Beta.gouv.fr Mission Etalab, CNIL, France Travail, CNAM).
Au quotidien, le professionnel de la data manipule des stacks modernes : SQL sur Snowflake, BigQuery, Redshift, Databricks ou Postgres, transformations dbt, orchestration Airflow ou Dagster, dashboards Looker, Tableau, Power BI ou Metabase, ML en Python (scikit-learn, PyTorch, TensorFlow, XGBoost, LightGBM), MLOps (MLflow, Weights & Biases, Kubeflow, Vertex AI, SageMaker). Il collabore étroitement avec les product managers, les ingénieurs logiciels, les équipes métier (finance, marketing, opérations, produit). Le télétravail est largement pratiqué (2-5 jours/semaine, full remote fréquent pour les profils confirmés). Les salaires démarrent à 40 000-48 000 € pour un data analyst junior et atteignent 95 000-130 000 € pour un staff data scientist confirmé, voire 150 000-280 000 € chez les GAFAM et scale-ups top-tier.
Salaire
40k - 110k € brut annuel
Niveau d'études : Bac+3 à Bac+5 · Durée : 3 à 5 ans
Missions principales
- Collecter, ingérer et intégrer des données multi-sources (APIs, bases SQL, événements Kafka, CRM, ERP, logs)
- Concevoir et maintenir des pipelines de données (ETL/ELT) avec Airflow, Dagster, dbt, Fivetran, Stitch
- Modéliser les données en data warehouse (Kimball, Data Vault) et data lakehouse (Databricks, Iceberg, Delta Lake)
- Construire des modèles analytiques avec dbt (Data Build Tool) et exposer les métriques via semantic layer (Cube, Lightdash)
- Créer dashboards et rapports avec Looker, Tableau, Power BI, Metabase, Superset pour les équipes métier
- Réaliser des études ad hoc : segmentation client, analyse de cohortes, A/B testing, attribution marketing
- Développer des modèles de machine learning (scikit-learn, XGBoost, LightGBM, PyTorch, TensorFlow, Hugging Face)
- Industrialiser les modèles ML : MLOps (MLflow, Weights & Biases, Kubeflow, SageMaker, Vertex AI, Databricks MLflow)
- Mettre en place le monitoring des modèles en production (drift detection, fairness, explainability via SHAP/LIME)
- Piloter la gouvernance des données : data catalog (Collibra, Atlan, Data.World), data lineage, data quality (Great Expectations, Soda)
- Garantir la conformité RGPD et AI Act européen (anonymisation, pseudonymisation, DPIA)
- Collaborer avec les équipes produit et métier pour traduire les besoins business en livrables data
- Animer la culture data dans l'organisation (formations, communautés, self-service analytics)
- Assurer la veille technologique (NeurIPS, ICML, PyData Paris, Data + AI Summit Databricks)
Compétences requises
- SQL avancé : PostgreSQL, MySQL, Snowflake, BigQuery, Redshift, Databricks SQL, ClickHouse, DuckDB
- Python : pandas, NumPy, scikit-learn, PyTorch, TensorFlow, XGBoost, LightGBM, Hugging Face Transformers
- ETL/ELT et orchestration : Airflow, Dagster, Prefect, dbt (Data Build Tool), Fivetran, Airbyte, Stitch
- Data warehousing : Snowflake, BigQuery, Redshift, Databricks Lakehouse, Delta Lake, Apache Iceberg
- Streaming et événementiel : Apache Kafka, Confluent, Flink, Apache Spark Structured Streaming
- BI et visualisation : Looker, Tableau, Power BI, Metabase, Apache Superset, Dataiku, Mode, Hex
- MLOps : MLflow, Weights & Biases, Kubeflow, Vertex AI, SageMaker, Databricks MLflow, BentoML, Seldon
- Cloud : AWS (S3, Redshift, SageMaker, Glue, EMR), GCP (BigQuery, Vertex AI, Dataflow), Azure (Synapse, Databricks)
- Deep learning et LLM : PyTorch, TensorFlow, Hugging Face, LangChain, LlamaIndex, RAG, fine-tuning, prompt engineering
- Modélisation statistique : régression linéaire, logistique, forêts aléatoires, boosting, séries temporelles ARIMA/Prophet
- A/B testing et expérimentation : tests statistiques, puissance, intervalles de confiance, outils GrowthBook, Statsig
- Gouvernance des données : data catalog (Collibra, Atlan), lineage (OpenLineage), data quality (Great Expectations, Soda)
- Conformité RGPD et AI Act européen (anonymisation, pseudonymisation, consentement)
- Communication et storytelling data (simplifier, vulgariser, convaincre les équipes non-tech)
- Anglais professionnel C1 (documentation, conférences internationales, publications NeurIPS/ICML)
Formations pour devenir Professionnel de la Data
- École d'ingénieurs spécialisée data — ENSAE Paris, ENSAI Rennes, Télécom Paris, Télécom SudParis, CentraleSupélec, Polytechnique, Mines ParisTech
- Master Data Science / Statistique / Machine Learning — MVA ENS Paris-Saclay, M2 Data Science Dauphine-PSL, Sorbonne Université, Paris-Saclay (MPRI), ENSAE
- Master MIASHS, Master Big Data, Master Intelligence Artificielle — Grenoble Alpes, Lyon 1, Lille, Bordeaux, Nantes
- Bachelor Data (Bac+3) — ESILV, EPITA, Epitech Digital, Ynov, HETIC, 42 Paris
- BUT STID (Statistique et Informatique Décisionnelle) — IUT Paris Rives de Seine, IUT Lumière Lyon 2
- Licence MIASHS (Mathématiques et Informatique Appliquées aux Sciences Humaines et Sociales)
- Mastère Spécialisé Big Data / Intelligence Artificielle — CentraleSupélec, Télécom Paris, EMLyon, HEC
- Doctorat CIFRE en data science / machine learning (financement entreprise + CNRS/Inria)
- Bootcamps reconversion : Le Wagon Data Science, Jedha Data Science, DataScientest, Ironhack Data Analytics
- Certifications pro : Google Cloud Professional Data Engineer, AWS Certified ML Specialty, Databricks Certified Associate Data Engineer, dbt Analytics Engineer
Grille salariale détaillée
- Data analyst / engineer / scientist junior (0-3 ans) : 40 000 – 55 000 € brut/an
- Data professional confirmé (3-7 ans) : 55 000 – 85 000 € brut/an
- Senior / staff / lead data (7-12 ans) : 80 000 – 120 000 € brut/an
- Principal / VP Data / CDO / GAFAM research (12+ ans) : 110 000 – 280 000 € brut/an
Avantages et inconvénients
Les plus
- Marché ultra-tendu (18 000 postes/an, 90 % de tension)
- Rémunérations parmi les plus élevées du numérique
- Télétravail largement accepté (2-5 jours/semaine, full remote possible)
- Diversité des rôles (analyste, engineer, scientist, ML engineer, analytics engineer)
- Secteur à très forte croissance (IA générative, LLM, agents)
- Impact direct sur les décisions business
- Passerelles riches (produit, conseil, entrepreneuriat, recherche, CDO)
Les moins
- Veille technologique chronophage (LLM, outillage renouvelé tous les 6 mois)
- Complexité des stacks data (multi-cloud, multi-outils)
- Enjeux éthiques (biais algorithmiques, IA Act, RGPD)
- Sédentarité et fatigue cognitive
- Pression des résultats (business attend ROI des modèles)
- Qualité de données souvent médiocre (40-60 % du temps en data cleaning)
- Risque de commodification (juniors remplaçables par LLM pour tâches simples)
Secteurs qui recrutent
- Cabinets de conseil data et IA — Quantmetry (Capgemini Invent), Sia Partners Data, Ekimetrics, Artefact, OCTO Technology Data, Accenture Data & AI, Onepoint
- Éditeurs data et IA français — Dataiku (1 200 collab., licorne française), Mistral AI, Hugging Face Paris, LightOn, Criteo, Contentsquare, Qonto
- Cloud et infrastructure data — Snowflake France, Databricks France, MongoDB France, Confluent Paris, Scaleway, OVHcloud
- Scale-ups du Next40/FT120 — Doctolib, Back Market, ManoMano, ContentSquare, Mirakl, PayFit, Alan, Qonto, Swile, Shift Technology, Dataiku, Aircall
- GAFAM Research France — Google Research Paris (Paris IA Hub), Meta AI Paris (FAIR Paris), AWS AI/ML, Microsoft France AI, Apple ML Paris, Nvidia
- Banque-assurance data-driven — BNP Paribas, Société Générale, Crédit Agricole, AXA, Allianz, BPCE, Crédit Mutuel Arkéa (équipes data > 2 000 personnes chez les majors)
- Retail et e-commerce — Decathlon, Carrefour, Auchan, Leclerc, Casino, Fnac Darty, Cdiscount, Veepee, La Redoute
- Industrie et énergie — Total Energies, EDF, Engie, Airbus, Thales, Safran, Stellantis, Renault Software Republic, Michelin, L'Oréal
- Secteur public et recherche — INSEE, Beta.gouv.fr Mission Etalab, CNIL, France Travail, CNAM, ANSES, ministères (DGFiP, Intérieur), Inria, CNRS
- Freelance data et indépendants via Malt, Comet, Free-Work, Talent.io (20-30 % des profils confirmés)
Évolution de carrière
Un data analyst junior débute à 40 000-48 000 € brut/an (jusqu'à 55 000-60 000 € chez les scale-ups parisiennes et GAFAM). Un data engineer junior : 45 000-55 000 €. Un data scientist junior (Bac+5 ou Bac+6) : 48 000-60 000 €. Après 3-5 ans, les fourchettes montent respectivement à 55 000-75 000 € (analyst), 65 000-85 000 € (engineer), 65 000-90 000 € (scientist). À 5-10 ans, les rôles senior (staff data engineer, senior data scientist, analytics engineering lead) atteignent 80 000-110 000 €. Au-delà, principal data scientist, head of data, data platform lead : 110 000-150 000 €. Les postes de VP Data, Chief Data Officer ou directeur de département dépassent 150 000-220 000 €. Chez les GAFAM (Google Research Paris, Meta AI Paris, AWS AI/ML) et scale-ups top-tier (Mistral AI, Hugging Face, Criteo), les grades L5-L7 atteignent 180 000-280 000 € total comp (fixe + RSUs/BSPCE + bonus). Les freelances data seniors facturent TJM 700-1 100 €/jour (160 000-250 000 €/an). Convention collective : Syntec-CINOV (IDCC 1486) pour les ESN/éditeurs, grille cadre position 2.2 à 3.2 selon expérience. Passerelles classiques : data product manager, CTO scale-up IA, fondateur startup deep tech, enseignant-chercheur, directeur IA en grand compte. Observatoires de référence : baromètre Numeum/Apec, rapport Free-Work, State of Data Stack Survey.
Questions fréquentes sur le métier de Professionnel de la Data
- Comment devenir professionnel de la data en 2026 ?
- Trois voies principales. 1) École d'ingénieurs spécialisée data Bac+5 : ENSAE Paris (référence), ENSAI Rennes, Télécom Paris, CentraleSupélec, Polytechnique, Mines ParisTech. 2) Masters universitaires d'excellence : MVA ENS Paris-Saclay, M2 Data Science Dauphine-PSL, ENSAE, Sorbonne Université, Paris-Saclay (MPRI), Grenoble Alpes. 3) Bachelors et BUT : BUT STID (Paris Rives de Seine, Lumière Lyon 2), Bachelor Data ESILV, EPITA, Epitech Digital, Ynov, HETIC, 42 Paris. Les Mastères Spécialisés Big Data/IA (CentraleSupélec, Télécom Paris, HEC, EMLyon) complètent utilement. Pour la reconversion, les bootcamps Le Wagon Data Science, Jedha, DataScientest (12-24 semaines, titres RNCP niveau 6) sont reconnus. Les certifications Google Cloud Professional Data Engineer, AWS ML Specialty, Databricks Associate et dbt Analytics Engineer sont des signaux forts.
- Quel est le salaire d'un data professionnel en 2026 ?
- Junior (0-3 ans) : data analyst 40 000-48 000 €, data engineer 45 000-55 000 €, data scientist 48 000-60 000 € brut/an (jusqu'à 60 000-70 000 € dans les scale-ups parisiennes et GAFAM). Confirmé (3-7 ans) : 55 000-85 000 €. Senior / staff / lead (7-12 ans) : 80 000-120 000 €. Principal data scientist, head of data, VP Data : 110 000-150 000 €. Chief Data Officer grand compte : 150 000-220 000 €. Chez les GAFAM (Google Research Paris, Meta AI Paris, AWS AI/ML) et scale-ups top-tier (Mistral AI, Hugging Face, Criteo, Dataiku), les grades L5-L7 atteignent 180 000-280 000 € total comp avec RSUs/BSPCE. Freelance senior TJM 700-1 100 €/jour. Convention Syntec-CINOV IDCC 1486.
- Quelles études pour devenir data analyst, data engineer ou data scientist ?
- Data analyst : Bac+3 à Bac+5 possible, BUT STID + Bachelor Data ou Master. Data engineer : Bac+5 école d'ingénieurs ou Master Informatique (Télécom Paris, CentraleSupélec, EPITA, Epitech, Mines, Sorbonne, Paris-Saclay). Data scientist : Bac+5 à Bac+6, Master Data Science / Statistique / ML (MVA ENS Paris-Saclay, M2 Data Science Dauphine, ENSAE, Paris-Saclay MPRI, Grenoble Alpes). Machine learning engineer : Bac+5 école d'ingénieurs ou doctorat CIFRE. Analytics engineer (rôle hybride data eng + analyst, en forte croissance) : Bac+3 à Bac+5. La recherche et les postes GAFAM exigent souvent un doctorat ou un publication track NeurIPS/ICML. Les bootcamps Le Wagon, Jedha, DataScientest ciblent la reconversion vers analyst et engineer.
- Quels secteurs recrutent en 2026 ?
- Tous. Les cabinets de conseil (Quantmetry, Sia Partners, Ekimetrics, Artefact, OCTO Data, Capgemini Invent, Accenture Data & AI) recrutent 3 000-5 000 consultants data/an. Les éditeurs français (Dataiku, Mistral AI, Hugging Face Paris, LightOn, Criteo) sont en hypercroissance. Les scale-ups Next40/FT120 (Doctolib, Back Market, ContentSquare, Alan, PayFit, Qonto) offrent les meilleurs packages avec BSPCE. Les GAFAM France (Google Research Paris, Meta AI Paris, AWS AI/ML) recrutent 200-500 profils/an. Banque-assurance (BNP, Société Générale, AXA, BPCE) a des équipes data >2 000 personnes. Retail (Decathlon, Carrefour, Auchan), industrie (Total Energies, Airbus, L'Oréal), secteur public (INSEE, Beta.gouv.fr, Mission Etalab, France Travail, CNAM, Inria, CNRS) recrutent activement. France Travail estime 18 000 postes ouverts/an, 90 % de tension.
- Le métier a-t-il de l'avenir avec l'IA générative ?
- Oui, avec une forte transformation. L'IA générative (Claude, GPT-4, Gemini, Mistral) démocratise l'accès à la donnée (text-to-SQL, agents data, dashboards auto-générés) et automatise une partie des tâches répétitives de cleaning et d'exploration. Les profils qui montent : ML engineer spécialisé LLM (fine-tuning, RAG, evaluation), analytics engineer (dbt + semantic layer + self-service), AI product manager, data platform lead, AI governance / ethics officer (avec AI Act européen entré en vigueur en 2026). Les data scientists classiques doivent pivoter vers LLM, vector databases (Pinecone, Weaviate, Qdrant, pgvector), orchestration d'agents (LangChain, LlamaIndex, CrewAI), MLOps avancé. Numeum anticipe une forte croissance jusqu'en 2030 (+40 % effectifs). Les profils juniors pur data analyst sont plus exposés à l'automatisation et doivent monter vite en compétences sur l'IA pour rester pertinents.
Métiers similaires
- Ingénieur Électronicien des Systèmes de la Sécurité Aérienne (IESSA) — 35k - 75k € · Bac+5 (formation ENAC après concours Bac)
- Ingénieur en Intelligence Artificielle — 55k - 90k € · Bac+5 et plus
- Ingénieur Logiciel — 30k - 45k € · Bac+5 et plus
- Ingénieur Système — 42k - 70k € · Bac+5 et plus
- Intégrateur Web — 30k - 48k € · Bac+3 à Bac+5
Références officielles
Approfondissez avec les sources publiques françaises de référence (France Travail, ONISEP).
- France Travail — Fiche ROME M1402 (candidat.francetravail.fr)
- ONISEP — Professionnel de la Data (www.onisep.fr)
Explorer tout le domaine Tech & Intelligence Artificielle
Découvrez les 61 métiers du domaine Tech & Intelligence Artificielle : salaires, formations, débouchés et perspectives d'évolution.