You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Mehdi TajmouatiMT

Mehdi Tajmouati

Expert in Big Data & Cloud | Data Architect

€900/day
Paris, FR
8-15 years

Average response time: 1 hour

About Mehdi

Lead Data Engineer with nearly 10 years of experience in Data Management, including managing over 10 data engineers in the past 6 years. I have a strong foundation in data architecture, data warehousing, designing ETL pipelines, data analysis for business requirements, and applying machine learning to drive insights. I'm well-versed in the latest technologies, including the Big Data ecosystem, cloud computing, and advanced machine learning applications. Highly analytical, organized, and equipped with excellent interpersonal skills, I excel at translating complex data needs into actionable solutions.
  • French

    Native or bilingual

  • English

    Conversational

Can work on-site
Paris (up to 50km)

Experience

  • Societe Generale Corporate and Investment Banking - SGCIB
    Technical Leader Big Data
    BANKING AND INSURANCE
    March 2021 - Today (5 years and 3 months)
    Paris, France
    Lead Big Data Engineer au sein de la DSI CFT. J’ai encadré les data engineers au quotidien et piloté la conception d’une plateforme data industrialisée pour les domaines Finance/Conformité. Réalisations clés :
    • Mise en place d’un framework Scala/Spark standardisant les développements et améliorant la performance (tuning, gestion des partitions, Spark UI).
    • Migration Talend Big Data → Scala/Spark et Hortonworks → Cloudera CDP, avec chaîne CI/CD (tests, SonarQube, artefacts) et orchestration Control-M.
    • Conception de modules de pilotage (monitoring d’exécutions), de Data Quality et d’anonymisation.
    • Projets “PRORATA VAT” & “C3S TAX” : architecture data sur Azure (ADF, Databricks, Synapse), couches d’exposition (Trino/Synapse) et intégration Power BI.
    • Mise en œuvre des pratiques FinOps pour optimiser coûts cloud et gouvernance.

    Environnement : Spark/Scala & PySpark, Hadoop/HDFS, Kafka, Hive/Impala, Trino/Presto, Talend, Azure (ADF, Databricks, Synapse, DevOps), Control-M, Jenkins, SonarQube. Méthodo : Agile/SAFe, TDD/BDD, Databricks, Kubernetes.


    • Technologies Big Data: Hadoop, Spark, PySpark, Scala/Spark, Presto, Trino, Livy, Kafka, Flume, Sqoop, Airflow, YARN, Snowflake, Databricks.
    • NoSQL DB : Hive, Impala, hbase, MongoDB
    • Cloud :
    - Azure : Data Factory, Databricks , Event Hub, Functions, Synapse, ASA and ADLS, Devops
    - Google Cloud Platform; Bigquery, GCS Bucket, Dataflow, Dataproc, pubSub, Workflows, Cloud Run, Cloud build.
    - Amazon Web Services (AWS) : S3 Storage, Databricks and EMR
    • Cloudera : HDFS, YARN, Spark, Hive, Impala, HBase, Kafka, Sqoop, Flume, Livy, Cloudera Manager
    • ETL: Talend (BigData/ESB/DI), SSIS.
    • DBMS: Oracle, Microsoft SQL Server, postgresql, Mysql, SQLite
    • Reporting : PowerBI, Cognos, SSRS
    • IT automation: Devops, Terraform, Docker, Kubernetes.



    FinOps Spark Finance Scala
  • Bouygues Telecom
    Bigdata Tech Lead
    TELECOMMUNICATIONS
    March 2018 - February 2021 (2 years and 11 months)
    Paris, France
    Lead Data Engineer sur deux projets stratégiques : eSIM (activation dématérialisée des cartes SIM) et Asterix (accélération du déploiement FTTH).

    • Conception et mise en œuvre d’une infrastructure Data hautement scalable sur AWS pour supporter des volumes massifs (plusieurs milliards d’enregistrements).
    • Développement de pipelines de données temps réel et batch (Kinesis, S3, EMR, Athena, Redshift, Spark, Airflow) pour ingestion, transformation et exposition.
    • Implémentation de modèles prédictifs Python/ML pour anticiper les besoins clients et automatiser les suggestions de services via Kinesis Firehose et S3 Data Lake.
    • Conception et déploiement d’applications conteneurisées sous Docker & Kubernetes (ECS, OpenShift), automatisées avec AWS CodePipeline, Lambda (Boto3) et Terraform.
    • Industrialisation des traitements Snowflake : ingestion via Airflow, transformation avec dbt, et structuration analytique pour les équipes BI & Data Science.
    • Optimisation des performances de requêtes Snowflake (QUERY_HISTORY, partitionnement, clustering) réduisant les coûts de 30 %.
    • Élaboration de tests d’intégration et stratégie QA (automatisation, monitoring CloudWatch/CloudTrail).
    • Encadrement et mentoring de développeurs et data engineers, mise en place de bonnes pratiques de revue de code, CI/CD et DataOps.
    • Contribution au pilotage des indicateurs métier (churn, taux d’activation, SLA) pour fiabiliser les KPI stratégiques de la DSI.

    Environnement technique
    AWS (EMR, Redshift, S3, Kinesis, Lambda, ECS, CloudWatch), Snowflake, dbt, Airflow, Spark (Scala/PySpark), Python, Docker, Kubernetes, Terraform, Jenkins, GitHub, SQL.

    Compétences pertinentes
    AWS, Spark, Snowflake, dbt, Airflow, DataOps, CI/CD, Python, Machine Learning, Cloud Architecture, Big Data Engineering.
    Amazon Web Services DBT Spark Scala Snowflake
  • Veolia
    Project Manager
    ENERGY AND UTILITIES
    July 2017 - September 2018 (1 year and 2 months)
    Île-de-France, France
    Lead Data Engineer sur le projet « ESB – Portage », visant à valider et industrialiser les flux d’intégration de données dans le cadre de la nouvelle législation française sur l’aménagement du territoire.
    • Pilotage de la phase de validation fonctionnelle et technique du système d’intégration ESB, incluant les tests de composants, d’interfaces, d’intégration système et end-to-end.
    • Élaboration de la stratégie de test et des plans d’acceptance, définition des cas de tests, suivi des anomalies et mise en place d’actions correctives et préventives pour garantir la conformité aux standards qualité.
    • Conception et industrialisation d’une architecture Data sous Google Cloud Platform (GCP) pour la collecte, la transformation et la mise à disposition des données réglementaires.
    • Mise en œuvre d’une orchestration de pipelines de données via dbt + Airflow, assurant la modularité, la traçabilité et la reproductibilité des traitements.
    • Développement de modèles dbt (matérialisés, incrémentaux, snapshots) et macros réutilisables pour normaliser les transformations.
    • Conception de jobs PySpark sous GCP Dataproc pour le traitement batch de gros volumes, ingestion via GCS, Hive et REST APIs.
    • Implémentation de stratégies d’incrémentation et de partitionnement BigQuery optimisant les performances et réduisant le temps de rafraîchissement des données de 40 %.
    • Automatisation des tests de qualité et de cohérence des données via dbt et Apache Beam, validation entre zones “raw” et “processed”.
    • Sécurisation des expositions de données avec BigQuery Authorized Views et intégration à Power BI pour la restitution.
    • Supervision et monitoring des traitements via Stackdriver, industrialisation des déploiements avec Terraform + GitHub.

    Compétences pertinentes
    GCP, dbt, BigQuery, PySpark, Airflow, DataOps, Data Pipeline Architecture, Data Quality, Cloud Automation, Regulatory Data.
    Google Cloud Platform (GCP) BigQuery DataOps FinOps Apache Beam

Recommendations

Be the first to recommend Mehdi

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master of Business
    Université de Lorraine
    2014
    Master 2, Business Intelligence
  • Master 1, Génie logiciel
    Ecole Supérieure ingénierie en Science Appliquées
    2013
    Master 1, Génie logiciel

Certifications

Skill set (45)

Categories