Data Engineer Senior

il y a 6 jours


Casablanca, Casablanca-Settat, Maroc Collective Temps plein

Data Engineer Senior - NLP / données non structurées (freelance ; 6 mois minimum)


Nous recrutons un(e) Data Engineer senior pour un projet à forte portée : digitaliser le droit au Maroc et en Afrique et créer la première base de connaissance juridique interrogeable par l'IA.

Notre ambition est de construire une plateforme capable de répondre à des questions juridiques de façon fiable, sourcée et traçable, en s'appuyant sur un corpus massif de documents juridiques hétérogènes.

Pourquoi ce projet est différent

Vous rejoignez une mission "infrastructure de connaissance" :

  • contribuer à rendre le droit plus accessible 

  • bâtir un actif durable : une base structurée du droit marocain (français), extensible à l'Afrique

  • travailler sur un défi technique concret et profond : transformer du non-structuré en une donnée exploitable, fiable et maintenable à grande échelle

Votre mission

Vous serez responsable de la chaîne "documents → données structurées" qui alimentera notre moteur IA (RAG).

Au cœur du poste (intérêt technique)

Constituer une base de données structurée du droit marocain en français à partir de données très hétérogènes :

  • PDF (texte et scannés), Word, images, fichiers texte, parfois bruités ou incomplets

  • extraction de texte (parsing + OCR si nécessaire), nettoyage 

  • structuration : détection titres/chapitres/sections/articles, hiérarchie, normalisation

  • chunking intelligent (par structure juridique plutôt que par taille arbitraire), avec traçabilité (source, page, identifiants)

  • métadonnées : date, type de texte (loi/décret/circulaire/jurisprudence…), source, version, numéros d'articles, etc.

  • déduplication & versioning : documents redondants, amendements, versions consolidées

  • industrialisation : orchestration, logs, retries, idempotence, monitoring, tests qualité

Profil recherché
  • 3+ ans d'expérience en Data Engineering et/ou Document AI / NLP appliqué

  • Très bonne maîtrise de Python

  • Expérience réelle avec documents non structurés : parsing PDF, OCR, nettoyage, structuration

  • Habitude de livrer en production : pipelines robustes, observabilité, qualité, performance

Stack / compétences (indicatif)
  • Stockage : AWS

  • Traitement documents : outils OCR/parsing, pipelines de prétraitement texte

  • Tests & qualité : métriques, échantillonnage, validation automatique

Bonus (appréciés)
  • Expérience sur corpus juridiques / réglementaires / contenus à forte exigence de précision

  • Familiarité avec les problématiques multilingues (FR/AR) et encodage

  • Connaissances de base sur les besoins en aval (vector DB, retrieval, citation)

Process de sélection
  • Test en ligne (20 min)

  • Entretien technique (60 min)

Localisation
  • Poste basé à Casablanca

  • Remote possible (au Maroc ou à l'étranger) selon profil et niveau d'autonomie


  • Data Engineer

    il y a 5 jours


    Casablanca, Casablanca-Settat, Maroc Client of Novancy One Temps plein

    Data Engineer (Confirm /Senior) en Freelance--Casablanca, Morocco--Ref. : Context :We are looking for an experienced Data Engineer to design, build, and maintain robust and scalable data pipelines. The ideal candidate will have a strong understanding of modern cloud and big data technologies.Main tasks:Design and development of ETL/ELT pipelinesDatabase...

  • Senior Data Engineer

    il y a 3 jours


    Casablanca, Casablanca-Settat, Maroc Mindera Temps plein

    Here at Mindera, we are continuously developing a fantastic team and would love it for you to join us.As a Senior Data Engineer, you will be a key member of our data team responsible for designing, building, and maintaining the data infrastructure and pipelines that drive our data-driven decision-making processes. You will collaborate with cross-functional...

  • Data Engineer

    il y a 5 jours


    Casablanca, Casablanca-Settat, Maroc INTELCIA Temps plein

    MissionLe Data Engineer Junior participe à la gestion et à l'analyse de données massives (big data) pour produire des indicateurs utiles au pilotage des activités métiers (commerce, service client, marketing, ventes, finances). Il travaille sous la supervision d'un Data Engineer senior et contribue à la mise en place de solutions techniques adaptées...

  • Data Engineer M/F

    il y a 1 jour


    Casablanca, Casablanca-Settat, Maroc TEAL Temps plein

    General information Reference number Job titleData Engineer M/F Contract typeCDI Job description We are looking for an experienced data engineer to join our team. You will use various methods to transform raw data into useful data systems. For example, you'll create algorithms and conduct statistical analysis. Overall, you'll strive for efficiency by...

  • Azure Data Engineer

    il y a 2 semaines


    Casablanca, Casablanca-Settat, Maroc Free-Lancer Temps plein

    Description de Poste : Azure Data Engineer / BI | CasablancaLieu : CasablancaDisponibilité : ASAPMission : FreelanceMode de travail : PrésentielNous sommes à la recherche d'un Azure Data Engineer / BI senior pour une mission freelance basée à Casablanca, afin de renforcer les équipes Data sur des projets à forte valeur analytique et...


  • Casablanca, Casablanca-Settat, Maroc EOS IT OUTSOURCING Temps plein

    Recrutement #DATA_ENG #Hybride #FreelanceNous renforçons nos équipes DATA AZURE avec des Data Engineer sur AZUREen Hybride sur Casablancaavec une maitrise des environnements :Azure data bricks,Data factory, adls, unity catalogs databriks,AzureDémarrage ASAPFREELANCEHybride CASABLANCAEnvoyez nous vos CV's @ ou Très bon courage


  • Casablanca, Casablanca-Settat, Maroc Inetum Maroc Temps plein

    Description de l'entreprise Inetum est un leader européen des services numériques, avec plus de collaborateurs dans 19 pays et un chiffre d'affaires de 2,4 milliards d'euros en 2024. Le Groupe accompagne entreprises et institutions dans leur transformation digitale, alliant performance, innovation et impact sociétal.Présent au Maroc depuis plus de 20...

  • Senior MLops Engineer

    il y a 5 jours


    Casablanca, Casablanca-Settat, Maroc Yassir Temps plein

    Yassiris the leading super App in the Maghreb region set to changing the way daily services are provided. It currently operates in45 cities across Algeria, Morocco and Tunisia with recent expansions into France, Canada and Sub-Saharan Africa. It is backed (:$200M in funding) by VCs from Silicon Valley, Europe and other parts of the world.We offer on-demand...

  • Data Engineer

    il y a 1 jour


    Casablanca, Casablanca-Settat, Maroc PSCIT Company Temps plein

    Nous recrutons un Data Engineer (2–3 ans d'expérience) Passionné par la data, le cloud et le développement ?Rejoignez une équipe innovante sur Azure Databricks & PySpark & SQL. Profil recherché :• Exp. ≥ 2 ans en Data Engineering• Maîtrise Azure Databricks, PySpark, Scala• Rigueur, esprit d'analyse, travail en équipe Envoyez votre CV à ou...


  • Casablanca, Casablanca-Settat, Maroc Client of Novancy One Temps plein

    Senior Freelance Data Project Manager --Casablanca, Morocco--Ref. : Context :We are looking for a Senior Data Project Manager to lead strategic data projects. The ideal candidate will possess in-depth technical expertise in data with strong project management and leadership skills.Main tasks:End-to-end management of data projects (from requirements...