Data Engineer Senior

il y a 5 jours


Casablanca, Casablanca-Settat, Maroc Collective Temps plein

Data Engineer Senior - NLP / données non structurées (freelance ; 6 mois minimum)


Nous recrutons un(e) Data Engineer senior pour un projet à forte portée : digitaliser le droit au Maroc et en Afrique et créer la première base de connaissance juridique interrogeable par l'IA.

Notre ambition est de construire une plateforme capable de répondre à des questions juridiques de façon fiable, sourcée et traçable, en s'appuyant sur un corpus massif de documents juridiques hétérogènes.

Pourquoi ce projet est différent

Vous rejoignez une mission "infrastructure de connaissance" :

  • contribuer à rendre le droit plus accessible 

  • bâtir un actif durable : une base structurée du droit marocain (français), extensible à l'Afrique

  • travailler sur un défi technique concret et profond : transformer du non-structuré en une donnée exploitable, fiable et maintenable à grande échelle

Votre mission

Vous serez responsable de la chaîne "documents → données structurées" qui alimentera notre moteur IA (RAG).

Au cœur du poste (intérêt technique)

Constituer une base de données structurée du droit marocain en français à partir de données très hétérogènes :

  • PDF (texte et scannés), Word, images, fichiers texte, parfois bruités ou incomplets

  • extraction de texte (parsing + OCR si nécessaire), nettoyage 

  • structuration : détection titres/chapitres/sections/articles, hiérarchie, normalisation

  • chunking intelligent (par structure juridique plutôt que par taille arbitraire), avec traçabilité (source, page, identifiants)

  • métadonnées : date, type de texte (loi/décret/circulaire/jurisprudence…), source, version, numéros d'articles, etc.

  • déduplication & versioning : documents redondants, amendements, versions consolidées

  • industrialisation : orchestration, logs, retries, idempotence, monitoring, tests qualité

Profil recherché
  • 3+ ans d'expérience en Data Engineering et/ou Document AI / NLP appliqué

  • Très bonne maîtrise de Python

  • Expérience réelle avec documents non structurés : parsing PDF, OCR, nettoyage, structuration

  • Habitude de livrer en production : pipelines robustes, observabilité, qualité, performance

Stack / compétences (indicatif)
  • Stockage : AWS

  • Traitement documents : outils OCR/parsing, pipelines de prétraitement texte

  • Tests & qualité : métriques, échantillonnage, validation automatique

Bonus (appréciés)
  • Expérience sur corpus juridiques / réglementaires / contenus à forte exigence de précision

  • Familiarité avec les problématiques multilingues (FR/AR) et encodage

  • Connaissances de base sur les besoins en aval (vector DB, retrieval, citation)

Process de sélection
  • Test en ligne (20 min)

  • Entretien technique (60 min)

Localisation
  • Poste basé à Casablanca

  • Remote possible (au Maroc ou à l'étranger) selon profil et niveau d'autonomie


  • Data Engineer

    il y a 4 jours


    Casablanca, Casablanca-Settat, Maroc INTELCIA Temps plein

    MissionLe Data Engineer Junior participe à la gestion et à l'analyse de données massives (big data) pour produire des indicateurs utiles au pilotage des activités métiers (commerce, service client, marketing, ventes, finances). Il travaille sous la supervision d'un Data Engineer senior et contribue à la mise en place de solutions techniques adaptées...

  • Data Engineer M/F

    il y a 2 jours


    Casablanca, Casablanca-Settat, Maroc TEAL Temps plein

    General information Reference number Job titleData Engineer M/F Contract typeCDI Job description We are looking for an experienced data engineer to join our team. You will use various methods to transform raw data into useful data systems. For example, you'll create algorithms and conduct statistical analysis. Overall, you'll strive for efficiency by...


  • Casablanca, Casablanca-Settat, Maroc EOS IT OUTSOURCING Temps plein

    Recrutement #DATA_ENG #Hybride #FreelanceNous renforçons nos équipes DATA AZURE avec des Data Engineer sur AZUREen Hybride sur Casablancaavec une maitrise des environnements :Azure data bricks,Data factory, adls, unity catalogs databriks,AzureDémarrage ASAPFREELANCEHybride CASABLANCAEnvoyez nous vos CV's @ ou Très bon courage

  • Senior MLops Engineer

    il y a 4 jours


    Casablanca, Casablanca-Settat, Maroc Yassir Temps plein

    Yassiris the leading super App in the Maghreb region set to changing the way daily services are provided. It currently operates in45 cities across Algeria, Morocco and Tunisia with recent expansions into France, Canada and Sub-Saharan Africa. It is backed (:$200M in funding) by VCs from Silicon Valley, Europe and other parts of the world.We offer on-demand...

  • Data engineer

    il y a 5 jours


    Casablanca, Casablanca-Settat, Maroc Collective Temps plein

    Nous sommes actuellement à la recherche d'un Data Engineer confirmé pour le compte de l'un de nos clients dans le secteur bancaire, basé à Casablanca.Compétences techniques requises :Maîtrise des outils Spark, Cloudera, Airflow et NiFi

  • Data engineer

    il y a 2 semaines


    Casablanca, Casablanca-Settat, Maroc Filiale Temps plein

    Nous recrutons pour notre client, organisme de crédit un Data Engineer sur Casablanca.Missions principales: Participation au Développement de l'Infrastructure de DonnéesIntégration de DonnéesPipelines DataCréation de Domaines de DonnéesGouvernance de donnéesRecherche et DéveloppementProfil recherché: Diplôme d'ingénieur ou de Master en...

  • Data engineer Junior

    il y a 4 jours


    Casablanca, Casablanca-Settat, Maroc VERVE TECHNOLOGIES Temps plein

    Nous recrutons un Data Engineer (2–3 ans d'expérience) pour notre client Passionné par la data, le cloud et le développement ?Rejoignez une équipe innovante sur Azure Databricks & PySpark. Profil recherché :• Exp. ≥ 2 ans en Data Engineering• MaîtriseAzureDatabricks, PySpark, Scala• Rigueur, esprit d'analyse, travail en équipe Envoyez votre...

  • Senior Data Actuary

    il y a 19 heures


    Casablanca, Casablanca-Settat, Maroc Oliver James Associates Temps plein

    Senior Data Actuary – Global TransformationLocation: Casablanca, MarocFunction: Life & Health – Data & TransformationAbout the RoleA recognised global leader insurance & reinsurance company is seeking a Senior Data Actuary to act as the central technical expert driving data excellence across its global Life & Health reserving organisation. This is a...

  • Data Engineer

    il y a 1 semaine


    Casablanca, Casablanca-Settat, Maroc IDEMIA Temps plein

    At IDEMIA, we aim to offer our employees, a dynamic and exciting environment where you have opportunities for career growth and professional development. Internal mobility is a great way for you to energize your career and to build your personal brand. It's also a great way to explore other functions, professions or countries as IDEMIA operates in different...

  • Senior DevOps Engineer

    il y a 4 jours


    Casablanca, Casablanca-Settat, Maroc Qalqul engine Temps plein

    Location: Remote (Semi-remote for exceptional candidates) — Casablanca Morocco preferred for occasional onsite collaborationType: Full-timeStart Date: ASAPAbout Qalqul Engine:Qalqul Engine is an AI & automation platform deployed across banking, insurance, retail, public sector, and large-scale enterprise ecosystems. We are accelerating toward global SaaS...