Senior Data Engineer (H/F)
- Full-time
- Contract type: Permanent contract
Company Description
Chez Devoteam, nous sommes des « Digital Transformakers ». Le respect, la franchise et la passion animent chaque jour notre tribu.
Ensemble, nous aidons nos clients à remporter la bataille du Digital : du conseil à la mise en œuvre de technologies innovantes, jusqu’à l’adoption des usages.
Cloud, Cybersecurity, Data, DevOps, Fullstack Dev, Low Code, RPA n’ont plus aucun secret pour notre tribu !
Nos 10 000+ collaborateurs sont certifiés, formés et accompagnés au quotidien pour relever de nouveaux challenges innovants.
Leader du Cloud, de la Cybersécurité et de la Data en EMEA, le Groupe Devoteam a réalisé en 2022 un chiffre d’affaires de 1,036 milliard d’euros et se donne pour ambition de le doubler dans les 5 années à venir.
Devoteam Maroc, acteur de référence dans les expertises IT depuis plus de 30 ans (350+ consultants) accélère sa croissance en développant ses activités d’expertise en nearshore pour répondre aux besoins de nos clients français, européens et moyen orientaux.
Es-tu prêt(e) à nous rejoindre et relever ensemble ce défi ?
Job Description
Dans le cadre du renforcement des équipes Data, nous recherchons des profils capables de concevoir, industrialiser et optimiser des plateformes de données (batch & temps réel) au sein d’environnements distribués basés sur Cloudera.
Vos missions :
Développement & Industrialisation
Développer des pipelines de traitement de données massives en PySpark (modes Batch et Real-Time / Streaming).
Mettre en place des flux temps réel via Kafka (topics, partitions, schémas, offsets) et assurer l'ingestion avec NiFi.
Modéliser et optimiser les schémas NoSQL, notamment sur Cassandra (tables, clés, clustering, réplication) et Hive.
Intégrer et transformer des données provenant de multiples sources (APIs, BDD, streams, fichiers).
Qualité, Performance & Fiabilité
Déployer des mécanismes de Data Quality (contrôles, monitoring, alerting).
Optimiser les traitements Spark (partitioning, tuning, formats de données) spécifiquement pour des architectures distribuées.
Assurer la supervision et la résolution des incidents dans un environnement de production.
CI/CD & Gouvernance
Industrialiser les développements via des chaînes CI/CD (tests automatisés, déploiements).
Documenter les flux, modèles et bonnes pratiques.
Collaborer ponctuellement avec les équipes métiers sur des sujets Dataviz et collaborer avec les Data Scientists (notamment sur des algorithmes de segmentation client).
Contribuer à la gouvernance des données (catalogue, traçabilité, sécurité).
Qualifications
Expérience : ~4 ans d’expérience dans des environnements distribués et des architectures Big Data.
Architecture : Forte appétence et expérience significative sur des infrastructures On-Premise.
Spark / PySpark : Maîtrise impérative en traitement Batch et Streaming.
NoSQL : Expérience confirmée sur Cassandra et/ou Hive
Streaming & Ingestion : Très bonne maîtrise de Kafka et NiFi
Nice-to-have / Bonus : Bonne compréhension de l'écosystème Hadoop/HDFS.
La maîtrise de Cloudera est un plus mais reste facultative.
Notions en Data Science (modèles de clustering/segmentation client) et outils de Dataviz.
Outils & DevOps : Compétences en Git, CI/CD (GitLab CI…) et un outil d’orchestration (Airflow, Luigi, Prefect…).
Additional Information
Pourquoi nous rejoindre ?
Rejoindre Devoteam, c’est :
Évoluer sur des projets stratégiques autour de la donnée
Bénéficier d’un accompagnement personnalisé pour le développement de vos compétences et certifications
Travailler dans un environnement stimulant, collaboratif et bienveillant
By clicking the link above or any third-party link within this posting, you are leaving this site and going to a third-party website where the third-party website's terms and privacy policy apply