AI Engineer H/F

  • Temps complet

Description de l'entreprise

Inetum est un leader européen des services numériques. Pour les entreprises, les acteurs publics et la société dans son ensemble, les 28 000 consultants et spécialistes du groupe visent chaque jour l'impact digital : des solutions qui contribuent à la performance, à l'innovation et au bien commun.

Présent dans 19 pays au plus près des territoires, et avec ses grands partenaires éditeurs de logiciels, Inetum répond aux enjeux de la transformation digitale avec proximité et flexibilité.

Porté par son ambition de croissance et d'industrialisation, Inetum a généré en 2023 un chiffre d'affaires de 2,5 milliards d'€.

Pour répondre à un marché en croissance continue depuis plus de 30ans, Inetum a fait le choix délibéré de se recentrer sur 4 métiers afin de gagner en puissance et proposer des solutions sur mesure, adaptées aux besoins spécifiques de ses clients : le conseil (Inetum Consulting), la gestion des infrastructures et applications à façon (Inetum Technologies), l'implémentation de progiciels (Inetum Solutions) et sa propre activité d'éditeur de logiciels (Inetum Software). Inetum a conclu des partenariats stratégiques avec 4 grands éditeurs mondiaux - Salesforce, ServiceNow, Microsoft et SAP et poursuit une stratégie d'acquisitions dédiée afin d'entrer dans le top 5 européen sur ces technologies et proposer la meilleure expertise à ses clients.

Tous nos postes sont ouverts aux personnes en situation de handicap.

Description du poste

  • Concevoir, entraîner, optimiser et déployer des modèles de Machine Learning et Deep Learning (NLP, LLM, embeddings).
  • Développer et maintenir des pipelines ML robustes (entraînement, évaluation, monitoring, CI/CD).
  • Construire des architectures RAG incluant : ingestion de documents, stratégie de chunking, embeddings, vector stores, pipelines de retrieval & génération.
  • Implémenter des applications LLM avec LangChain / LangGraph (agents, tools, retrievers, flows).
  • Déployer des microservices IA (API FastAPI / Flask) et gérer leur scalabilité en production.
  • Optimiser l'inférence et les performances : latence, consommation GPU, parallélisation, batching.
  • Collaborer avec les équipes Data Engineering, Produit et Dev pour industrialiser les solutions.
  • Surveiller les modèles en production (drift, performance, dérive des données).

Qualifications

  • Excellente maîtrise de Python (structuration du code, tests unitaires, design patterns).
  • Expertise en NLP / Deep Learning : PyTorch, TensorFlow, Transformers (HuggingFace).
  • Expérience concrète sur des projets LLM, fine‑tuning, prompt engineering.
  • Maîtrise des architectures RAG : embeddings, vector stores (FAISS, Chroma, Milvus…), retrieval.
  • Expérience sur LangChain / LangGraph / LlamaIndex.
  • Solide niveau en API engineering : FastAPI, Flask.
  • Connaissances MLOps :
    • Docker, CI/CD (GitLab, GitHub Actions, Azure DevOps…)
    • MLflow, Weights & Biases, DVC
    • Kubernetes (souhaité), orchestration (Airflow / Prefect)
  • Maîtrise d’un cloud : AWS, GCP ou Azure (un plus si Azure OpenAI, Bedrock, Vertex AI).

Compétences appréciées :

  • Connaissance des bases vectorielles avancées (SHARED / HNSW / IVF).
  • Optimisation GPU, quantization (GPTQ, GGUF, vLLM).
  • Expérience en ingestion de documents (OCR, parsing PDF/HTML).
  • Expérience LLMOps (observabilité, monitoring, guardrails).

Profil attendu :

  • Autonomie & pragmatisme : capable de poser un diagnostic, proposer une solution et la livrer.
  • Culture GenAI & LLM : curiosité forte, veille active, envie d’expérimenter et d’améliorer en continu.
  • Collaboration fluide : bon communicant, à l’aise avec les équipes Produit, Data et Software.
  • Orientation impact : focus sur le concret, la performance et la valeur métier plutôt que l’expérimentation théorique.

Informations complémentaires

Vos avantages :

📆 27 jours de congés payés + 10 RTT

🥗 Tickets restaurant : D'une valeur de 9€ (Prise en charge à 60% par Inetum)

👨🏻‍💻 Suivi de carrière individualisé : avec votre manager, leader technique ou chef de projet en proximité tout au long de l'année en plus des entretiens annuels et professionnels.

👋🏻 Parcours d'intégration unique et personnalisé : Accompagnement, référent, rencontre avec les équipes pour vous familiariser avec les valeurs du groupe.

 

Les + Inetum :

💻 Un accord télétravail flexible : Jusqu'à 3 jours/semaine en fonction de notre client

🚀 Politique de formation avantageuse : Formations et Certifications techniques, fonctionnelles, méthodologie et gestion de projet, développement personnel…)

🎉 Des animations d'agence régulière avec les équipes Inetum : Soirées jeux, Afterworks, activité teambuilding …

📣 L'opportunité de transmettre votre savoir en tant qu'expert : Animation de Techlunch, participation à des meetup techniques, prise de parole sur des conférences, dans des écoles ou sur des événements.

 

POURQUOI NOUS REJOINDRE ?

Rejoindre Inetum, Certifié TOP EMPLOYER EUROPE 2026, c'est :

  • Faire partie d'une équipe à taille humaine, soudée, encourageant la diversité des profils et des expériences et favorisant l'autonomie et l'initiative de chacun
  • Avoir un impact chez nos clients en étant responsabilisé dans le cadre de missions à forts enjeux et sur un large panel d'activités
  • S'intégrer dans une dynamique de croissance et de développement de notre marque de conseil.

Nous vous proposons :

  • Une trajectoire de carrière personnalisée et adaptée à vos souhaits d'évolution grâce à une implantation à l’international (19 pays, 7 Fablab)
  • Des formations ciblées et des projets couvrant l’ensemble de la chaîne de valeur IT (+25 filières métiers)
  • Intégrer un collectif d’experts partageant des valeurs de solidarité et d’excellence
  • Une culture de la proximité au sein de nos 45 agences en France

Vous vous retrouvez dans cette description, n’hésitez plus et rejoignez-nous !

    Avis de confidentialité