Senior Foundation Model Engineer – Open Weight Robotics VLAs (EG16, w/m/d) - Abordnung befristet auf 12 Monate (w/m/div.)
- Vollzeit
Unternehmensbeschreibung
Stellenbeschreibung
Als Senior Foundation Model Engineer werden Sie offene VLA-Rückgrate für Robotik (z. B. Pi0, Xiaomi Robotics 0, smolVLA) identifizieren und bewerten sowie entscheiden, wo Nachtraining und Feinabstimmung den entscheidenden Unterschied für reale Aufgaben ausmachen. Sie werden das Trainingshandbuch entwickeln, das Nachtrainingstechniken (z. B. Präferenz-RL-Stile wie RLHF, RLAIF, DPO) und aufgabenbezogene überwachte Feinabstimmung auf offenen Datensätzen sowie Bosch-Bewegungsdaten umfasst. Darüber hinaus werden Sie strenge Benchmarks gegen von Anbietern feinabgestimmte Releases entwerfen und durchführen, starke Baselines und Ablationen definieren und "Benchmark-Karten" veröffentlichen, die klare Deltas zeigen. Sie werden die Sim2Real-Lücke überbrücken, indem Sie Simulationsdatensätze mit physischen Aufgaben abstimmen, Domänenrandomisierung und -retargeting anwenden und die Ergebnisse auf Hardware (z. B. NVIDIA Isaac Sim, Groot) validieren. Zudem sind Sie verantwortlich für die Evaluierungsumgebung und feste Datensplits, um eine Reproduzierbarkeit von mindestens 98 % bei Experimenten mit präziser Laufverfolgung sicherzustellen. Sie werden end-to-end arbeiten, indem Sie großangelegte Experimente implementieren, starten und analysieren, Fehler debuggen und den Durchsatz, die Kosten und die Zuverlässigkeit des Trainingsinferenz optimieren. Des Weiteren werden Sie mit den Daten- und Plattformteams von Bosch zusammenarbeiten, um auf Datensätze und Rechenressourcen zuzugreifen, und Sie werden Modelle für interne Nutzer und externe Demos verpacken und dokumentieren. Sie werden die agentische KI vollständig nutzen, indem Sie autonome Agenten und Co-Piloten verwenden, um Architekturen zu erkunden, Pipelines zu strukturieren, automatisch Testberichte zu generieren, Abläufe zu triagieren und Iterationen zu beschleunigen. Last but not least werden Sie sich mit der Community engagieren, Ergebnisse veröffentlichen, technische Artikel (z. B. Hugging Face Blogs) mit Marketingunterstützung schreiben und, wo es angemessen ist, zu Open Source beitragen.
Qualifikationen
- Ausbildung: Bachelor- oder Masterabschluss in Informatik, Maschinellem Lernen, Künstlicher Intelligenz, Robotik oder einem ähnlichen Bereich
- Erfahrung und Fachwissen: mehrere Jahre Erfahrung in der Anpassung großer multimodaler Vision-Language-Action-Modelle; Post-Training (RLHF, RLAIF, DPO) und SFT; rigoroses Benchmarking und Ablationsdesign; großangelegte verteilte Schulung; Sim2Real-Strategien und Evaluierung am Roboter; fundierte Kenntnisse in Python (C ist von Vorteil); MLOps und Reproduzierbarkeit von Experimenten; klare technische Dokumentation und Engagement in der Community
- Persönlichkeit und Arbeitsstil: Sie sind eine experimentierfreudige Person mit einem hohen Maß an persönlicher Verantwortung und kommunizieren Ihre Ergebnisse stets präzise und ehrlich; Sie halten erfolgreich ein Gleichgewicht zwischen Entwicklungsgeschwindigkeit und wissenschaftlicher Genauigkeit und übernehmen die volle Verantwortung für Ihre Ergebnisse von Anfang bis Ende
- Sprachen: sehr gute schriftliche und mündliche Kenntnisse in Deutsch und Englisch