Stage : Généralisation Zero Shot NLP - F/H

  • Stage
  • Département: DataScience

Description de l'entreprise

La mission de CS GROUP : être à la pointe des technologies pour garantir la sécurité de tous dans un monde en pleine mutation. L’expertise reconnue du groupe lui permet d’intervenir là où les enjeux sont les plus critiques : aéronautique, défense, énergie, spatial. Et, aussi, là où les réponses sont à inventer ou à réinventer : lutte anti-drones, cybersécurité…

Notre esprit Tech et pragmatique, ainsi que notre agilité d’ETI nous permettent d’allier proximité, engagement et innovation, pour diffuser notre culture à tous les niveaux : dans la relation client, dans le mode de management interne, dans notre engagement social et environnemental…

Et bien sûr, dans le développement de votre carrière, notre ambition est de faire de vous un collaborateur accompli : formations, revue de carrière, mobilité, programme ambassadeur…

Nous sommes engagés à vos côtés, au service de votre épanouissement professionnel !

Description du poste

Les modèles de génération de textes récents ont la capacité d'intégrer un "prompt" (un court texte qui permet de guider le modèle dans la tâche à réaliser).

Cela permet de réaliser de la classification zero-shot, c’est-à-dire accomplir n'importe quelle classification de textes en utilisant un seul model sans avoir à en entrainer un nouveau.

Nous recherchons un.e stagiaire pour étudier les capacités de classification zero-shot et few-shot des Larges Langage Models (GPT-2, GPT-J, GPT-3) et de les comparer aux models classification zero-shot basique (Bart-Large-MNLI).

Vos tâches seront les suivantes :
- Réaliser un état de l’art sur les différents modèles,
- Déterminer les ressources nécessaires pour utiliser ces modèles (ordinateur portable, AWS, …)
- Comparer les performances selon le modèle et les prompts utilisés
- Etudier l’impact du fine tuning sur la performance de ces modèles.

Contexte :

Au sein de la sympathique équipe Data Analytics, vous intégrerez la cellule expertise NLP qui étudie différentes applications des derniers modèles d’Intelligence Artificielle appliqués au langage naturel.

Vous travaillerez en mode agile et pourrez profiter de l’expertise de la cellule NLP pour vous aiguiller dans vos travaux.

Environnement technique :

 - Python
 - Deep Learning
 - NLP
 - PyTorch
 - Jupyter
 - Notebook
 - Git

Qualifications

Etudiant.e Bac+3 à Bac+5 (L3 à M2), en Data Science, informatique ou mathématiques, à la recherche d’un stage d’une durée de 3 à 6 mois afin de vous spécialiser en Machine Learning appliqué au traitement du langage.

La connaissance de Python et d’un intérêt pour l’IA est indispensable à l'exercice de votre fonction.

À compétences égales, ce poste est ouvert aux personnes en situation de handicap.

Informations complémentaires

Qui sommes-nous ?

La Business Unit INDUSTRIE contribue aux développements de programmes dans les domaines de la simulation, la transformation digitale et le développement de systèmes critiques. Elle est un acteur référent sur l’Intelligence de la donnée (Data Engineering & Data Science), la digitalisation des processus (PLM), la simulation numérique, le développement de logiciels embarqués & certifiés ainsi que la sécurisation des systèmes (cybersécurité).

Pourquoi choisir CS GROUP ?

Pour notre filière Expert qui valorise vos compétences techniques, notre engagement dans l’innovation avec un budget R&D de 30 millions d’euros/an, nos engagements sociétaux et environnementaux : index d’égalité professionnelle à 86/100, partenaire de l’association Elles bougent, membre de la planète Tech Care etc.

Et bien sûr : la possibilité de télétravailler, un programme de cooptation, la complémentaire santé, les RTT, le CE.

La suite des événements :

Si votre profil correspond, vous aurez un entretien technique avec un de nos Responsables opérationnels.

#CSGROUP #hiring #zeroshot

Politique de confidentialité