Stage : Moteur de recherche d'une base de PDF - F/H

  • Stage
  • Département: DataScience

Description de l'entreprise

La mission de CS GROUP : être à la pointe des technologies pour garantir la sécurité de tous dans un monde en pleine mutation. L’expertise reconnue du groupe lui permet d’intervenir là où les enjeux sont les plus critiques : aéronautique, défense, énergie, spatial. Et, aussi, là où les réponses sont à inventer ou à réinventer : lutte anti-drones, cybersécurité…

Notre esprit Tech et pragmatique, ainsi que notre agilité d’ETI nous permettent d’allier proximité, engagement et innovation, pour diffuser notre culture à tous les niveaux : dans la relation client, dans le mode de management interne, dans notre engagement social et environnemental…

Et bien sûr, dans le développement de votre carrière, notre ambition est de faire de vous un collaborateur accompli : formations, revue de carrière, mobilité, programme ambassadeur…

Nous sommes engagés à vos côtés, au service de votre épanouissement professionnel !

Description du poste

Nous recherchons un.e stagiaire pour développer une application permettant de faire des recherches en langage naturel dans une base de données de PDFs.

La.le candidat.e sera amené.e à explorer les différentes méthodes de recherche basée sur le langage naturel (ex: recherche sémantique) et de réaliser une interface web permettant d'interroger une base de données de PDF en langage naturel.

Vos tâches seront les suivantes :
- Réaliser l'état de l'art des méthodes de recherches en langage naturel,
- Utiliser une librairie interne de parsing de PDF pour en extraire les informations textuelles,
- Créer une interface web pour réaliser des recherches en langage naturel sur la base des textes des PDFs.

Contexte :

Au sein de la sympathique équipe Data Analytics, vous intégrerez la cellule expertise NLP qui étudie différentes applications des derniers modèles d’Intelligence Artificielle appliqués au langage naturel.

Vous travaillerez en mode agile et pourrez profiter de l’expertise de la cellule NLP pour vous aiguiller dans vos travaux.

Environnement technique :

 - Python
 - Deep Learning
 - NLP
 - PyTorch
 - Jupyter
 - Notebook
 - Git

Qualifications

Qui êtes-vous ?

Etudiant.e en Bac+3 à Bac+5 (L3 à M2), en Data Science, informatique ou mathématiques, vous êtes à la recherche d’un stage d’une durée de 4 à 6 mois afin de vous spécialiser en Machine Learning appliqué au traitement du langage.

La connaissance de Python et d’un intérêt pour l’IA est indispensable à l'exercice de votre fonction.

À compétences égales, ce poste est ouvert aux personnes en situation de handicap.

Informations complémentaires

Qui sommes-nous ?

La Business Unit INDUSTRIE contribue aux développements de programmes dans les domaines de la simulation, la transformation digitale et le développement de systèmes critiques. Elle est un acteur référent sur l’Intelligence de la donnée (Data Engineering & Data Science), la digitalisation des processus (PLM), la simulation numérique, le développement de logiciels embarqués & certifiés ainsi que la sécurisation des systèmes (cybersécurité).

Pourquoi choisir CS GROUP ?

Pour notre filière Expert qui valorise vos compétences techniques, notre engagement dans l’innovation avec un budget R&D de 30 millions d’euros/an, nos engagements sociétaux et environnementaux : index d’égalité professionnelle à 86/100, partenaire de l’association Elles bougent, membre de la planète Tech Care etc.

Et bien sûr : la possibilité de télétravailler, un programme de cooptation, la complémentaire santé, les RTT, le CE.

La suite des événements :

Si votre profil correspond, vous aurez un entretien technique avec un de nos Responsables opérationnels.

#CSGROUP #hiring #machinelearning #PDF

Politique de confidentialité