Data Science Engineer - Equipe Performance Dashboard F/H
- 85 Rue du Faubourg Saint-Martin, 75010 Paris, France
- Temps complet
- Département: Technology
- Contract Type: Long term/Permanent contract
Description de l'entreprise
Le bonheur des uns fait le bonheur des autres.
Depuis 2006, nous sommes connectés aux Français et à leurs habitudes. Nous accompagnons nos 28 millions de visiteurs uniques mensuels dans chaque étape de leur vie, pour (presque) tous leurs besoins. Nous sommes présents sur pratiquement toutes les catégories de biens et services et nous sommes toujours leader sur les catégories immobilier, automobile et emploi.
Chez leboncoin Groupe, nous avons depuis toujours le souci de l’humain, du bien-être des collaborateurs, de la préservation d’un équilibre sain entre les journées de travail et la vie privée.
Pour continuer de grandir sans changer d’état d’esprit, nous privilégions une organisation horizontale et des méthodes de management modernes et agiles.
Depuis plusieurs années leboncoin Groupe participe à la promotion de la diversité en recrutant des personnes avant tout engagées et passionnées. La Mission Handicap s’engage dans cette dynamique en intégrant et accompagnant toutes les personnes en situation de handicap.
C’est également une entreprise où il fait bon travailler, puisqu’elle a été primée au Palmarès Best Workplaces France et Europe, selon le classement établi par l’institut Great Place To Work, et ce, depuis 8 ans désormais !
Description du poste
L’équipe
Vous intégrerez la feature team Panda (Performance Analysis Dashboard) dont la mission est de continuellement améliorer la performance des annonces.
La team Panda est hébergée dans les locaux du Boncoin dans le 10ème arrondissement de Paris, mais développe ses produits pour l’ensemble des places de marché du groupe Adevinta. Dans ce cadre, notre offre est constituée à la fois de produits full-stack et d’algorithmes.
Vous rejoindrez une équipe pluridisciplinaire composée de développeurs backend, de développeurs frontend, de data-scientist, d’un ingénieur QA, un DevOps, un designer UX/UI et sans oublier le Product Owner, tous réunis autour de la méthode agile Scrum.
Dans une démarche d’amélioration continue, l’équipe se réunit toutes les deux semaines pour améliorer ses méthodes de travail et avoir un moment de convivialité !
Dans le contexte d’Adevinta, vous serez amené à interagir avec vos homologues à l’international, ainsi que les différentes marketplaces du groupe
Le contexte technique
Un environnement à la pointe et sans legacy constitué principalement de composants back écrits en Go, les composants Data sont en Python/Spark et des composants front en React
Un pipe de données utilisant Kafka pour faire communiquer les différents services
Les statistiques collectées sont stockées dans DynamoDB, les relations de consultations sont dans une base graphe Neptune et un cluster Redis complète cette architecture pour nos statistiques de la journée
Une plateforme d’intégration continue basée sur Github et Travis-Ci
Configuration et provisioning avec Spinnaker
Notre infrastructure et nos produits sont monitorés sur DataDog
Enfin, toute notre infrastructure est hébergée sur Amazon Web Services (AWS)
Nous utilisons Athena pour exposer des datasets dans QuickSight pour des besoins de reporting
Les données sont explorées et traitées en utilisant Spark sur du EMR et du Kubernetes à venir
La donnée chez nous représente :
plus de 500 Millions d'événements traités par jour avec 500 000 incréments par seconde lors des piques
Plus d’un million de nouvelles annonces par jour et un datalake ayant l’historique de plus d’un milliard d’annonces
Ce que vous ferez
Interagir avec les marketplaces et différents stakeholders pour définir les prérequis et faciliter l’intégration de notre produit
Mettre en place outils et systèmes de reporting
Proposer une architecture d’ingestion, traitement et stockage des données, pour le nouveaux cas d'usage qui se présentent.
Concevoir et améliorer les algorithmes de recommandation utilisés
Capable de construire et concevoir des solutions techniques à partir de zéro
Maintenir le pipe de données :
Participer à la définition des formats et contenus attendus de données
Contrôler la qualité des données ingérées
Participer aux effort de qualité dans le traitement des données
Proposer des solutions techniques performantes et à la pointe, d’un point de vue développement et cloud
Surveiller la performance et qualité de nos solutions, et intervenir en cas de besoin
En fonction des souhaits du candidat, il est possible de prévoir une montée en compétence sur Golang et de participer au développement du backend.
Qualifications
Aujourd’hui, nous avons besoin de renforcer la team Panda et nous recherchons un passionné de la data expérimenté. Idéalement, le profil recherché doit avoir :
Une bonne connaissance d’algorithmique et des structures de données
Une connaissance avancée de Python et Spark,
Connaissance des algorithmes de Machine Learning
Expérience sur des projets utilisant du Scikit-learn ou Tensorflow
Bonne connaissance de librairies de manipulation de données comme Pandas et Numpy
Une bonne capacité d’analyse
Bon niveau écrit et oral en Anglais
Autres qualités recherchées :
Aider à améliorer nos méthodes de travail et nos best practices
Expérience avec AWS, Google Cloud Platform, ou toute autre système de cloud
Si vous voulez contribuer à un projet à fort impact dans un cadre international, n’attendez plus pour candidater en nous envoyant votre CV !