Pulsover logo

Data Engineer Senior - Spark

Pulsover
Full-time
On-site
Paris, Paris, France

Pulsover est un cabinet de conseil spécialisé dans la data, le cloud et le delivery, partenaire de Databricks et AWS.

Nous renforçons notre pôle Data en recherchant un.e Senior Data Engineer expérimenté.e sur Databricks pour accompagner la croissance de Pulsover.

Si tu es passionné.e par la data, que tu possèdes une expertise approfondie sur Databricks, Spark et AWS, cette offre d’emploi est faite pour toi.

En tant que Data Engineer Senior, tu joueras un rôle essentiel dans la création, la mise en œuvre et la gestion de nos pipelines de données. Tu seras responsable de concevoir des architectures de données robustes, de développer des solutions d’intégration de données efficaces et d’optimiser les performances de nos infrastructures de données.

Tes missions principales :

  • Participer à des projets de data engineering basés sur un framework méthodologique

  • Développer, industrialiser et maintenir des pipelines de données (principalement ETL et ML)

  • Effectuer de l’exploration de données et du prototypage rapide

  • Mettre en application les meilleures pratiques : versioning, tests automatisés, CI/CD

  • Participer activement à l’automatisation des infrastructures basées sur des services de Cloud Computing

  • Implémenter des architectures de type Lakehouse pour casser les silos

  • Déployer des algorithmes de machine learning at scale et sur des flux de streaming

  • Collaborer avec l’ensemble des équipes depuis les spécifications fonctionnelles jusqu’aux validations métiers des solutions implémentées

  • Contribuer à la mise en place de méthodologies Agile de type Scrum

Socle technologique et méthodologique :

  • Stack technique du poste : Spark, Python, Scala, Scikit learn, MLFlow, Versionning (Git), CI/CD (GitHub Actions/ GitLab/ Jenkins)

  • Job orchestration : Apache Airflow

  • Data platform: Databricks, Snowflake

  • Cloud : AWS et/ ou GCP, Azure

  • Méthodo : développement Agile/ travail en équipe collaborative

  • Tests automatisés : Pytest, Scalatest, Cucumber

Les avantages :

  • Un environnement de travail collaboratif et stimulant, favorisant l’apprentissage continu et l’évolution professionnelle

  • Des missions stimulantes au sein de grands acteurs du marché

  • Des opportunités de formation et de développement professionnel pour rester à jour sur les dernières technologies

  • La possibilité de travailler sur des projets de données complexes et stimulants, ayant un impact direct sur les décisions stratégiques de l’entreprise

  • Une rémunération compétitive et des avantages sociaux attractifs