Travailler avec des Data Lakehouses en Python, sans Spark#

Talk given on November 1st, 2025 at the PyConFR Lyon 2025 conference.

Summary#

Beaucoup d'équipes utilisent Spark pour traiter de petites et moyennes quantités de données, complexifiant inutilement leurs projets. Cette présentation montre comment utiliser les formats Data Lakehouse (Delta Lake, Apache Iceberg) directement en Python, sans Spark.

Nous verrons comment obtenir les fonctionnalités avancées (tables ACID, historique des versions) avec des bibliothèques Python telles que delta-rs et pyiceberg, ainsi que des intégrations comme DuckDB.

Cette conférence s'adresse aux ingénieurs data, ingénieurs ML et data scientists souhaitant simplifier leur stack technique sans perdre les fonctionnalités essentielles.

Video#

Slides#

(Only available in French 🇫🇷)