Chiffre.io anonymous visit counting for clients without JavaScript
Skip to content

Travailler avec des Data Lakehouses en Python, sans Spark#

Talk given on November 1st, 2025 at the PyConFR Lyon 2025 conference.

Talk on PyConFR

Summary#

Beaucoup d'équipes utilisent Spark pour traiter de petites et moyennes quantités de données, complexifiant inutilement leurs projets. Cette présentation montre comment utiliser les formats Data Lakehouse (Delta Lake, Apache Iceberg) directement en Python, sans Spark.

Nous verrons comment obtenir les fonctionnalités avancées (tables ACID, historique des versions) avec des bibliothèques Python telles que delta-rs et pyiceberg, ainsi que des intégrations comme DuckDB.

Cette conférence s'adresse aux ingénieurs data, ingénieurs ML et data scientists souhaitant simplifier leur stack technique sans perdre les fonctionnalités essentielles.

Slides#

(Only available in French 🇫🇷)