def load_csv(filename: str, separator: str = ",") -> pd.DataFrame:
    return pd.read_csv(filename, sep=separator)

def simple_process_csv() -> None:
    load_csv("data.csv")

load_tsv = functools.partial(load_csv, separator="\t")

def simple_process_tsv() -> None:
    load_tsv("data.tsv")

def load_csv(filename: str, separator: str = ",") -> pd.DataFrame:
    return pd.read_csv(filename)

def clean_csv(data: pd.DataFrame) -> pd.DataFrame:
    return data.dropna()

def save_csv(filename: str, data: pd.DataFrame) -> None:
    data.to_csv(filename)

def pipeline_imperative(input_csv: Path, output_csv: Path) -> None:
    input_data = load_csv(input_csv)
    clean_data = clean_csv(input_data)
    save_csv(output_csv, clean_data)

def pipeline_functional(input_csv: Path, output_csv: Path) -> None:
    save_csv(output_csv, clean_csv(load_csv(input_csv)))

def compose(*functions):
    return functools.reduce(
        lambda f, g: lambda x: f(g(x)),
        functions,
        lambda x: x,
    )

def pipeline_compose(input_csv: Path, output_csv: Path) -> None:
    dag = compose(
        functools.partial(save_csv, output_csv),
        clean_csv,
        load_csv,
    )
    dag(input_csv)

def list_files() -> Iterable[Path]:
    return Path().glob("*.png")

def open_file(filepath: Path) -> bytes:
    return filepath.read_bytes()

def process_data(data: bytes) -> int:
    return len(data)

def streaming_imperative() -> None:
    files = list_files()
    files_bytes = map(open_file, files)
    files_len = map(process_data, files_bytes)
    print(list(files_len))

def streaming_functional() -> None:
    files_len = map(process_data, map(open_file, list_files()))
    print(list(files_len))

def streaming_multiple() -> None:
    files1, files2 = itertools.tee(list_files(), 2)
    list(map(process_data, map(open_file, files1)))
    list(map(print, files2))

🐍 Pipelines de données fonctionnels avec Python¶

🤷‍♂️ Contexte¶

⚠️ Remarques¶

⚙️ DAG ?¶

⚙️ DAG - Représentation¶

⚙️ DAG - Avantages¶

⚙️ DAG - Exemple 1¶

⚙️ DAG - Exemple 2 - Nettoyer un fichier CSV¶

⚙️ DAG - Exemple 2bis - Nettoyer un fichier CSV¶

⚙️ DAG - Exemple 3 - Web-scraping ETL¶

⚙️ DAG - Exemple 4 - Traitement de fichiers (streaming)¶

⚙️ DAG - Exemple 5 - Machine Learning¶

ƛ Programmation Fonctionnelle¶

ƛ Concepts fonctionnels en Python¶

ƛ Concepts fonctionnels en Python¶

👨‍💻 Mise en pratique¶

♻ Réutilisabilité¶

⛓ Composabilité¶

💤 Evaluation paresseuse¶

👍 Avantages¶

👎 Limitations¶

🚀 Pour aller plus loin¶

🏁 Conclusion¶

📚 Références¶