Chiffre.io anonymous visit counting for clients without JavaScript
Skip to content

Du Machine Learning avec SQLite#

Romain Clement Human Talks Grenoble - 13 juin 2023


🙋 Question#

Faire de l'apprentissage automatique en SQL, directement depuis SQLite, une folie ?


🤷 Pourquoi ?#

  • Machine Learning <==> Données
  • Ecosystème SQLite
  • Analyse ad-hoc
  • Intégration pipelines SQL

⚙️ SQLite-ML#

  • Extension SQLite
  • Open-source (licence Apache-2.0)
  • Inspiré par PostgresML et MLFlow
  • Intégration de scikit-learn
  • Approche MLOps

💻 Démo#

Jouons avec les nouvelles fonctions SQL !


💻 Démo#

  1. Entrainement d'un modèle :
SELECT sqml_train(
    experiment_name,
    prediction_type,
    algorithm,
    dataset,
    target,
    test_size,
    split_strategy
);

💻 Démo#

  1. Prédictions avec le modèle
SELECT sqml_predict(experiment_name, features);
SELECT sqml_predict_batch(experiment_name, features);

😢 Limitations#

  • Python uniquement (User Defined Functions)
  • Environnement virtuel Python
  • Tables virtuelles SQLite
  • Pas de big data

🚀 Evolutions#

  • Extension native (Rust)
  • Pré-traitements
  • Recherche d'hyperparamètres
  • Modèles pré-entrainés (🤗 Hugging Face)

Références#


Romain CLEMENT#

bg right width:80%

Entrepreneur individuel Ingénieur et formateur Data / Machine Learning

Organisateur du Meetup Python Grenoble

🌐 romain-clement.net 🔗 linkedin.com/in/romainclement