Du Machine Learning avec SQLite#
Romain Clement Human Talks Grenoble - 13 juin 2023
🙋 Question#
Faire de l'apprentissage automatique en SQL, directement depuis SQLite, une folie ?
🤷 Pourquoi ?#
- Machine Learning <==> Données
- Ecosystème SQLite
- Analyse ad-hoc
- Intégration pipelines SQL
⚙️ SQLite-ML#
- Extension SQLite
- Open-source (licence Apache-2.0)
- Inspiré par PostgresML et MLFlow
- Intégration de
scikit-learn
- Approche MLOps
💻 Démo#
Jouons avec les nouvelles fonctions SQL !
💻 Démo#
- Entrainement d'un modèle :
SELECT sqml_train(
experiment_name,
prediction_type,
algorithm,
dataset,
target,
test_size,
split_strategy
);
💻 Démo#
- Prédictions avec le modèle
SELECT sqml_predict(experiment_name, features);
SELECT sqml_predict_batch(experiment_name, features);
😢 Limitations#
- Python uniquement (User Defined Functions)
- Environnement virtuel Python
- Tables virtuelles SQLite
- Pas de big data
🚀 Evolutions#
- Extension native (Rust)
- Pré-traitements
- Recherche d'hyperparamètres
- Modèles pré-entrainés (🤗 Hugging Face)
Références#
Romain CLEMENT#
Entrepreneur individuel Ingénieur et formateur Data / Machine Learning
Organisateur du Meetup Python Grenoble