Machine Learning (5 Jours) BGML
Introduction
Cette formation sur 5 jours vous permettra d’acquérir les bases du Machine Learning. À la fin de la formation, vous serez autonome dans la mise en place de modèles prédictifs (création et déploiement). Vous serez en mesure de créer ces modèles dans votre domaine et de les utiliser en production, via des APIs reposant sur des solutions open source et/ou cloud, comme par exemple scikit-learn, Azure ML et Amazon ML. Cette formation est à 30% théorique et à 70% pratique.
Objectifs pédagogiques
- Comprendre les possibilités et les limites du Machine Learning (ML)
- Formuler son propre problème de ML
- Explorer et manipuler des données
- Construire des modèles prédictifs à partir de données d’apprentissage
- Utiliser ces modèles en production à l’aide d’APIs
- Evaluer la performance et l’impact des modèles
Participants
Analyste de données, Data Scientist et développeur
Pré-requis
- Connaissances basiques de programmation (en Python de préférence) et de la ligne de commande
- Utilisation basique d’un tableur (ex: Microsoft Excel)
- Connaissances basiques d’algèbre, de calcul et de probabilité pour la compréhension de certains modules théoriques
Programme
- A quoi le Machine Learning peut-il servir ? Motivations par des cas d’usages
- Le Machine Learning dans la stratégie d’entreprise
- Corrélation, description et prédiction
- L’exemple des modèles linéaires : L’hypothèse de linéarité et ses limites
- La régression linéaire
- La régression logistique
- Illustrations
- Les grands types d’apprentissage
- Apprentissage supervisé
- Apprentissage non supervisé
- Apprentissage online
- Apprentissage par renforcement
- Généralités sur les modèles prédictifs
- Classification vs régression
- Les grandes étapes de construction d’un modèle prédictif
- Evaluation d’un modèle prédictif
- Vers les modèles plus complexes
- De la régression linéaire à la régression polynomiale
- Le risque du sur-apprentissage
- Comment se prémunir du sur-apprentissage : validation croisée et régularisation
- Panorama des principaux modèles prédictifs, classifieur naïf bayésien
- Modèles à arbres de décision
- Méthodes à noyau
- Les réseaux de neurones et le Deep Learning, le perceptron
- Applications propres au Deep Learning
- Principe de l'apprentissage non supervisé
- Algorithmes de clustering
- Algorithme de réduction de dimensionnalité
- Machine Learning en production : les technologies Big Data
- La mise en production