Plan du cours
- Machine Learning introduction
- Types d'apprentissage automatique - apprentissage supervisé ou non supervisé
- De l'apprentissage statistique à l'apprentissage automatique
- Le flux de travail Data Mining :
- Business compréhension
- Compréhension des données
- Préparation des données
- Modélisation
- L'évaluation
- Déploiement
- Algorithmes d'apprentissage automatique
- Choisir l'algorithme approprié au problème
- Surajustement et compromis biais-variance en ML
- Bibliothèques de ML et langages de programmation
- Pourquoi utiliser un langage de programmation ?
- Choisir entre R et Python
- Python cours accéléré
- Ressources Python
- Python Bibliothèques pour l'apprentissage automatique
- Carnets Jupyter et codage interactif
- Tester les algorithmes de ML
- Généralisation et surajustement
- Éviter le surajustement
- Méthode Holdout
- Validation croisée
- Bootstrapping
- Évaluation des prédictions numériques
- Mesures de la précision : ME, MSE, RMSE, MAPE
- Stabilité des paramètres et des prédictions
- Évaluation des algorithmes de classification
- La précision et ses problèmes
- La matrice de confusion
- Le problème des classes déséquilibrées
- Visualisation des performances du modèle
- Courbe de profit
- Courbe ROC
- Courbe d'ascension
- Sélection de modèles
- Mise au point du modèle - stratégies de recherche en grille
- Exemples dans Python
- Préparation des données
- Importation et stockage des données
- Comprendre les données - explorations de base
- Manipulation des données avec la bibliothèque pandas
- Transformations des données - traitement des données
- Analyse exploratoire
- Observations manquantes - détection et solutions
- Valeurs aberrantes - détection et stratégies
- Normalisation, standardisation, binarisation
- Recodage de données qualitatives
- Exemples dans Python
- Classification
- Classification binaire ou multiclasse
- Classification par fonctions mathématiques
- Fonctions discriminantes linéaires
- Fonctions discriminantes quadratiques
- Régression logistique et approche probabiliste
- k-voisins les plus proches
- Bayes naïves
- Arbres de décision
- CART
- Bagging (mise en sac)
- Random Forests
- Boosting
- Xgboost
- Machines à vecteurs de support et noyaux
- Classificateur à marge maximale
- Machine à vecteur de support
- Apprentissage d'ensemble
- Exemples dans Python
- Régression et prédiction numérique
- Estimation des moindres carrés
- Techniques de sélection des variables
- Régularisation et stabilité - L1, L2
- Non-linéarité et moindres carrés généralisés
- Régression polynomiale
- Splines de régression
- Arbres de régression
- Exemples dans Python
- Apprentissage non supervisé
- Regroupement
- Regroupement basé sur les centroïdes - k-means, k-medoids, PAM, CLARA
- Regroupement hiérarchique - Diana, Agnes
- Regroupement basé sur un modèle - EM
- Cartes auto-organisatrices
- Évaluation des grappes
- Réduction de la dimensionnalité
- Analyse en composantes principales et analyse factorielle
- Décomposition en valeur singulière
- Mise à l'échelle multidimensionnelle
- Exemples dans Python
- Regroupement
- Exploration de texte
- Prétraitement des données
- Le modèle du sac de mots
- Le filtrage et la lemmisation
- Analyse de la fréquence des mots
- Analyse des sentiments
- Création de nuages de mots
- Exemples dans Python
- Moteurs de recommandation et filtrage collaboratif
- Données de recommandation
- Filtrage collaboratif basé sur l'utilisateur
- Filtrage collaboratif basé sur les éléments
- Exemples dans Python
- Extraction de motifs d'association
- Algorithme des ensembles fréquents
- Analyse du panier de la ménagère
- Exemples dans Python
- Analyse des valeurs extrêmes
- Analyse des valeurs extrêmes
- Détection des valeurs aberrantes basée sur la distance
- Méthodes basées sur la densité
- Détection de valeurs aberrantes en haute dimension
- Exemples dans Python
- Machine Learning étude de cas
- Business compréhension du problème
- Prétraitement des données
- Sélection et réglage des algorithmes
- Évaluation des résultats
- Déploiement
Pré requis
Connaissance et prise de conscience des Machine Learning fondamentaux
Nos clients témoignent (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Formation - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Formation - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback