Formation Data Mining and Analysis
Objectif :
Les délégués seront en mesure d'analyser des ensembles de données volumineuses, d'extraire des modèles, de choisir la bonne variable ayant un impact sur les résultats afin qu'un nouveau modèle soit prévu avec des résultats prédictifs.
Plan du cours
-
Prétraitement des données
- Data Cleaning
- Intégration et transformation des données
- Réduction des données
- Discrétisation et génération de hiérarchie de concepts
-
Inférence statistique
- Distributions de probabilités, variables aléatoires, théorème de la limite centrale
- Échantillonnage
- Intervalles de confiance
- Inférence statistique
- Tests d'hypothèse
-
Régression linéaire multivariée
- Spécification
- Sélection de sous-ensembles
- Estimation
- Validation
- Prédiction
-
Méthodes de classification
- Régression logistique
- Analyse discriminante linéaire
- K-voisins les plus proches
- Bayes naïves
- Comparaison des méthodes de classification
-
Neural Networks
- Ajustement des réseaux neuronaux
- Questions relatives à la formation des réseaux neuronaux
-
Arbres de décision
- Arbres de régression
- Arbres de classification
- Arbres par rapport aux modèles linéaires
-
Bagging, Random Forests, Boosting
- Bagging (ensachage)
- Random Forests
- Boosting
-
Machines à vecteurs de support et disct flexible
- Classificateur à marge maximale
- Classificateurs à vecteur de support
- Machines à vecteurs de support
- SVM à 2 classes et plus
- Relation avec la régression logistique
-
Analyse en composantes principales
-
Regroupement
- Regroupement par K-moyens
- Regroupement par K-médoïdes
- Regroupement hiérarchique
- Regroupement basé sur la densité
-
Évaluation et sélection des modèles
- Biais, variance et complexité du modèle
- Erreur de prédiction en cours d'échantillon
- L'approche bayésienne
- Validation croisée
- Méthodes Bootstrap
Les formations ouvertes requièrent plus de 3 participants.
Formation Data Mining and Analysis - Booking
Formation Data Mining and Analysis - Enquiry
Data Mining and Analysis - Demande d'informations consulting
Demande d'informations consulting
Nos clients témoignent (5)
J'ai bénéficié des conseils et des exemples de vie partagés + la réponse à toutes les questions.
Marta Melloch - Amazon Development Center Poland Sp. z o.o.
Formation - Data Mining and Analysis
Traduction automatique
J'ai vraiment apprécié le meilleur de tout.
Halil polat - Amazon Development Center Poland Sp. z o.o.
Formation - Data Mining and Analysis
Traduction automatique
The information given was interesting and the best part was towards the end when we were provided with Data from Durex and worked on Data we are familiar with and perform operations to get results.
Jessica Chaar
Formation - Data Mining and Analysis
Traduction automatique
The hands-on exercise and the trainer capacity to explain complex topics in simple terms.
youssef chamoun
Formation - Data Mining and Analysis
Traduction automatique
I like the exercises done.
Nour Assaf
Formation - Data Mining and Analysis
Traduction automatique
Cours à venir
Cours Similaires
Algorithmic Trading with Python and R
14 HeuresCette formation en direct avec instructeur à France (en ligne ou sur site) est destinée aux analystes commerciaux qui souhaitent automatiser le commerce avec le trading algorithmique, Python, et R.
A l'issue de cette formation, les participants seront capables de :
- Employer des algorithmes pour acheter et vendre rapidement des titres à des incréments spécialisés.
- Réduire les coûts associés au commerce en utilisant le trading algorithmique.
- Surveiller automatiquement les cours des actions et placer des transactions.
Programming with Big Data in R
21 HeuresBig Data désigne des solutions destinées au stockage et au traitement de grands ensembles de données. Développé par Go Ogle au départ, ces Big Data volumes de Big Data des solutions ont évolué et inspiré d' autres projets similaires, dont beaucoup sont disponibles en open source. R est un langage de programmation populaire dans le secteur financier.
Introductory R (Basic to Intermediate)
14 HeuresCette formation en direct avec instructeur à France (en ligne ou sur place) est destinée aux analystes de données débutants qui souhaitent utiliser la programmation R pour manipuler des données, effectuer des analyses de données de base et créer des visualisations convaincantes pour mieux comprendre.
A l'issue de cette formation, les participants seront capables de :
- Comprendre les bases de R Programming.
- Appliquer les processus fondamentaux de la science des données.
- Créer des représentations visuelles de données.
R Fundamentals
21 HeuresR est un langage de programmation gratuit à source ouverte pour l'informatique statistique, l'analyse de données et les graphiques. R est utilisé par un nombre croissant de gestionnaires et d'analystes de données au sein de sociétés et d'universités. R a également trouvé des adeptes parmi les statisticiens, ingénieurs et scientifiques sans compétences en programmation informatique et qui le trouvent facile à utiliser. Sa popularité est due à l'utilisation croissante de l'extraction de données pour divers objectifs, tels que fixer les prix des annonces, trouver plus rapidement de nouveaux médicaments ou affiner les modèles financiers. R propose une grande variété de packages pour l'exploration de données.
Cluster Analysis with R and SAS
14 HeuresCette formation en direct (en ligne ou sur site) s'adresse aux analystes de données qui souhaitent programmer avec R en SAS pour l'analyse de clusters.
A l'issue de cette formation, les participants seront capables de :
- Utiliser l'analyse de cluster pour l'exploration de données
- Maîtriser la syntaxe R pour les solutions de clustering.
- Mettre en œuvre le clustering hiérarchique et non hiérarchique.
- Prendre des décisions basées sur les données afin d'améliorer les opérations de l'entreprise.
Data and Analytics - from the ground up
42 HeuresL'analyse des données est un outil crucial pour les entreprises aujourd'hui. Nous nous concentrerons tout au long de la formation sur le développement de compétences pour l'analyse pratique des données. L'objectif est d'aider les délégués à donner des réponses fondées sur des preuves aux questions suivantes :
Que s'est-il passé ?
- traiter et analyser des données
- produire des visualisations de données informatives
Que va-t-il se passer ?
- prévoir les performances futures
- évaluer les prévisions
Que devrait-il se passer ?
- transformer les données en décisions commerciales fondées sur des preuves
- optimiser les processus
Le cours lui-même peut être dispensé en classe pendant 6 jours ou à distance sur une période de plusieurs semaines si vous le souhaitez. Nous pouvons travailler avec vous pour adapter le cours à vos besoins.
Data Analysis with Python, R, Power Query, and Power BI
21 HeuresCette formation en direct à France (en ligne ou sur place) est destinée aux professionnels débutants qui souhaitent nettoyer et analyser des données, faire des projections statistiques et créer des visualisations perspicaces à l'aide de ces outils.
A l'issue de cette formation, les participants seront capables de :
- Comprendre les bases de Python, R, Power Query, et Power BI pour l'analyse de données.
- Nettoyer et organiser des ensembles de données en utilisant Python et Power Query.
- Effectuer des analyses statistiques et des projections avec R.
- Créer des tableaux de bord et des rapports professionnels avec Power BI.
- Intégrer et analyser efficacement des données provenant de sources multiples.
Data Analytics With R
21 HeuresR est un environnement open source très populaire pour le calcul statistique, l'analyse de données et les graphiques. Ce cours présente le langage de programmation R aux étudiants. Il couvre les principes fondamentaux du langage, les bibliothèques et les concepts avancés, ainsi que l'analyse avancée des données et la création de graphiques à partir de données réelles.
Public
Développeurs / analyse de données
Durée du cours
3 jours
Format
Conférences et travaux pratiques
Data Mining with R
14 HeuresR est un langage de programmation gratuit à source ouverte pour l'informatique statistique, l'analyse de données et les graphiques. R est utilisé par un nombre croissant de gestionnaires et d'analystes de données au sein de sociétés et d'universités. R propose une grande variété de packages pour l'exploration de données.
Econometrics: Eviews and Risk Simulator
21 HeuresCette formation en direct avec formateur dans France (en ligne ou sur site) s'adresse à toute personne souhaitant apprendre et maîtriser les fondamentaux de l'analyse et du modélisation économétrique.
À la fin de cette formation, les participants seront capables de :
- Apprendre et comprendre les fondamentaux de l'économétrie.
- Utiliser Eviews et des simulateurs de risque.
HR Analytics for Public Organisations
14 HeuresCette formation en direct (en ligne ou sur site), dirigée par un instructeur, s'adresse aux professionnels des ressources humaines qui souhaitent utiliser des méthodes analytiques pour améliorer les performances de l'organisation. Ce cours couvre les approches qualitatives et quantitatives, empiriques et statistiques.
Format du cours permettant d'évaluer les participants
- Exposé et discussion interactifs.
- Beaucoup d'exercices et de pratique.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.
Statistical Analysis using SPSS
21 HeuresCette formation en direct avec instructeur à France (en ligne ou sur site) s'adresse aux professionnels de niveau débutant à intermédiaire qui souhaitent effectuer des analyses statistiques à l'aide de SPSS pour interpréter les données avec précision, exécuter des tests statistiques complexes et générer des informations significatives.
A l'issue de cette formation, les participants seront capables de :
- Naviguer dans l'interface de SPSS et gérer efficacement les ensembles de données.
- Effectuer des analyses statistiques descriptives et inférentielles.
- Effectuer des tests t, ANOVA, MANOVA, des analyses de régression et de corrélation.
- Appliquer des tests non paramétriques, l'analyse des composantes principales et l'analyse factorielle pour une interprétation avancée des données.
Talent Acquisition Analytics
14 HeuresCette formation en direct (en ligne ou sur site) est destinée aux professionnels des ressources humaines et aux spécialistes du recrutement qui souhaitent utiliser des méthodes analytiques pour améliorer les performances de l'organisation. Ce cours couvre les approches qualitatives et quantitatives, empiriques et statistiques.
Format du cours permettant d'évaluer les participants
- Exposé et discussion interactifs.
- Beaucoup d'exercices et de pratique.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.
Introduction to Data Visualization with Tidyverse and R
7 HeuresTidyverse est une collection de logiciels R polyvalents destinés au nettoyage, au traitement, à la modélisation et à la visualisation de données. Certains des packages inclus sont: ggplot2, dplyr, tidyr, readr, purrr et tibble.
Dans cette formation en direct animée par un instructeur, les participants apprendront à manipuler et à visualiser des données à l'aide des outils inclus dans Tidyverse .
À la fin de cette formation, les participants seront en mesure de:
- Effectuer une analyse des données et créer des visualisations attrayantes
- Tirer des conclusions utiles à partir de divers ensembles de données d'échantillons de données
- Filtrer, trier et résumer les données pour répondre à des questions exploratoires
- Transformez les données traitées en tracés linéaires, en barres et en histogrammes informatifs
- Importer et filtrer des données provenant de diverses sources de données, notamment Excel fichiers Excel , CSV et SPSS
Public
- Débutants à la langue R
- Débutants en analyse et visualisation de données
Format du cours permettant d'évaluer les participants
- Partie de conférence, partie de discussion, exercices et exercices intensifs