Plan du cours
Jour 1
Introduction et préliminaires
- Rendre R plus convivial, R et les interfaces graphiques disponibles
- Rstudio
- Logiciels connexes et documentation
- R et les statistiques
- Utiliser R de manière interactive
- Une session d'introduction
- Obtenir de l'aide sur les fonctions et les caractéristiques
- Commandes R, sensibilité à la casse, etc.
- Rappel et correction des commandes précédentes
- Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
- Permanence des données et suppression d'objets
Manipulations simples ; nombres et vecteurs
- Vecteurs et affectation
- Arithmétique vectorielle
- Génération de séquences régulières
- Vecteurs logiques
- Valeurs manquantes
- Vecteurs de caractères
- Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données
- Autres types d'objets
Les objets, leurs modes et leurs attributs
- Attributs intrinsèques : mode et longueur
- Modification de la longueur d'un objet
- Obtention et définition d'attributs
- La classe d'un objet
Facteurs ordonnés et non ordonnés
- Un exemple spécifique
- La fonction tapply() et les tableaux en escalier
- Facteurs ordonnés
Tableaux et matrices
- Les tableaux
- Indexation des tableaux. Sous-sections d'un tableau
- Indexation des matrices
- La fonction array()
- Arithmétique mixte des vecteurs et des tableaux. La règle de recyclage
- Le produit extérieur de deux tableaux
- Transposition généralisée d'un tableau
- Facilités Matrix.
- Multiplication Matrix
- Equations linéaires et inversion
- Valeurs propres et vecteurs propres
- Décomposition en valeurs singulières et déterminants
- Ajustement des moindres carrés et décomposition QR
- Formation de matrices partitionnées, cbind() et rbind()
- La fonction de concaténation, (), avec les tableaux
- Tableaux de fréquences à partir de facteurs
Deuxième jour
Listes et cadres de données
- Les listes
- Construire et modifier des listes
- Concaténation de listes
- Cadres de données
- Création de cadres de données
- attach() et detach()
- Travailler avec des cadres de données
- Attacher des listes arbitraires
- Gestion du chemin de recherche
Manipulation des données
- Sélection, sous-ensemble d'observations et de variables
- Filtrage, regroupement
- Recodage, transformations
- Agrégation, combinaison d'ensembles de données
- Manipulation de caractères, package stringr
Lecture des données
- Fichiers Txt
- Fichiers CSV
- Fichiers XLS, XLSX
- SPSS, SAS, Stata,... et autres formats de données
- Exporter des données vers des formats txt, csv et autres
- Access données provenant de bases de données à l'aide du langage SQL.
Distributions de probabilités
- R comme ensemble de tableaux statistiques
- Examen de la distribution d'un ensemble de données
- Tests à un et deux échantillons
Groupement, boucles et exécution conditionnelle
- Expressions groupées
- Instructions de contrôle
- Exécution conditionnelle : instructions if
- Exécution répétitive : boucles for, repeat et while
Troisième jour
Écrire ses propres fonctions
- Exemples simples
- Définition de nouveaux opérateurs binaires
- Arguments nommés et valeurs par défaut
- L'argument '...'
- Affectations au sein des fonctions
- Exemples plus avancés
- Facteurs d'efficacité dans la conception des blocs
- Suppression de tous les noms dans un tableau imprimé
- Intégration numérique récursive
- Champ d'application
- Personnalisation de l'environnement
- Classes, fonctions génériques et orientation objet
Analyse statistique en R
- Modèles de régression linéaire
- Fonctions génériques pour l'extraction d'informations sur les modèles
- Mise à jour des modèles ajustés
- Modèles linéaires généralisés
- Familles
- La fonction glm()
- Classification
- Régression logistique
- Analyse discriminante linéaire
- Apprentissage non supervisé
- Analyse des composantes principales
- Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)
- Analyse de survie
- Objets de survie en r
- Estimation de Kaplan-Meier
- Bandes de confiance
- Modèles PH de Cox, covariables constantes
- Modèles PH de Cox, covariables dépendantes du temps
Procédures graphiques
- Commandes de traçage de haut niveau
- La fonction plot()
- Affichage de données multivariées
- Affichage de graphiques
- Arguments des fonctions de traçage de haut niveau
- Graphiques de visualisation de base
- Relations multivariées avec le treillis et le paquetage ggplot
- Utilisation des paramètres graphiques
- Liste des paramètres graphiques
Rapports automatisés et interactifs
- Combiner les résultats de R avec du texte
- Création de documents html, pdf
Pré requis
Bonne compréhension des statistiques.
Nos clients témoignent (3)
Que Haytham a commencé par les bases et nous a donné suffisamment de temps pour faire les exemples et s'assurer que nous étions sur la même longueur d'onde avant de passer au sujet suivant.
Jaco Dreyer - Africa Health Research Institute
Formation - R Fundamentals
Traduction automatique
J'ai apprécié que ce soit très pratique, donc nous avions constamment l'occasion de mettre les mains dans le cambouis, plutôt que de simplement écouter un cours (par exemple). Je me sens maintenant capable de partir et de commencer à utiliser R, ce que je n'avais pas pu faire auparavant.
Kathy Baisley - Africa Health Research Institute
Formation - R Fundamentals
Traduction automatique
Jour 1 et Jour 2 étaient vraiment très simples pour moi et j'ai vraiment apprécié cette expérience.
Mareca Sithole - Africa Health Research Institute
Formation - R Fundamentals
Traduction automatique