Plan du cours

Introduction à Apache Kylin

  • Aperçu de l'OLAP et son importance dans l'analyse des grands volumes de données
  • Évolution de Apache Kylin et sa structure architecturale
  • Fonctionnalités clés et capacités de Kylin 50

Configuration de Apache Kylin

  • Prérequis d'installation et configuration de l'environnement
  • Configuration de Kylin avec Hadoop, Spark et Kafka
  • Comprendre l'interface web de Kylin et les outils en ligne de commande

Mise en modèle des données dans Kylin

  • Conception de schémas étoile et flocon pour les cubes OLAP
  • Définition des dimensions et mesures
  • Création et gestion des modèles de données via l'interface web de Kylin

Construction et Gestion des Cubes

  • Processus de construction des cubes et gestion des tâches
  • Constructions incrémentales et stratégies d'auto-fusion
  • Surveillance de la santé et des performances des cubes

Analyse en Temps Réel avec Kylin

  • Intégration de Kafka comme source de données en flux continu
  • Configuration de cubes en temps réel et modèles de fusion
  • Achats d'analytiques à faible latence avec des données en flux continu

Interrogation et Analyse

  • Exécution de requêtes SQL via l'interface d'interrogation de Kylin
  • Connexion des outils BI (par ex., Tableau, Power BI) à Kylin
  • Réalisation d'analyses multidimensionnelles et drill-downs

Optimisation des Performances

  • Bonnes pratiques pour la conception de cubes et l'agrégation
  • Gestion et ajustement des ressources pour une meilleure échelle
  • Dépannage des problèmes de performance courants

Sujets Avancés

  • Sécurité et contrôle d'accès dans Kylin
  • Extension de Kylin avec des plugins personnalisés et intégrations
  • Exploration des API REST de Kylin pour l'automatisation

Récapitulation et Étapes Suivantes

Pré requis

  • Une compréhension des Hadoop et des écosystèmes de big data
  • Familiarité avec les concepts de SQL et des entrepôts de données
  • Connaissances de base sur les plateformes de données en flux comme Kafka

Public cible

  • Ingénieurs big data cherchant à mettre en œuvre des solutions d'analyse en temps réel
  • Analystes de données visant à exploiter les capacités OLAP sur des jeux de données volumineux
  • Architectes d'entrepôts de données intéressés par la modernisation de leur infrastructure
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires