Informatique et Techniques Numériques en Economie
-
TD 4 - OLAP : Schéma étoile

<< précédent index suivant >>

Présentation générale

L'objectif de ce TD est de comprendre l'intérêt de OLAP (On Line Analytical Processing) qui est une représentation multi-dimensionnelle d'une base de donnée. Ce premier TD se concentre sur la représentation des données avec un schéma étoile.

Compétences à acquérir au cours du TD



1- Premier exemple: un vendeur de chaussures

Proposez un schéma étoile pour un vendeur de chaussures qui souhaite analyser les ventes de ses produits par mois.

Quelle est la base relationnelle sous jacente ?

Si le vendeurs possède plusieurs magasins, comment modifier le schéma pour faire une analyse par magasin ?

Comment modifier le schéma s'il souhaite réaliser une analyse soit par mois soit par semaine ?

Cet exemple est très largement inspiré de l'excellente page de Bernard Lupin, OLAP par l'exemple, que je vous recommande.


2- Deuxième exemple: gestion des étudiants

Proposez un schéma qui permette d'étudier les résultats aux examens des étudiants. On connaît l'age et le sexe des étudiants, le nom du cours (les cours peuvent être regroupés en cours obligatoire et cours à option), la date d'examen et si l'examen est obtenu ou non



3- Troisième Exemple: investissement en capital-risque

Proposez un schéma qui permette d'analyser les propriétés des investissements en capital-risque dans le monde. Les investissements sont réalisés dans différents pays regroupés en regions mondiales (Amérique du nord, Europe, Moyen-orient), dans des start-ups qui opèrent dans différentes industries. Les start-ups sont classées par industries dans une hiérarchie à trois niveaux (groupe, segment, code). Les montants investis sont connus.



4- Création du cube pour l'analyse de vos données commerciales

Proposez un schéma étoile pour votre site commercial. Puis publiez-le sur le serveur Pentaho avec CubeDesigner.

Indications pour CubeDesigner

  1. Créez un nouveau cube avec "File/New Cube Schema"
  2. Donnez un nom à votre cube : votre-login
  3. Définissez votre source de donnée en cliquent sur le bouton "Add" sous "Select Data Source" et remplissez les champs comme suit [voir]:
  4. JNDI Name: votre-login

    Driver: com.mysql.jdbc.Driver

    Connect String: jdbc:mysql://80.248.218.86/votre-login

    Username: votre-login

    Password: votre-password

    La source de données définit le nom de la base de données sur le serveur www.up2.fr (adresse IP=80.248.218.86) et le nom de l'utilisateur. Une fois tout rempli, vous pouvez tester la connection. En cas de succès le message suivant doit apparaître : "Connection was successful".

  5. Vous pouvez alors passez à l'étape suivante (bouton "Next").
  6. L'étape 2 vous permet de sélectionner les tables à prendre en compte pour générer le cube olap [voir].
  7. Faites glisser vos tables dans l'espace de travail.

    Liez vos tables en faisant glisser le symbole "clé primaire" (vous devez avoir défini une clé primaire avec phpmyadmin) vers le champ correspondant de la table de liaison.

    Sélectionnez les champs que vous voulez utiliser en cochant les cases.

  8. L'étape 3 vous permet de définir les mesures [voir].
  9. Choississez la table qui contient les mesures.

    Choississez les champs qui correspondent au mesure, clickez sur la flèche "===>" et editer la mesure de façon à utilsier l'aggregation qui convient (et a avoir un nom pratique).

  10. L'étape 4 vous permet de définir les dimensions [voir].
  11. Sélectionner un à un les champs qui correspondent aux dimensions et clickez sur le bouton "Add Dimension".

    Renommer les dimensions de façon à éviter les "." dans les noms.

  12. L'étape 5 permet de visualiser un fichier XML, qui représente le schéma OLAP. Le copier et le coller dans "OLAP schema uploader" du menu Outils.