jeudi, mai 21, 2009
Tutorial Pentaho
1. Introduction
Je montrerai dans ce post comment créer un cube OLAP avec Pentaho sur une base MySQL. La base utilisée sera Sakila, une base d'exemple de MySQL.
L'OS utilisé est Ubuntu 9.04 - Jaunty Jackalope, mais les instructions sont facilement transposable à windows.
2. Prérequis
Java doit être installé, et la variable d'environnemnet JAVA_HOME correctement configuré.
Exemple, le fichier .bashrc doit contenir une ligne semblable a :
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk/
ou
export JAVA_HOME=/usr/lib/jvm/java-6-sun
3. Installation de Pentaho
Sur le site de la communauté Pentaho, il s'agit de télécharger la plateforme BI : biserver-ce-CITRUS-M3.tar.gz
Décompresser l'archive et lancer dans un terminal
pentaho/biserver-ce-CITRUS-M2/start_pentaho.sh
Cela a pour action de démarer le serveur web TomCat (livré dans l'archive) et le moteur OLAP Mondrian.
Si tout se passe sans erreur, alors le portail Pentaho est accessible à l'adresse suivante:
http://localhost:8080/pentaho
Le portail contient un exemple complètement fonctionnel fonctionnant avec des données sur une base hsqldb. Choisir le menu "New Analysis View" et s'identifier par exmple avec l'utilisateur joe (le mot de passe est préenregistré).
4. Administration
Pentaho est livré avec un site d'administration à part.
Dans le répertoire biserver-ce-CITRUS-M2/administration-console02, lancer start.sh.
Le site d'administration est alors disponible à l'adresse http://localhost:8099
Par défaut, le login est "admin" et le mot de passe "password".
Ajouter un nouvel utilisateur ainsi qu'une connexion à la base de données sur laquelle le cube doit être branché.
5. Configuration base de données.
Création de la base d'exemple Sakila sur MySQL. Téléchargement et instruction d'installation ici.
Dans la console d'adminstration Pentaho, créer un nouveau Data Source.
Name : Sakila
Driver class : com.mysql.jdbc.Driver
URL : jdbc:mysql://127.0.01:3306/sakila
6. Conception du cube
La conception des cubes Pentaho se fait avec l'utilitaire Schema Workbench, disponible en téléchargement dans la partie "Mondrian (Analysis) > Released builds". Le fichier à télécharger est psw-ce-[version].tar.gz
Workbench est livré sans driver Jdbc, il faut les copier dans:
schema-workbench/drivers
Le drvier Jdbc pour MySql est livré avec le serveur BI. Il suffit de le copier depuis biserver-ce-CITRUS-M2/administration-console/jdbc/mysql-connector-java-5.X.X.jar
Dans Workbench, la première chose à faire est de configurer la connection à la base dans le menu Tools > Connection
Driver class name : com.mysql.jdbc.Driver
URL : jdbc:mysql://127.0.01:3306/sakila
La création des schéma Mondrian est décrite ici.
Pour un exemple de schéma, créer le fichier sakila.xml avec le contenu suivant et le charger dans Workbench :
7. Publication
Dans workbench : File > Publish
Utiliser l'utilisateur créer dans la console d'administration (paragraphe 3).
Le mot de passe de publication est par défaut vide, et sinon présent dans le fichier publisher_config.xml dans pentaho-solutions/system
Choisir un espace de publication et Data Source : Sakila, puis bouton "Publish"
En cas d'erreur "password invalid", rafraîchir les environnements dans la console d'administration, ou redémarrer pentaho le cas échéant. (stop-pentasho.sh / start-pentaho.sh)
En se reconnectant au portail Pentaho > New analysis view, le data source "Sakila" est maintenant disponible. Choisir le cube Rental.
http://mondrian.pentaho.org/
Je montrerai dans ce post comment créer un cube OLAP avec Pentaho sur une base MySQL. La base utilisée sera Sakila, une base d'exemple de MySQL.
L'OS utilisé est Ubuntu 9.04 - Jaunty Jackalope, mais les instructions sont facilement transposable à windows.
2. Prérequis
Java doit être installé, et la variable d'environnemnet JAVA_HOME correctement configuré.
Exemple, le fichier .bashrc doit contenir une ligne semblable a :
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk/
ou
export JAVA_HOME=/usr/lib/jvm/java-6-sun
3. Installation de Pentaho
Sur le site de la communauté Pentaho, il s'agit de télécharger la plateforme BI : biserver-ce-CITRUS-M3.tar.gz
Décompresser l'archive et lancer dans un terminal
pentaho/biserver-ce-CITRUS-M2/start_pentaho.sh
Cela a pour action de démarer le serveur web TomCat (livré dans l'archive) et le moteur OLAP Mondrian.
Si tout se passe sans erreur, alors le portail Pentaho est accessible à l'adresse suivante:
http://localhost:8080/pentaho
Le portail contient un exemple complètement fonctionnel fonctionnant avec des données sur une base hsqldb. Choisir le menu "New Analysis View" et s'identifier par exmple avec l'utilisateur joe (le mot de passe est préenregistré).
4. Administration
Pentaho est livré avec un site d'administration à part.
Dans le répertoire biserver-ce-CITRUS-M2/administration-console02, lancer start.sh.
Le site d'administration est alors disponible à l'adresse http://localhost:8099
Par défaut, le login est "admin" et le mot de passe "password".
Ajouter un nouvel utilisateur ainsi qu'une connexion à la base de données sur laquelle le cube doit être branché.
5. Configuration base de données.
Création de la base d'exemple Sakila sur MySQL. Téléchargement et instruction d'installation ici.
Dans la console d'adminstration Pentaho, créer un nouveau Data Source.
Name : Sakila
Driver class : com.mysql.jdbc.Driver
URL : jdbc:mysql://127.0.01:3306/sakila
6. Conception du cube
La conception des cubes Pentaho se fait avec l'utilitaire Schema Workbench, disponible en téléchargement dans la partie "Mondrian (Analysis) > Released builds". Le fichier à télécharger est psw-ce-[version].tar.gz
Workbench est livré sans driver Jdbc, il faut les copier dans:
schema-workbench/drivers
Le drvier Jdbc pour MySql est livré avec le serveur BI. Il suffit de le copier depuis biserver-ce-CITRUS-M2/administration-console/jdbc/mysql-connector-java-5.X.X.jar
Dans Workbench, la première chose à faire est de configurer la connection à la base dans le menu Tools > Connection
Driver class name : com.mysql.jdbc.Driver
URL : jdbc:mysql://127.0.01:3306/sakila
La création des schéma Mondrian est décrite ici.
Pour un exemple de schéma, créer le fichier sakila.xml avec le contenu suivant et le charger dans Workbench :
<?xml version="1.0"?>
<Schema name="Sakila">
<Cube name="Rental" defaultMeasure="Rental Counts">
<Table name="rental" />
<Dimension name="Customers" foreignKey="customer_id">
<Hierarchy hasAll="true" allMemberName="All Customers" primaryKey="customer_id">
<Table name="customer" />
<Level name="Active" column="active" uniqueMembers="false">
<NameExpression>
<SQL dialect="mysql">
(case when `customer`.`active` = 0 then 'Not Active' else 'Active' end)
</SQL>
</NameExpression>
</Level>
<Level name="Name" column="customer_id" uniqueMembers="true">
<KeyExpression>
<SQL dialect="mysql">
CONCAT(`customer`.`first_name`, ' (', `customer`.`email`, ')')
</SQL>
<SQL dialect="generic">
</SQL>
</KeyExpression>
</Level>
</Hierarchy>
</Dimension>
<Measure name="Rental Counts" column="rental_id" aggregator="count"
formatString="#,###"/>
</Cube>
</Schema>
7. Publication
Dans workbench : File > Publish
Utiliser l'utilisateur créer dans la console d'administration (paragraphe 3).
Le mot de passe de publication est par défaut vide, et sinon présent dans le fichier publisher_config.xml dans pentaho-solutions/system
Choisir un espace de publication et Data Source : Sakila, puis bouton "Publish"
En cas d'erreur "password invalid", rafraîchir les environnements dans la console d'administration, ou redémarrer pentaho le cas échéant. (stop-pentasho.sh / start-pentaho.sh)
En se reconnectant au portail Pentaho > New analysis view, le data source "Sakila" est maintenant disponible. Choisir le cube Rental.
http://mondrian.pentaho.org/
Abonnement Articles [Atom]