Pour continuer notre série sur l’univers de la data dans sa globalité, aujourd’hui nous nous intéressons aux Data Warehouse, aussi appelés « entrepôts de données ». Il s’agit de bases de données dans lesquelles sont stockées des données en générale historiques et de manière structurées afin de pouvoir les exploiter par la suite.

C’est quoi ?

Il s’agit d’une base de données relationnelle qui est pensée pour servir la business intelligence et aider aux prises de décisions après analyse des données. Les informations qui y sont stockées permettent d’avoir une vue plus globale de l’ensemble des transactions qui ont été effectuées dans l’historique de l’entreprise.

Il s’agit en général d’un environnement assez complet qui peut comprendre un outil d’extraction (ETL) de chargement des données, de transport et de transformation.

C’est grâce à cela que les analystes et les décideurs peuvent ensuite mener une réflexion avec les données récoltées et construire un modèle d’étude et de prospective afin de limiter les incertitudes dans le processus, et éviter une perte de temps et parfois de moyens importante.

A l’intérieur des Data Warehouse les informations sont classées par sujets, il est donc facile de trouver l’information que l’on veut à partir du moment ou l’on sait ce que l’on souhaite obtenir et faire évoluer au sein de l’entreprise.

 

Quels données y sont stockées ?

Les données y étant stockées sont séparées des systèmes opérationnels et sont disponibles et accessibles pour les requêtes. Elles sont stockées par catégories et sont nommées de façon consistante, elles sont aussi associées à des périodes définies dans le temps. Pour finir, les données une fois stockées ne peuvent être soumises à aucune mise à jour, on dit qu’elles sont statiques ou non volatiles.

Les 4 caractéristiques

  • Les données intégrées : Elles proviennent de sources hétérogènes qui ont chacune leurs formats, et avant toute utilisation, elles sont intégrées en amont.
  • Données non volatiles : En plus du fait que les données ne sont pas changées au fur et à mesure du temps, elles ne disparaissent pas.
  • Données orientées : Les données sont organisées en fonction de leurs thèmes.
  • Données historisées : En plus d’être non volatiles elles sont horodatées. Grace à cela il est possible de voir l’évolution temporelle des valeurs.

 

Les différents types de Data Warehouse

Comme pour les caractéristiques, il y en a quatre. Les SGBD, ou systèmes de gestion des bases de données sont répertoriées en :

  • Relationnelles traditionnels
  • Les Data warehouse Appliance
  • Data Warehouse Cloud
  • SGBD relationnelles spécialisées

La SGBD relationnelle est celle qui est le plus communément utilisée, mais elles ont toute un intérêt particulier et des spécificités qui leur sont propres et qui apportent parfois de gros avantages quand aux usages que l’on souhaite en faire.

Il existe cependant de plus en plus de solutions dites « hybrides » qui intègrent en leur sein différentes capacités de stockages et des accès aux données pour les données structurées ou non structurées. En plus de cela, ces différents types de Data Warehouse peuvent être déployés de façons différentes, en individuel ou combinés.

Les avantages de la Data Warehouse

Les entreprises qui utilisent la Data Warehouse l’utilisent car c’est une manière pratique d’avoir une vision d’ensemble sur le passé de l’entreprise sans pour autant impacter les actions qui sont effectuées tous les jours. C’est grâce à cela qu’elles ajustent leurs opérations et peuvent gagner en efficience, évidemment dans le but d’améliorer leurs revenus et d’augmenter les bénéfices.

Un de ses nombreux avantages aussi est de séparer le processus d’exploitation du processus analytique ce qui a pour effet d’améliorer les performances dans ces deux domaines respectifs.

 

Pourquoi les entreprises l’utilisent ?

Les entreprises utilisent la Data Warehouse afin d’améliorer, de gérer et suivre plus précisément les performances de leur entreprise, par la suite elle sert à prendre des directives efficaces pour le lancement d’une campagne ou tout simplement rectifier le tir quand l’entreprise se rend compte qu’elle est partie dans une mauvaise direction.

Au vu des différents types de Data Warehouse et des possibilités multiples qu’ils offrent aux entreprises, cela peur permet aussi de lier des informations qui auraient un intérêt à être exploitées en commun. La relation client est aussi améliorée e et les données récoltées sont souvent plus pertinentes.