Base de données HANA : comment maîtriser la croissance des données |SAP Data Management

27-11-2023 | 6 lecture minimale | Gestion des données pour la migration S/4HANA, Gestion des données SAP

L’auteur : Jérôme Phillippe, Chef de projet et consultant senior SAP ILM chez TJC Group

Le dimensionnement efficace de la base de données HANA est un aspect essentiel de la mise en œuvre de SAP S/4HANA, qui permet d’assurer un fonctionnement harmonieux et d’éviter les pièges. Dans cette discussion, nous explorons l’importance de la gestion de la mémoire dans HANA, les méthodes de gestion de la croissance de la base de données et les stratégies d’optimisation des coûts de l’environnement SAP.

Le dimensionnement de la base de données HANA est une étape cruciale de la mise en œuvre de SAP S/4HANA. Si une base de données classique « devient lente lorsque la croissance des données est incontrôlable », la base de données HANA cessera tout simplement de fonctionner ! Une approche simplifiée du calcul des besoins en mémoire consiste à estimer le volume et la croissance des données pour les années à venir, puis à doubler le résultat (2 To de mémoire pour 1 To de données). L’épuisement de la mémoire HANA peut entraîner des mises à niveau complexes – la mise à niveau de la licence n’est pas chose aisée – et une augmentation des coûts de licence. C’est pourquoi il est essentiel de maîtriser la croissance du volume de données.

Comment les données sont-elles gérées en mémoire ? Quelles sont les méthodes à mettre en place pour maîtriser la croissance de la base de données et, par conséquent, tempérer les coûts du paysage SAP ? Voyons cela ensemble.

Il est essentiel de comprendre comment les données sont gérées en mémoire. La base de données SAP HANA prend en charge deux types de tableaux : les tableaux de lignes et les tableaux  de colonnes. Chaque tableau est chargé sur son propre « magasin » et donc géré différemment. SAP HANA est optimisé pour le stockage en colonnes et c’est le type de tableau par défaut dans SAP S/4HANA.

  • Magasin de lignes

Il s’agit d’un processus assez simple. Tous les tableaux de lignes sont chargés en permanence dans la mémoire. Si vous souhaitez réduire l’impact sur la mémoire HANA, vous devez réduire la taille des tableaux. Pour certains tableaux techniques, des opérations régulières de nettoyage sont nécessaires pour éviter l’augmentation du volume de données.

Pour les tableaux fonctionnels (et certains tableaux techniques), l’archivage des données est tout à fait logique, car il permet de réduire considérablement le volume de données sur le système sans créer de problèmes lors de l’accès aux données.

  • Magasin de colonnes

Les tableaux de colonnes sont fortement compressés. Des taux de compression élevés peuvent être atteints parce que la majorité des colonnes ne contiennent que quelques valeurs distinctes (par rapport au nombre de lignes).

Les tableaux de colonnes sont chargés à la demande (ou, au mieux, partiellement). Pourquoi s’en préoccuper ? Chaque fois qu’une mise à jour (un ajout ou une suppression) est effectuée dans un tableau de colonnes, la mise à jour est écrite dans un tableau temporaire (appelé tableau delta). Après un certain temps ou une fois atteint une certaine quantité de données, le tableau d’origine est mis à jour avec les données du tableau delta. Toutefois, pour cette opération, une double mémoire est nécessaire (tableau de colonnes + tableau delta).

Dans l’ensemble, les tableaus de colonnes augmenteront au fil du temps pour soutenir l’expansion de l’entreprise. Pour plus d’informations, consultez le Guide d’administration SAP HANA pour le service SAP HANA : https://help.sap.com/docs/HANA_SERVICE_CF/6a504812672d48ba865f4f4b268a881e/bd2e9b88bb571014b5b7a628fca2a132.html

Pour faire face à la croissance des tableaux, plusieurs stratégies peuvent être employées :

  • Prendre en considération le vieillissement des données : Cette stratégie consiste à supprimer de la mémoire principale de HANA une partie des données stockées dans la base de données SAP HANA. Veuillez noter que le vieillissement des données est irréversible et n’est plus recommandé par SAP (note 2869647).  La prudence est de mise en raison des complications potentielles, car il n’y a pas de retour en arrière possible.
  • Procéder à une maintenance régulière : Des opérations de maintenance régulières sont essentielles pour les tableaux de ligne afin d’éviter l’augmentation du volume de données et de garantir une gestion efficace de la base de données. Ces opérations comprennent de nombreux petits travaux relevant de l’agenda du gestionnaire de la base de données, tels que le nettoyage des anciennes données, le nettoyage des tables, etc.
  • Native Storage Extension (NSE) : Pour les données techniques et les données d’enregistrement, il est recommandé d’utiliser directement NSE. En bref, les données des tableaux sont classées en trois catégories de température – Hot, Warm et Cold – chacune d’entre elles étant chargée/déchargée (ou non) dans la mémoire d’une manière différente dans un cache tampon dédié (note SAP 2799997). L’administrateur de la base de données peut décider, après analyse, de mettre en place le NSE pour un tableau, une colonne individuelle ou une partie de tableau. Il convient de noter que le NSE peut être facilement annulé, si nécessaire. Cette option convient aux données dont on n’a pas besoin au quotidien, mais seulement de manière occasionnelle.
  • Le partitionnement des tableaux de colonnes : La division de grands tableaux de colonnes en partitions plus petites et plus faciles à gérer, sur la base d’une clé spécifique, permet d’optimiser l’utilisation de la mémoire. Toutefois, le succès dépend de la précision des spécifications de partitionnement – ce que nous appelons « la clé ». Si les requêtes de l’utilisateur correspondent à la clé donnée, il est possible de déterminer les partitions spécifiques qui contiennent les données recherchées et d’éviter d’accéder aux partitions inutiles et de les charger en mémoire. Au contraire, si la requête est basée sur une sur-sélection (ce qui correspond au type de document), toutes les partitions seront chargées en mémoire.
  • Procéder à l’archivage des données : Lors de l’archivage, les données sont retirées du disque dur, ce qui empêche les données de remonter dans la mémoire, à moins que vous ne le décidiez. Les données archivées sont retirées de la base de données et stockées dans un système de fichiers, qui est un stockage différent. Elles peuvent également être stockées dans un conteneur externe lié au système. Dans l’ensemble, il s’agit d’un stockage beaucoup moins coûteux. Il est, par ailleurs, rentable.

Lors de l’archivage des données, les utilisateurs professionnels ne perdent pas l’accès aux données, bien au contraire. Les données archivées restent disponibles pour un affichage lors des transactions habituelles (par exemple les transactions fiscales et d’audit). Les données sont stockées à un autre endroit, dans un autre format, mais restent accessibles comme auparavant.

L’administrateur de la base de données conserve le contrôle de la croissance des données sur disque et en mémoire et peut continuer à fournir un niveau de service élevé aux utilisateurs.

Le département informatique contrôle le coût du matériel et des licences, quelle que soit la croissance de l’entreprise. Par exemple, si vous disposez d’une licence de 1 To, lorsque vous la dépassez, l’étape suivante consiste à acheter un autre To de mémoire, ce qui représente une augmentation considérable. En effet, il n’est pas possible d’acheter 1,5 To ou 1,2 To. Le lecteur comprendra que dans SAP ECC, avec les bases de données Oracle, il était possible d’acheter des unités de stockage plus petites.

SARA est la principale transaction pour larchivage des données. En d’autres termes, SARA est presque un synonyme d’« archivage ». Il y a quelques années, je me souviens avoir lu un titre qui a retenu mon attention dans un article de blog :

« HANA tuera SARA

Aujourd’hui, nous savons avec certitude que ce n’est pas le cas, principalement parce que le vieillissement des données n’a pas tenu ses promesses. L’archivage des données (avec ou sans ILM) reste le moyen le plus efficace de gérer le cycle de vie de l’information. C’est pourquoi je propose un nouveau mantra :

« HANA attend SARA avec impatience ».

La réduction du volume de données à l’aide de l’archivage et de SAP ILM devrait être une phase cruciale de toute stratégie de préparation des données lors de la préparation de la migration S4/HANA. Elle permet de réduire l’empreinte des données et la taille de la mémoire du serveur de base de données SAP HANA.

Profitez des conseils d’experts en archivage de données SAP et en ILM pour préparer et gérer les données en vue du passage à S/4HANA.l