Bases de données dédiées aux Big Data

Bases de données dédiées aux Big Data

Description des bases de données dédiées aux Big Data

 

Qu'est-ce qu'une base de données Big Data ?

Plus les Big Data prennent d'importance pour les organisations souhaitant proposer des informations pertinentes à leurs clients, plus il devient évident que les bases de données relationnelles (considérées comme la norme depuis 30 ans) ne sont plus adaptées à de tels besoins. C'est pourquoi plusieurs bases de données de type Big Data sont désormais disponibles. Bien que leurs technologies puissent varier, elles sont toutes conçues pour transcender les limites des bases relationnelles et permettre aux entreprises de profiter d'informations utiles.

CONDITIONS D'UTILISATION DES BASES DE DONNÉES BIG DATA

L'émergence de nouvelles bases de données est due à l'importance que revêtent les trois aspects caractérisant principalement les Big Data, à savoir leur volume, leur variété et leur vitesse.

  • Volume : comme leur nom l'indique, les Big Data se mesurent en volumes élevés (pétaoctets, exaoctets, voire zettaoctets). Les bases de données relationnelles doivent s'adapter en augmentant leurs capacités de stockage à l'aide de serveurs supplémentaires, mais ne sont pas conçues pour s'exécuter sur du matériel de base. Elles emploient en outre des techniques de sharding très complexes visant à distribuer les données sur divers serveurs. Leur évolutivité induit donc des coûts élevés en temps et en argent. Un système RAC d'Oracle peut, par exemple, coûter plusieurs millions en termes de stockage pour 20 téraoctets, ce qui représente parfois le volume de données traité en une seule journée par des organisations de taille importante. A contrario, les bases de données Big Data permettent de réduire les coûts liés à la scalabilité et simplifient les processus de réduction ou d'augmentation des capacités à l'aide de matériel de base peu onéreux et impliquant une implication minimale de la part du personnel.
  • Variété : autrefois, les données étaient structurées de façon à s'adapter au modèle peu flexible des bases relationnelles. L'avènement des Big Data est synonyme d'augmentation des données non structurées (messages sur les réseaux sociaux, images, vidéos, données temporelles et liées à l'Internet des objets, etc.), dont la croissance ne cesse pas. Seules des solutions provisoires et complexes permettent aux bases relationnelles de s'adapter à de telles données. Les bases de type Big Data n'ont pas ce problème, étant dotées de modèles de stockage flexibles, pensés pour la conservation et l'exploitation de toutes les données via diverses méthodes.
  • Vitesse : la vitesse constitue un aspect essentiel des Big Data. De nos jours, d'énormes volumes de données hétérogènes sont créés en continu et les clients s'attendent à ce que ceux-ci soient pris en compte, stockés et traités quasiment en temps réel. Cela s'applique tout particulièrement aux données temporelles et liées à l'Internet des objets. Incapables de gérer de tels volumes de données variées, les bases relationnelles peuvent présenter des baisses de performances, voire des interruptions d'activité. Les bases de type Big Data sont conçues pour prendre en charge de très nombreuses données de toutes sortes, sans que cela ait d'incidence sur leurs performances ou leur disponibilité.

AVANTAGES DES BASES DE DONNÉES BIG DATA

Les systèmes conçus pour prendre en charge les Big Data correspondent souvent à des bases de données NoSQL. Cela est dû au fait que le langage de requête SQL n'est pas forcément utilisé, ce qui les différencie des bases de données relationnelles. Différents types de bases de données NoSQL sont destinés à des usages distincts. Les plus courantes peuvent notamment être optimisées pour le traitement des documents, des données clé/valeur, des graphiques, des tables ou des données temporelles.Chacune présente des caractéristiques spécifiques, mais toutes permettent généralement de profiter des avantages suivants :

  • Scalabilité : les bases de données NoSQL permettent d'éviter les processus complexes et coûteux associés à l'adaptation des bases relationnelles. La capacité pouvant être augmentée ou réduite en fonction des besoins, les entreprises dotées de bases NoSQL sont en mesure de tirer le meilleur parti des Big Data.
  • Rentabilité : les bases NoSQL faisant usage de matériel de base peu onéreux, d'importantes économies peuvent être réalisées sur le long terme par rapport aux bases relationnelles, à mesure que la quantité de Big Data augmente. En outre, les organisations doivent uniquement déployer le matériel nécessaire pour répondre à leurs besoins, plutôt que d'effectuer des acquisitions préventives et coûteuses.
  • Flexibilité : les modèles fixes utilisés par les bases relationnelles empêchent les organisations développant des applications Web, mobiles ou liées à l'Internet des objets de s'adapter correctement à leurs besoins en termes de Big Data. Les bases de données NoSQL permettent aux développeurs d'utiliser les types de données et méthodes d'exploitation les mieux adaptés à leurs applications, et ainsi d'accélérer et de rendre la phase de développement plus agile.
  • Performances : comme mentionné précédemment, les bases relationnelles peuvent uniquement évoluer au prix de dépenses conséquentes et du sharding manuel. A contrario, les ressources ajoutées à une base de données NoSQL entraînent une augmentation proportionnelle des performances, permettant ainsi aux organisations de proposer des services à la qualité constante.
  • Haute disponibilité : les bases relationnelles se servent d'architectures primaires/secondaires complexes et susceptibles d'entraîner des défaillances. En revanche, certains systèmes NoSQL distribués assurent, grâce à des architectures sans maître qui répartissent automatiquement les données auprès de plusieurs ressources, que la base de données demeure disponible et capable de prendre en charge les opérations en lecture et en écriture relatives aux applications de type Big Data.

tier-1-line class=

RIAK KV RÉPOND AUX BESOINS LIÉS AUX BIG DATA

Les organisations souhaitant tirer le meilleur parti des applications Big Data peuvent opter pour Riak KV, une solution permettant de bénéficier d'une grande scalabilité, de performances rapides, d'une haute disponibilité et de modèles puissants pour le stockage des données non structurées.

Obtenez des informations supplémentaires sur Riak KV

RIAK TS RÉPOND AUX BESOINS LIÉS AUX DONNÉES TEMPORELLES ET À L'INTERNET DES OBJETS

Optimisé pour la lecture et l'écriture de données temporelles, Riak TS permet de simplifier les opérations des organisations souhaitant stocker, exploiter et analyser les données de capteurs intelligents, d'appareils divers ou liées à l'Internet des objets, ainsi que d'améliorer leur résilience et scalabilité.

Obtenez des informations supplémentaires sur Riak TS