Hive

A l’image de Pig, Hive permet l’écriture de tâche de traitement de données aux développeurs ne maîtrisant pas Java. Là où Pig définit un langage procédural permettant d’exploiter le cluster, Hive permet de définir des tables structurées de type SQL et de les alimenter avec des données provenant soit du cluster, soit de sources externes.
Une fois le schéma des tables définies et les données insérées, il est possible d’utiliser le langage HiveQL pour requêter ces tables. HiveQL a une syntaxe proche de SQL et permet de réaliser l’essentiel des opérations de lecture permettant de produire des analyses classiques (sélection de champs, somme, aggrégat, tri, jointure, …).
Le plus gros avantage de Hive est sa capacité à utiliser une compétence très répandue qu’est la connaissance de SQL rendant les développeurs très rapidement opérationnel pour extraire les données.

Détails de la solution
  • Version: 2.0.1
  • Distribuée par: Fondation (Apache )
  • Licence: Apache
  • Technologie: Java
  • Année de création :
Site web de la solution : Hive
http://hive.apache.org
SOLUTIONS EN RELATION