PerfUG : Hadoop et HDFS : Stockage, Requêtage et Performances


Details
Hadoop (http://hadoop.apache.org/) est principalement utilisé pour le monde batch. Le paradigme MapReduce (http://fr.wikipedia.org/wiki/MapReduce) sur Hadoop ne propose pas de transformation ou de requêtage performant mais plutôt un traitement d'une forte volumétrie de données.
Cependant, la performance n'est pas à négliger dans certains cas :
• lorsque la fenêtre de traitement des données devient serrée pour fournir des données à jour
• des besoins de requêtages ponctuels par des analystes peuvent arriver au travers d'outils type Hive (http://hive.apache.org/) ou Pig (http://pig.apache.org/).
Il devient nécessaire de fournir ces données dans un temps de requêtage supportable à l'échelle humaine.
Cette session permet d'introduire les basiques d'Hadoop (http://hadoop.apache.org/) et de HDFS ainsi que des astuces de performance sur le stockage, le requêtage (Hive, MapReduce) ainsi que sur du paramétrage.
Le speaker de cette session est Sofian Djamaa (https://twitter.com/sdjamaa), Software Engineer chez Criteo (http://www.criteo.com/fr/criteo).
Attention : le nombre de places étant limitées, nous vous demandons de ne réserver qu'une place par personne et d'annuler votre inscription si vous deviez vous désister.En cas de dépassement du nombre de billets émis, une liste d'attente sera mise en place.

PerfUG : Hadoop et HDFS : Stockage, Requêtage et Performances