Skip to content

Apache Spark

Photo of Zohar Nissare-Houssen
Hosted By
Zohar N.
Apache Spark

Details

  • Français:

Après la vue d'ensemble sur Hadoop précédente, nous planifions une session dédiée à Apache Spark. Spark, qui est une plate-forme de traitement distribué de données, brille par sa performance, sa facilité d'utilisation, ainsi qu'un ensemble d'outils de plus haut niveau pour faciliter son usage. Grâce à son intégration sur Hadoop, Apache Spark s'impose de facto comme une alternative attractive par rapport à Map Reduce.

Cette présentation sera dédiée à Spark, avec une revue de son architecture, ses composants, son fonctionnement ainsi que son intégration sur Hadoop. Une démonstration sera faite en fin de session à partir d`un Lab. Nous essayerons dans la mesure du possible de partager les instructions du Lab à l`avance pour ceux qui souhaitent le faire durant la session.

Cette session est de niveau introductive sur Spark. Elle sera bénéfique à l`ensemble des participants qui ont assisté à la première session de ce Meetup sur Hadoop, et aussi ceux familiers avec Hadoop, ou en général familiers avec la problématique de traitement de données massives à des fins analytiques (R, bases de données MPP).

Le matériel sera en Anglais. La présentation sera faite en Français. L`interaction avec le présentateur et les discussions peuvent être faites en Anglais ou Français selon votre préférence.

  • English:

After the initial Hadoop overview, we are planning a session on Apache Spark. Spark, as an engine for large scale data processing, is shining by its speed, its ease of use, and a set of higher level tools to facilitate its use. With its integration on Hadoop, Apache Spark is seen as the de facto alternative to Map Reduce.

This presentation will focus on Spark, with a review of its architecture, its components, its operation, as well as its integration on Hadoop. A demo will be done at the end of the session based on a Lab. We will try our best to share the instructions for the Lab in advance for those who are willing to do it during the session.

This session is of an introductory level on Spark. It will be beneficial to the audience who attended the first session on Hadoop, as well as those familiar with Hadoop, or generally familiar with the problematic of big data processing for analytics purpose (R, MPP databases).

The material will be in English. The presentation will be in French. Interaction with the speaker, and discussions can be held in either English or French according to your preference.

Photo of Data, Cloud and AI in Montreal group
Data, Cloud and AI in Montreal
See more events