• Big Data Madrid: Mesos Session

    La Nave

    Hi Big Data Madrid Lovers!! The next meetup will take place on September 18th and this time we will have the visit of Denis Jannot from Mesosphere. The meetup will take place in La Nave ( Calle Cifuentes nº5) Author: Denis Jannot Position: Sales Engineer EMEA at Mesosphere Title/abstract: How to build a secure (TLS and Kerberos) Machine Learning Pipeline with Mesosphere DC/OS, Apache NIFI, Kafka, HDFS, Spark and use Jupyterlab to provide a nice user experience. My bio: Denis is a passionate technologist, working on innovative projects leveraging various technologies (Mesos, Kubernetes, Kafka, Spark, ...). Here is the agenda: Mesosphere DC/OS overview Challenges when trying to build a secure ML pipeline Demo of a Twitter sentiment analysis pipeline with the following high level design: Apache NIFI is used to listen the the Twitter Streaming API Apache NIFI persist the tweets in HDFS and produce them in a Kafka topic A Jupyter notebook is used to create a model using Spark and the tweets stored in HDFS Another Jupyter notebook is used to apply the model to the tweets consumed from Kafka I think the total duration will be around 1h30, plus probably 30 minutes to socialize We will have time to talk and eat. The talk will start at 19:00h and finish at 21.00h Hope to see you there!!

    8
  • Big Data and Data Science Intro and Use Cases

    Imaguru Madrid

    Big Data Madrid tiene el privilegio de estar colaborando con Imaguru en un evento sobre las nuevas tecnologías de las que todo el mundo está hablando: Big Data, Inteligencia Artifical y Blockchain entre otros. Imaguru es una prestigiosa academia de programación en Minsk que está revolucionando el mundo de las startups tecnológicas con sus programas aceleradores, desde Belarus, el primer país en legalizar las ICOs, transacciones e ingresos derivados de su actividad, incluyendo el minado. Se trata de una charla introductoria y la inscripción se tendrá que hacer a través de la web de Imaguru: http://imaguru.es/event/big-data-data-science-intro-use-cases/ Nuestras disculpas por el corto plazo de aviso. Es importante destacar que todo el evento será EN INGLÉS.

  • Graph Analytics (hands-on) + Neo4j gRaphs (intro)

    Auditorio Campus Madrid - https://goo.gl/maps/qkB8yXMLKyk

    A joint meetup with R-Ladies Madrid https://www.meetup.com/rladies-madrid , Big Data Madrid https://www.meetup.com/Big-Data-Madrid/ , Neo4j España https://www.meetup.com/graphdb-spain/ and Big Data Spain https://www.meetup.com/BigDataSpain/ Help us prevent the duplication of the lists of attendees of the co-hosting meetup groups: if you are a member of more than one, please confirm your attendance to ONLY one of them. Attendees showing up 15 minutes past the starting time might not be granted the access to the venue. The conducting language of both sessions will be English. ## Neo4j gRaphs - 25 minutes * Abstract: Working with new databases may be somehow scaring, but don't be afraid! Are you used to working with R? Then the package RNeo4j and some R graph packages are here to help you. Treat Neo4j results like R objects, work with them in your environment and send your results. An introduction to Neo4j with a Neo4j+R workflow. * Bio: Bea Hernández @Chucheria is a Data Scientist at DatMean where she finds patterns and relations between online consumers. She also co-organizes R-Ladies Madrid and is a member of the NASADatanauts. ## Graph Analytics - 50 minutes * Format of the session: Combination of slides + hands-on example using interactive guide on Neo4j (local or sandbox) * Abstract: In summer 2017, Neo4j released its first set of graph algorithms designed to help organizations understand their graphs at a global level. This session will discuss the algorithms for community detection, centrality and pathfinding. These complement long-standing graph navigation and traversal functions of which Neo4j is known. This growing graph analytics library is sure to become a foundation for your data science and development work. In the meetup, we will explain the concepts and we'll use a public dataset to run a hands-on step by step example to demonstrate them. * Bios: Mark Needham is a graph advocate and developer relations engineer for Neo Technology, the company behind the Neo4j graph database. As a developer relations engineer, Mark helps users embrace graph data and Neo4j, building sophisticated solutions to challenging data problems. Mark previously worked in engineering on the clustering team, helping to build the Causal Clustering feature released in Neo4j 3.1. Mark writes about his experiences of being a graphista on a popular blog at markhneedham.com. He tweets at @markhneedham. Jesús Barrasa is an engineer based in London. He's currently heading Neo4j's, Global Telecom Practice where his mission is to get all Telcos in the world getting value from graphs with Neo4j. He combines over 15 years of professional experience in consulting in the Information Management space. Prior to joining Neo Technology, Jesús worked at Ontology (now EXFO) for seven years, where he got the first-hand experience with large graph DB deployments in many successful projects for major Telecommunications companies all over the world. Jesús holds a PhD in Computer Science from the Technical University of Madrid, where he carried out his research on graph data modelling and Semantic Technologies. He blogs at https://jesusbarrasa.wordpress.com/ and tweets occasionally at @BarrasaDV ## Networking - 30 to n+30 minutes at will Sponsored by Neo4j, we'll meet at a nearby bar (to be announced at the end of the last session) and reflect upon what we learnt and how it feels to be a graphista :)

  • ¿Quieres Big Data? Únete a nosotros!!

    Auditorio Campus Madrid - https://goo.gl/maps/qkB8yXMLKyk

    Buenas Big Dateros!! Tenemos siguiente Meetup el próximo Viernes en el Auditorio de Campus Google y no hay excusas para no asistir!! En esta ocasión tendremos dos charlas con ponentes de primera! Agenda: "Big Data & Machine Learning: vista y perspectivas desde el Silicon Valley” Fernando Rodríguez es un desarrollador e instructor con más de 20 años de experiencia y es el Chief Learning Officer de Keepcoding. Sus cursos han sido mencionados en Financial Times, Venture Beat e Information Week. Entre las empresas de las que ha formado parte, se encuentran Facebook, IBM, Unisys, Telefónica (en España) y más. Keepcoding es la primera aceleradora profesional para desarrolladores y crea el equivalente tecnológico a un MBA para desarrolladores. Recientemente ha sido seleccionada, entre 300 empresas, como una de las 12 para la aceleradora Woman Startup Lab en Palo Alto. "Big Data 101: Iniciándonos en el mundo de los datos" Celeste Durán es Arquitecto Big Data en Datatons, diseña e implementa infraestructuras de grandes volúmenes de datos, actualmente participa en proyectos internacionales gestionando múltiples cluster en EEUU y Europa. Os esperamos a todos para como siempre aprender y compartir experiencias, también tendremos alguna sorpresa para los asistentes!! Y tu, ¿Te vas a quedar con las ganas de aprender Big Data?

    21
  • III Workshop: relacionando Hadoop con BBDD clásicas

    Campus Café (Google Campus Madrid)

    ¡¡Bigdateros!! La vuelta al cole ha comenzado. Vuestros portátiles están con memoria, espacio y habéis mejorado el disco duro para el curso. Así que, chavalada, volvemos para dar un poco de caña a esos ordenadores. Empecemos por unas definiciones básicas: SQL: más trillado que un tebeo y que todo el mundo tiene Hadoop: lo más “in” que todos quieren usar Ahora tu empresa quiere usar los datos que tiene en un formato-como no- SQL en un sistema Hadoop para poder procesar esos datos junto con otros muchos que ya están en Hadoop. Y ¿cómo hacerlo y no morir en el intento? Si te has preguntado alguna vez ¿Cómo carajo puedo utilizar los datos que hay en mi ERP* si estoy implantando un sistema Big Data basado en Hadoop? Y no se te ha parado el corazón, no te preocupes, os vamos a contar cómo hacerlo sin sufrir un ictus. Nuestro profe en sus ratos libres, Adalid del Hadoop, Defensor del Big Data, Paladín de la integración: Carlos Izquierdo, os explicará qué pasos seguir durante las 2 horas de taller que vamos a tener. Apúntate, haz tu reserva y nos veremos las caras, ¡que ya hay ganas! *Un ERP-enterprise resources planning-consta de Marketing, RRHH, CRM, Finanzas, manufacturing, etc...)

    22
  • II Workshop Big Data: ingesta de datos en Hadoop

    Campus Café (Google Campus Madrid)

    Queridos bigdateros, No, no nos hemos olvidado de vosotros, tras el último Meetup volvemos a la carga antes de un merecido descanso estival. Muchos de vosotros estaréis pensando en las vacaciones y otros ya estaréis disfrutándolas, así que este Meetup es para los que os quedáis en Madrid en julio y queréis seguir aprendiendo. En el último taller vimos cómo trabajar con datos en Hadoop usando Hive. En este segundo workshop, y continuando con la senda anterior, profundizaremos en cómo hacer llegar datos a Hadoop mediante dos técnicas sencillas: 1. Copia de ficheros: esto ya lo vimos por encima el último día, haremos un breve repaso y comentaremos sus ventajas e inconvenientes. 2. Flume: permite canalizar flujos de datos de forma que terminen en Hadoop. Veremos diferentes formas de trabajar con esta pequeña pero utilísima herramienta del ecosistema. IMPORTANTE: Traeros vuestros PCs, con la Cloudera Quickstart VM instalada: https://www.cloudera.com/downloads/quickstart_vms/5-10.html Dudas y comentarios en el Slack www.big-data-madrid.slack.com. ¡Ayudadnos a definir el contenido del workshop! Por último, como es el último Meetup del curso escolar ¿Nos despedimos con unas cañas brindando por el veranito?

    25
  • Workshop: Cómo hacer un sistema de recomendación usando grafos con Neo4j

    Campus Café (Google Campus Madrid)

    ¡Muy buenas, Bigdateros madrileños! Volvemos a la carga con un nuevo meetup, esta vez, no solo vamos a haceros una introducción a la creación de Bases de Datos orientadas a grafos si no que vamos a hacer un workshop de sistemas de recomendación. ¿A que estáis flipando? ¿y quién mejor que Jesús Barrasa, senior Graph Solutions Consultant con tecnología Neo, para contarlo? Jesús, además de ser doctor en Ciencias de la computación por la UPM, combina 15 años de experiencia en servicios de la información y pionero en esto de tecnología Neo, trabajando actualmente como Graph Solutions Consultant con Neo Technology. Ha desarrollado para ello varios trabajos en Telcos aplicando bases de datos con grafos Podéis tuiterar todo lo que diga usando: @BarrasaDV Dicho esto, apuntad porque esta es la agenda: La primera parte la dedicaremos a hacer una introducción ligera a las bases de datos orientadas a grafos y tocaremos cuestiones como: • Fundamentos del modelado de datos en forma de grafo • Características técnicas clave de este tipo de bases de datos • Lenguaje de consultas • Integración La segunda parte construiremos paso a paso un sistema de recomendación sencillo basado en Neo4j. Aplicaremos técnicas estándar como la recomendación basada en contenido (content based recommendation) o filtrado colaborativo (collaborative filtering). Describiremos el proceso de construcción del grafo a partir de un dataset publico, explicando las decisiones de diseño y modelado y construiremos sobre el las consultas de recomendación. ¡Tráete el portátil y participa!

    15
  • La batalla final: cargas de datos SQL vs NoSQL

    Campus Café (Google Campus Madrid)

    “El trece de mayo la virgen María bajó de los cielos...” No, no nos hemos vuelto locos. Estamos de lleno en el mes de mayo, el mes de las flores y el incipiente calor veraniego. Así que nosotros no vamos a ser menos y aprovechamos todo eso para traeros este nuevo Meetup. Y sí, también aprovecharemos para echarnos alguna florecilla por el camino. Somos conscientes de que llevas todo el día currando y lo que te apetece son cervezas y terraza, pero nobleza obliga y nosotros continuamos con nuestra pasión por traeros cositas interesantes de Big Data. Así que preparaos porque vais a tener una final fight que ni la de Street Fighter. Agenda: 19:00-19:15 Recepción y bienvenida 19:15-20:00 Utilities: carga de lecturas de Smart Meters sobre arquitectura Exadata. Telco: Cargas de CDR en la plataforma Hadoop de una Telco 20:00-20:45: Ingesta de JSON en tiempo real. 20:45- fin: preguntas y papas working Para esta batalla de SQL vs NoSQL tenemos en la esquina derecha del ring, el indiscutible, el inimitable…. Carlos Domingo, un DBA con 15 años a sus espaldas administrando BBDD en grandes sistemas de producción. En la esquina izquierda, el innovador, el hombre que se ríe de las ingestas porque no hay una que se le resista… Manu Lamelas, actualmente arquitecto de soluciones Big Data en Datatons. ¡Os esperamos como agua de mayo!

    20
  • Workshop: Mis primeros pasos con Hadoop

    AFI Escuela de finanzas

    ¡Amigos del Hadoop, amantes del clúster, viciosos del MapReduce! ¡Os hemos escuchado y vuestras oraciones serán satisfechas! Tras varias peticiones y ruegos, finalmente iniciamos nuestros workshops para que cada uno de vosotros pueda desarrollar su propio Hadoop y enfrentarse a los primeros retos. Nuestro objetivo es que cada uno pueda trabajar en su propio entorno y además, meteremos las manos a un cluster de los de verdad de la buena. Así que, si sois buenxs, os dejaremos que le metáis mano. Así que tomad nota porque este día ejercitaremos nuestros músculos con la siguiente agenda: 19:00: Bienvenida 19:15: Comenzando con Hadoop. • Comandos HDFS: aprendiendo a distinguir entre local y remoto (o como diría Coco: "esto es CERCA, esto es LEJOS") • Hive: Haciendo SQL en Hadoop. Crearéis tablas, haréis consultas y manipularéis datos…(Aquí vais a flipar un poco) 20:00 Hadoop y su ecosistema Vol.1 • Pig: Cargaremos base de datos SQL externa con Sqoop y transformaremos los datos con ayuda de Pig(nos vamos a poner “cerdos”) Para poder practicar vais a tener que traer vuestro portátil con Cloudera VM instalado (versiones Virtualbox, Docker, VMWare) https://www.cloudera.com/documentation/enterprise/5-2-x/topics/cloudera_quickstart_vm.html

    23
  • Big Data Madrid... ¡¡ya están aquíiii!!

    Edificio Se Aceptan Ideas

    ¡Bienvenidos a Big Data Madrid!. En este grupo trataremos todo lo relacionado con la estructura, almacenamiento, ingesta de datos y utilización de tecnologías Big Data basadas en Open Source Para pertenecer a este grupo sólo tienes que tener ganas de aprender y, por qué no, de enseñar lo que sabes a otros. No tienes que ser un mega experto en Big Data, principiantes y nivel avanzado tendrán las mismas oportunidades de compartir conocimiento. Como es habitual, en este primer evento contaremos qué es Big Data y qué ecosistemas usamos para trabajar. Pero también queremos saber cuáles son vuestras ideas, si tenéis propuestas para ponencias futuras y vuestros comentarios. Agenda [masked] Recepción y bienvenida [masked] Big Data, nuestra buzzword favorita [masked] Ecosistema Big Data: Hadoop, Spark, Cassandra, … What else? [masked] Preguntas y propuestas de charlas, temática y orientación del meetup [masked]. papas working El aforo de este evento es limitado, así que si ves que no vas a poder venir, por favor, avísanos para poder liberar tu plaza y que pueda venir otro en tu lugar. Welcome to Big Data Madrid!! In this group, we’ll talk about data structure, storage, ingestion and usage of Big Data technologies based on Open Source. If you want to belong to this group, the only thing you must be willing to do is show the community your expertise in the Big Data World and also a desire to learn as well. You don’t need to be a mega guru in Big Data, beginners and advanced users will have the same opportunities to learn and share knowledge.For this first meetup, the agenda is What is Big Data and which ecosystems are involved. But we want to know your ideas and proposals for next meetups. Agenda [masked] Welcome [masked] Big Data, our favorite buzzword [masked] Big Data Ecosystem: Hadoop, Spark, Cassandra, … What else? [masked] Q&A and Proposals for next meetups [masked]. papas working The number of seats available for this event is limited, so if you’re finally not able to attend please notify us to free your reservation and allow others to come instead.

    16