• "Początki i współczesne wyzwania wizualizacji danych" + "Maszyneria AI"

    Po długiej przerwie wznawiamy nasze spotkania. 18:30 "Początki i współczesne wyzwania wizualizacji danych" Piotr Lasek, Deloitte Central Europe / Uniwersytet Rzeszowski Wizualizacja danych jest stosunkowo młodą dziedziną, ale nie sposób nie doceniać jej znaczenia ponieważ jest istotnym narzędziem umożliwiającym analizę a przede wszystkim zrozumienie przetwarzanych danych. Podczas wystąpienia przedstawimy w jaki sposób kształtowały się podstawowe pojęcia i metody wizualizacji, jakie istotne wydarzenia i odkrycia wpłynęły na kierunek jej rozwoju i jakie obecnie są jej największe wyzwania. 19:15 Przerwa 19:30 "Wyznaczanie substytutów produktów w nauczaniu maszynowym" Wiesław Popielarski, VirtusLab Al Irving jest naprawdę dobrym sprzedawcą. Ilekroć dostaje zamówienie od niecierpliwego klienta, natychmiast patrzy na jej lub jego profil i bezbłędnie wybiera to, co jest jej lub jemu potrzebne. Ale niestety tego ranka jest inaczej. Wiele z najbardziej lubianych przez klientów produktów jest niedostępnych i Al poczuł się trochę zagubiony. Wszystko wydaje się iść w złą stronę. Na szczęście Bruce Braniac wziął komputer na swoje kolana i zagłębił się w coś, co wstępnie nazwał „SUBSTYTUCJAMI”. Po 4 godzinach ciężkiej pracy zaktualizował Ala za pomocą nowego modułu do rozpoznawania najlepiej odpowiadającym sobie produktom, dzięki czemu klienci nie będą narzekać i będą mniej więcej zadowoleni ... jak tylko mogą być, gdy otrzymają dobry zamiennik czegoś, co w danym momencie nie jest dostępne. Prelekcja będzie dotyczyć niektórych technik stosowanych w celu znalezienia najlepszej substytucji danego produktu. Algorytm opiera się na ciekawym wykorzystaniu osadzania słów (word embedding), macierzy zapytań i odpowiedzi oraz nieliniowych reguł biznesowych połączonych razem. Do zobaczenia wkrótce, jeśli interesuje Cię taka mieszanka maszynerii AI. Bio pasowany na magistra inżyniera 20 lat temu, doktorat z informatyki od 6 lat, a kolegą z zespołu VirtusLab od 4. Obecnie pracuje dla Tesco jako inżynier danych, ale także jako programista w społeczności open source w Scali. Wielki fan TopCoder bez znaczących sukcesów. --- Podziękowania dla VirtusLab (http://www.virtuslab.com) za sponsorowanie - venue, napojów i video

  • Benchmarkowanie Spark SQL, Presto i Hive & Wprowadzenie do Apache Spark

    1. spotkanie fanów Data Science w Rzeszowie! Organizator - VirtusLab wspólnie z Uniwersytetem Rzeszowskim zaprasza na otwarte spotkanie dla studentów i zainteresowanych tą tematyką. Miejsce jest poza murami URz, ale mamy nadzieję, że dacie radę do nas dotrzeć:) FYI Zaraz po tym meetupie będzie kolejny: Rzeszów Java User Group, na który też wszyscy są zaproszeni. W planach mamy dwie prezentacje. #1 Talk: Tomasz Lichoń (16:30 - 17:15) "Benchmarkowanie Spark SQL, Presto i Hive na potrzeby business intelligence, na platformie Google's Cloud Dataproc" Wprowadzenie do platformy Google Dataproc, udostępniającej w modelu PaaS klaster do przetwarzania danych oparty o chmurę obliczeniową i storage Google. Opis na przykładzie użycia platformy na potrzeby porównania wydajności zapytań SQL z użyciem Spark, Presto i Hive, do analizy danych rzędu 1mld wierszy. W celu późniejszej integracji z narzędziami BI jako zamiennik aktualnej bazy danych typu enterprise. #2 Talk: Tomasz Partyka (17:30 - 18:15) "Wprowadzenie do środowiska Apache Spark" W planie prezentacji wprowadzenie do Sparka, czyli: - Opis architektury i komponentów, - Porównanie z MapReduce, - Koncepcja RDD, lazy evaluation, - Scheduling (DAG, job, task, stage), - Krótkie demo Zapraszamy serdecznie!

    2