Real-time Aggregation, Approximation, Similarities, and Recommendations at Scale

Name: Real-time Aggregation, Approximation, Similarities, and Recommendations at Scale
Start: 2016-04-14T19:00:00-04:00
End: 2016-04-14T22:00:00-04:00
Location: Princeton University - Lewis Library Rm 122

Hosted by Prasad S.

Large Language Models

Details

Agenda

Live, Interactive Recommendations Demo - NiFi, Kafka, Stanford CoreNLP, Docker, Word2Vec, LDA, Twitter Algebird, Spark Streaming, SQL, ML, GraphX.

Deep Dive (advancedspark.com)

Types of Similarity - Euclidean vs. Non-Euclidean Similarity, Jaccard Similarity, Cosine Similarity, LogLikelihood Similarity, Edit Distance

Text-based Similarities and Analytics - Word2Vec, LDA Topic Extraction, TextRank

Similarity-based Recommendations - User-to-User, Content-based, Item-to-Item (Amazon), Collaborative-based, User-to-Item (Netflix), Graph-based, Item-to-Item "Pathways" (Spotify)

Aggregations, Approximations, and Similarities at Scale - Twitter Algebird, MinHash and Bucketing, Locality Sensitive Hashing (LSH), BloomFilters, CountMin Sketch, HyperLogLog

Q & A

Bio

Chris Fregly is a Principal Data Solutions Engineer for the newly-formed IBM Spark Technology Center, an Apache Spark Contributor, and a Netflix Open Source Committer.

Chris is also the founder of the global Advanced Apache Spark Meetup and author of the upcoming book, Advanced Spark @ advancedspark.com (http://advancedspark.com/).

Previously, Chris was a Data Solutions Engineer at Databricks and a Streaming Data Engineer at Netflix.

When Chris isn’t contributing to Spark and other open source projects, he’s creating book chapters, slides, and demos to share knowledge with his peers at meetups and conferences throughout the world

Large Language Models

Real-time Aggregation, Approximation, Similarities, and Recommendations at Scale

Large Language Models

Details

Related topics

You may also like