Skip to content

Shanghai Spark Meetup 第八次聚会来了

Photo of Helen Lv
Hosted By
Helen L.
Shanghai Spark Meetup 第八次聚会来了

Details

春暖花开,万物生长,正是咱们程序猿刻苦修炼技能的好时机,本期Meetup也为大家准备了精彩的内容:举世瞩目的“人狗大战”还未散尽硝烟,来自英特尔的专家趁热打铁将为您谈谈Spark在大规模机器学习的应用;Flink是大数据领域冉冉升起的新星,与Spark相比到底孰长孰劣,英特尔的专家也将为您丝分缕析;另外本次活动还特别邀请了我们的友军:来自聚效广告和Splunk的嘉宾为大家带来各自的实践案例和经验分享......本次活动的内容丰富多彩,不容错过!欢迎大家前来围观!4月9日我们上海世贸见!

活动细节如下:

地点:上海市长宁区延安西路2299号上海世贸商城22层英特尔公司

主办方: Intel

时间表/Agenda:
4月9日下午
• 12:30 - 13:00 签到/Sign in
• 13:00 - 13:10 开场白/Opening (程浩,英特尔大数据部门Spark Core团队研发经理)
• 13:10 - 13:50 基于Apache Spark的大规模机器学习应用(杨玉皓,英特尔大数据工程师)
• 13:50 - 14:30 Flink:统一的流执行引擎(李呈祥,英特尔大数据工程师)
• 14:30 - 14:50 茶歇/Tea break
• 14:50 - 15:30 Spark在计算广告领域的应用实践(朱广彬/刘忆智,来自聚效广告)
• 15:30 - 16:10 Splunk & Spark(陶刚, Splunk上海架构师)
• 16:10 - 16:40 交流时间/Networking time

•开场/Opening

Keynote:程浩,Intel大数据部门Spark Core团队研发经理 个人介绍:2012年加入Intel大数据技术团队,Apache Spark开源社区活跃开发者,同时也领导Intel Spark Core团队,优化Spark在IA(Intel Architecture)平台的执行性能,充分发挥硬件特性,并回馈给开源社区。

•演讲者1:杨玉皓,英特尔大数据工程师

演讲主题:基于Apache Spark的大规模机器学习应用
演讲简介:伴随着机器学习需求的快速增长和数据规模的不断增大,Spark MLlib在不断丰富功能的同时,也需要应对更大规模数据的挑战。本次分享将选取一些典型的企业应用和重要算法(LR,KMeans,LDA等)进行深入分析,讨论使用Spark MLlib进行大规模机器学习运算的经验和技巧,同时介绍Spark MLlib 2.0的最新进展。

杨玉皓,Intel大数据技术部门软件工程师,主要关注分布式机器学习应用和基础框架,为企业大规模机器学习应用提供合作与支持。Apache Spark Contributor,为Spark MLlib贡献多个算法和改进。

演讲者2:李呈祥,英特尔大数据工程师 演讲主题:Flink:统一的流执行引擎
演讲简介:Flink项目是大数据处理领域最近冉冉升起的一颗新星,其不同于其他大数据项目的诸多特性也吸引了越来越多的人关注Flink项目。这次分享主要介绍Flink一些关键的技术与特性,并和Spark进行深入对比,比较Spark与Flink相互的优点与劣势。

李呈祥,Apache Hive Committer, Apache Flink Committer. Intel大数据技术部门软件工程师,主要关注Hadoop平台分布式计算框架与分布式SQL引擎的设计开发与性能优化工作。

•演讲者3:朱广彬/刘忆智,来自聚效广告
演讲主题:Spark在计算广告领域的应用实践
演讲简介:计算广告是近几年非常火热的一个话题,也是大数据应用重度使用的领域。聚效广告拥有日百亿的流量,在广告大数据处理上积累了一些经验。本次分享主要介绍Spark在我们内部的实践和经验,包括基于SparkSQL的快速数据仓库查询引擎的实践、基于MLlib做CTR预估/人群分类等实践案例。

朱广彬:北京交通大学硕士,2014年加入聚效广告,曾就职于大众点评基础架构部,目前负责聚效基础数据架构,对Hadoop、Hive、HBase、Spark等有一定的研究。
刘忆智:毕业于浙江大学,2012年加入聚效广告,负责聚效人群定向算法团队,DMLC member,深度学习框架MXNet commiter,致力于大规模机器学习算法在工业界的应用。

•演讲者4:陶刚,Splunk上海架构师
演讲主题:Splunk & Spark
演讲简介:Splunk是业内领先的机器数据的平台,Splunk公司也是业内第一家在纳斯达克上市的大数据公司。本次演讲介绍了Splunk的基本功能和技术架构,并就如何在Splunk平台上利用和集成Spark进行数据处理展开讨论。 2000年毕业于北京邮电大学,目前在Splunk上海担任架构师,负责数据采集和云平台产品的技术架构。 在加入Splunk之前,曾就职于SAP,EMC等企业,负责ERP,BI和存储管理产品的开发。陶刚拥有丰富的企业级产品的开发经验,对数据科学,数据可视化和机器学习等领域有着浓厚的兴趣。

Photo of Shanghai Spark+AI Meetup group
Shanghai Spark+AI Meetup
See more events
上海市长宁区延安西路2299号上海世贸商城22楼22F18-19 · Shanghai