Shanghai Spark Meetup 第八次聚会来了

Name: Shanghai Spark Meetup 第八次聚会来了
Start: 2016-04-09T12:30:00+08:00
End: 2016-04-09T17:00:00+08:00
Location: Intel Shanghai Mart Site

Hosted by Helen L.

Shanghai Spark+AI Meetup

Details

春暖花开，万物生长，正是咱们程序猿刻苦修炼技能的好时机，本期Meetup也为大家准备了精彩的内容：举世瞩目的“人狗大战”还未散尽硝烟，来自英特尔的专家趁热打铁将为您谈谈Spark在大规模机器学习的应用；Flink是大数据领域冉冉升起的新星，与Spark相比到底孰长孰劣，英特尔的专家也将为您丝分缕析；另外本次活动还特别邀请了我们的友军：来自聚效广告和Splunk的嘉宾为大家带来各自的实践案例和经验分享......本次活动的内容丰富多彩，不容错过！欢迎大家前来围观！4月9日我们上海世贸见！

活动细节如下：

地点：上海市长宁区延安西路２２９９号上海世贸商城２２层英特尔公司

主办方: Intel

时间表/Agenda:
4月9日下午
• 12:30 - 13:00 签到/Sign in
• 13:00 - 13:10 开场白/Opening （程浩，英特尔大数据部门Spark Core团队研发经理）
• 13:10 - 13:50 基于Apache Spark的大规模机器学习应用(杨玉皓,英特尔大数据工程师)
• 13:50 - 14:30 Flink：统一的流执行引擎（李呈祥,英特尔大数据工程师)
• 14:30 - 14:50 茶歇/Tea break
• 14:50 - 15:30 Spark在计算广告领域的应用实践(朱广彬/刘忆智，来自聚效广告)
• 15:30 - 16:10 Splunk & Spark（陶刚, Splunk上海架构师）
• 16:10 - 16:40 交流时间/Networking time

•开场/Opening

Keynote：程浩，Intel大数据部门Spark Core团队研发经理个人介绍：2012年加入Intel大数据技术团队，Apache Spark开源社区活跃开发者，同时也领导Intel Spark Core团队，优化Spark在IA（Intel Architecture）平台的执行性能，充分发挥硬件特性，并回馈给开源社区。

•演讲者1：杨玉皓，英特尔大数据工程师

演讲主题：基于Apache Spark的大规模机器学习应用
演讲简介：伴随着机器学习需求的快速增长和数据规模的不断增大，Spark MLlib在不断丰富功能的同时，也需要应对更大规模数据的挑战。本次分享将选取一些典型的企业应用和重要算法（LR，KMeans，LDA等）进行深入分析，讨论使用Spark MLlib进行大规模机器学习运算的经验和技巧，同时介绍Spark MLlib 2.0的最新进展。

杨玉皓，Intel大数据技术部门软件工程师，主要关注分布式机器学习应用和基础框架，为企业大规模机器学习应用提供合作与支持。Apache Spark Contributor，为Spark MLlib贡献多个算法和改进。

演讲者2：李呈祥，英特尔大数据工程师演讲主题：Flink：统一的流执行引擎
演讲简介：Flink项目是大数据处理领域最近冉冉升起的一颗新星，其不同于其他大数据项目的诸多特性也吸引了越来越多的人关注Flink项目。这次分享主要介绍Flink一些关键的技术与特性，并和Spark进行深入对比，比较Spark与Flink相互的优点与劣势。

李呈祥，Apache Hive Committer, Apache Flink Committer. Intel大数据技术部门软件工程师，主要关注Hadoop平台分布式计算框架与分布式SQL引擎的设计开发与性能优化工作。

•演讲者3：朱广彬/刘忆智，来自聚效广告
演讲主题：Spark在计算广告领域的应用实践
演讲简介：计算广告是近几年非常火热的一个话题，也是大数据应用重度使用的领域。聚效广告拥有日百亿的流量，在广告大数据处理上积累了一些经验。本次分享主要介绍Spark在我们内部的实践和经验，包括基于SparkSQL的快速数据仓库查询引擎的实践、基于MLlib做CTR预估/人群分类等实践案例。

朱广彬：北京交通大学硕士，2014年加入聚效广告，曾就职于大众点评基础架构部，目前负责聚效基础数据架构，对Hadoop、Hive、HBase、Spark等有一定的研究。
刘忆智：毕业于浙江大学，2012年加入聚效广告，负责聚效人群定向算法团队，DMLC member，深度学习框架MXNet commiter，致力于大规模机器学习算法在工业界的应用。

•演讲者4：陶刚，Splunk上海架构师
演讲主题：Splunk & Spark
演讲简介：Splunk是业内领先的机器数据的平台，Splunk公司也是业内第一家在纳斯达克上市的大数据公司。本次演讲介绍了Splunk的基本功能和技术架构，并就如何在Splunk平台上利用和集成Spark进行数据处理展开讨论。 2000年毕业于北京邮电大学，目前在Splunk上海担任架构师,负责数据采集和云平台产品的技术架构。在加入Splunk之前，曾就职于SAP，EMC等企业，负责ERP，BI和存储管理产品的开发。陶刚拥有丰富的企业级产品的开发经验，对数据科学，数据可视化和机器学习等领域有着浓厚的兴趣。

Shanghai Spark+AI Meetup

Shanghai Spark Meetup 第八次聚会来了

Shanghai Spark+AI Meetup

Details

Related topics

You may also like