上海Spark meetup第七次聚会


Details
天气变冷,部分嘉宾生病,演讲嘉宾调整如下,同时假期临近,希望大家多多注意身体,健康快乐地迎接春节!
新年伊始,上海Spark meetup第一波技术盛会来了!2016年1月23日(周六),Intel将联合携程举办2016年第一场Spark Meetup,此次活动特别邀请到来自 携程,Splunk以及intel大数据的专家和大家分享Spark技术及实践经验,幸运听众还会得到一本签名版的Spark技术书籍。
地点:上海市长宁区金钟路968号凌空SOHO 8号楼
主办方: Intel
合作伙伴: 携程
时间表/Agenda:
1月23日下午
• 12:30 - 13:00 签到/Sign in
• 13:00 - 13:10 开场白/Opening (程浩,英特尔大数据部门经理)
• 13:10 - 13:50 Spark 自然语言处理在携程攻略的实践(李健,携程攻略社区,开发总监)
• 13:50 - 14:30 Accelerating TPCx-BigBench on SQL-on-Hadoop*(Zhou Yi, Intel大数据工程师)
• 14:30 - 14:50 茶歇/Tea break
• 14:50 - 15:30 Drive Best Spark Performance on IA (Lex Yu, 英特尔高级软件工程师)
• 15:30 - 16:00 交流时间/Networking time
• 开场/Opening Keynote: 程浩,Intel大数据部门经理
个人介绍:2012年加入Intel,Big Data Technology部门经理,一直致力于SQL on BigData的开发和性能优化,Shark和Spark SQL开源社区活跃开发者。
• 演讲者1: 李健,携程攻略社区,开发总监
个人介绍:毕业于上海大学本科,交通大学计算机系研究生学历。自2013年9月进入携程网以来,先后任攻略社区后台开发主管、数据组主管等职,在自然语言处理、图像识别和处理方面有所研究。
分享主题:Spark 自然语言处理在携程攻略的实践
概要: NLP技术简介,情感分析,特征标签抽取,特征词抽取,游记自动文摘,知识图谱关系抽取,目前研究方向。
• 演讲者2: Zhou Yi,
个人介绍:英特尔软件工程师,致力于大数据系统的性能调优及基准测试与评估。
分享主题:Accelerating TPCx-BigBench on SQL-on-Hadoop*
概要:
评估一个大数据系统性能是一项具有挑战性的任务。对于目前阶段存在的Micro-Benchmark(如Terasort )其并不能真正体现现实系统端到端的工作负载。为了解决目前的困境, Intel开发了一款崭新的面向大数据工业标准与首个基于端到端的基准测试套件BigBench。本次演讲,将分享我们在BigBench上的工作和基于BigBench对目前主流分布式SQL-on-Hadoop 引擎的性能调优与经验。
• 演讲者3: Lex Yu, 英特尔高级软件工程师
个人介绍:Lex Yu, 英特尔高级软件工程师,Spark contributor,致力于大数据技术的性能优化及开发。
分享主题:Drive Best Spark Performance on IA
概要:调优是Spark开发中非常重要的一个环节,好的调优可以提升10倍以上的性能。这里,我们分享了Intel长期调优经验的总结,并展示了一种使用最新的PCIE SSD技术来加速程序的方案。最后,我们通过IO Profile揭示出SSD能够加速的根本原因。

上海Spark meetup第七次聚会