Recruit Technologies Open Lab #2: Spark


Details
※「参加する」ボタンと「参加してRSVP/参加申込する」ボタンの違いにご注意ください.右上の「参加する」ボタンは,当コミュニティに参加するという意味で,今回のイベントへの参加という意味ではありません.今回のイベントに参加されたい方は「参加して RSVP/参加申込する」ボタンをクリックしてください.
「リクルートテクノロジーズ オープンラボ」はリクルートグループのサービス開発やインフラの運用を手がけるリクルートテクノロジーズが主催する技術勉強会です。今回のテーマは Apache Spark です。
Apache Spark コミッタ・PMCメンバーであり機械学習ライブラリ MLlib の開発責任者である Xiangrui Meng さんに特別講演をしていただきます。また databricks 社から T シャツなどのご支援を頂ける予定ですので、Xiangrui Meng さんの発表時にご質問されていただいた方に先着でプレゼントします。
Twitter: #Spark
タイムテーブル
ソーシャライジングを本編前にも設けておりますが,本編からの参加でも構いません.
-
18:00 ソーシャライジング
-
19:00 本編開始
-
19:05 「Distributed Bisecting KMeans with Spark」(石川:25分)
-
19:30 「Spark MLlib: Past, Present, and Future」(Xiangrui Mengs氏:60分)
-
20:30 ソーシャライジング
-
21:30 クローズ
受付けについて
-
受付は18時00分から開始予定としております。
-
会場への入場にはセキュリティカードが必要です。グラントウキョウサウスタワーの1Fエスカレーター横に本イベント用の受付を設置します。2Fのリクルートグループの受付ではなく、1Fですのでご注意ください。イベント受付でセキュリティカードを受け取ってから2Fゲートより入場してください。
-
セキュリティカードは勉強会終了後にスタッフが回収します。持ち帰らないようにお願いします。万一持ち帰ってしまった場合、裏面に書かれている連絡先へ連絡してくださいますようお願いします。
====
In this meetup, we'll talk about Apache Spark & its machine learning library MLlib.
Twitter: #Spark
Time Table
You can attend this event from the introductions.
-
18:00 Socializing
-
19:00 Introductions
-
19:05 "Scalable bisecting k-means in MLlib" by Yu Ishikawa
-
19:30 "Spark MLlib: Past, Present, and Future" Talk by Xiangrui Meng
-
20:30 Socializing
-
21:30 Closing
Bios.
Xiangrui Meng is an Apache Spark PMC member and a software engineer at Databricks. His main interests center around developing and implementing scalable algorithms for scientific applications. He has been actively involved in the development and maintenance of Spark MLlib since he joined Databricks. Before Databricks, he worked as an applied research engineer at LinkedIn, where he was the main developer of an offline machine learning framework in Hadoop MapReduce. His Ph.D. work at Stanford is on randomized algorithms for large-scale linear regression problems.
Yu Ishikawa is a software engineer at Recruit Technologies. His main work is contributing Apache Spark, especially MLlib.
Abstract
"Spark MLlib: Past, Present, and Future":
Apache Spark provides primitives for in-memory cluster computing,which is well suited for large-scale machine learning purposes. MLlibis a standard component in Spark providing machine learningprimitives, initially created and contributed to Spark by UC Berkeley.With 50+ companies and 200+ individual developers contributing toMLlib, it is one of the most active open source projects for machinelearning. MLlib’s goal is to make practical machine learning scalableand easy, and the community has devoted lot of time and effort towardsthis goal. In this talk, we present a brief history of MLlib,summarize new features in Spark 1.6 (along with other components),and discuss the roadmap. We will show the expansion of MLlib’s featureset, the evolution of MLlib’s pipeline API, the elevation of MLlib'sperformance, as well as the integration with other Spark components.We will also provide entry points for users and developers to get startedwith Spark MLlib.
About Registration
-
We'll open the registration from 6pm to 7:30pm.
-
You should get a security card to enter our office at 1F of the building.- Please, don't take the security card home. We'll collect the security cards at the end of this event.


Recruit Technologies Open Lab #2: Spark