Skip to content

【時間変更】第667回 Kaggle NLP Data Hackathon(Kaggle 自然言語データ分析ハッカソン)

A
Hosted By
AI n. and Daisuke I.
【時間変更】第667回 Kaggle NLP Data Hackathon(Kaggle 自然言語データ分析ハッカソン)

Details

※時間変更※ 13開始となりましたのでご注意ください。(2020.2.4追記)

(*This event is in Japanese only)

こんにちは! Team AI 宮崎 翼です。 我々は定期的に機械学習に関するハンズオンなデータ分析ハッカソンを開催しています。

実力アップに非常に便利なのが、 データサイエンスのコンペサイトKaggleです。

世界のDataScientistコミュ二ティで今非常に注目されている、 Kaggleに皆でチャレンジしませんか? https://www.kaggle.com/

このイベントでは、自然言語データ中心に皆さんにハンズオンなハッカソン形式でご参加頂きます。ニュース、アニメの台本、Q&Aなど様々ご用意しています。

3−4人のグループに分かれ、取り組むデータセットを選び、助け合いながら分析を進めてもらいます。ハイレベルな方も、初心者の方も気軽にいらっしゃってください。

================================
対象
・AIやIoTの時代に備えて少しでもプログラミングに触れてみたい ・Pythonを基礎から復習してみたい方

================================
内容
・Kaggleを使ったハッカソン

================================
費用
・無料

================================
当日の流れ
・自己紹介 ・班分け (3名~4名に分かれます) ・データセット決め

================================
持ち物
ノートPC

================================
データセット
1.Shinzo Abe Twitter Data(安倍首相のTwitterデータ) https://www.kaggle.com/team-ai/shinzo-abe-japanese-prime-minister-twitter-nlp/version/1

2.Japanese Whisky Review Dataset(英語ですが日本のウイスキーのレビュー) 1,000+ Reviews of Japanese Whisky https://www.kaggle.com/koki25ando/japanese-whisky-review

3.South Park Dialogue アニメ作品台本のセリフデータから話者を特定 https://www.kaggle.com/tovarischsukhov/southparklines

4.World News on Reddit 掲示板上のニュースデータ解析 https://www.kaggle.com/rootuser/worldnews-on-reddit

5.Spooky Author Identification Share code and discuss insights to identify horror authors from their writings https://www.kaggle.com/c/spooky-author-identification/data

6.Bag of Words Meets Bags of Popcorn Use Google's Word2Vec for movie reviews https://www.kaggle.com/c/word2vec-nlp-tutorial/data

7.Toxic Comment Classification Challenge  多ラベル分類問題(Multilabel classification)コメントへのタグ付けコンペ  Identify and classify toxic online comments https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge/data

8.News Category Dataset Identify the type of news based on headlines and short descriptions https://www.kaggle.com/rmisra/news-category-dataset

-参考 データ分析ハッカソンやる時の便利なチュートリアル集 by Team AI https://qiita.com/daisuke-team-ai/items/f8e3275f1d3ca7e9bfcd

自然言語処理チュートリアル https://qiita.com/daisuke-team-ai/items/d2e18f07a08d9b4cb783

================================
Kaggle参考資料
日本語チュートリアル;  Kaggle入門  http://qiita.com/taka4sato/items/802c494fdebeaa7f43b7

Titanicチャレンジ  https://www.kaggle.com/c/titanic Titanicチャレンジ攻略法  http://qiita.com/suzumi/items/8ce18bc90c942663d1e6
-0から始めるkaggle超初心者向け入門  https://qiita.com/yukinagae/items/661e6021871788e2f05d    -Kaggleに登録したら次にやること ~ これだけやれば十分闘える!  Titanicの先へ行く入門 10 Kernel ~ https://qiita.com/upura/items/3c10ff6fed4e7c3d70f0

================================
Team AIとは?
2016年7月発祥のコミュニティです。2019年6月時点で会員6000人以上います。
渋谷の拠点でAI教育イベントを通算500回実施、日本最大級のAIコミュニティです。
代表の石井は、翔泳社から”AIエンジニアになりたい人の為の本”を出版し、1万部を販売してます。
-web
https://www.team-ai.com/

-Facebook(人工知能 研究会グループ Team AI)
https://www.facebook.com/groups/teamaisupporters/?ref=bookmarks

-Slack(AIコミュニティ)
https://ai-university.herokuapp.com/

-メルマガ(最新のAI技術のトレンドや海外事例をメールマガジンでお届けします。)
https://us9.list-manage.com/subscribe?u=b351ff53a100609b7c5759977&id=029741963f

================================
プレゼンター
司会 : 宮崎 翼
Twitter:tsubasatwi
https://twitter.com/tsubasatwi
1982年愛媛県出身、新居浜工業高等専門学校卒業後、大手商社に入社、その後通信業界にてSIerとしてアカウントセールス担当し、NWプリセールスとしてグローバル企業のプロジェクトリードを担当。

================================
代表者情報
100万人の機械学習コミュニティを東京に創る Team AI
http://www.team-ai.com/
代表 : 石井 大輔
経歴:https://www.ishiid.com
株式会社ジェニオ代表取締役 1975年岡山県生まれ。 京都大学卒業後、伊藤忠商事にて欧州駐在しアパレルの知的財産と事業開発担当。2011年ジェニオを創業。 ファッション通販BUYMAの海外事業開発(欧州・米国)を受注。 2015年、シリコンバレーの起業家育成組織OneTractionの指導のもと米国で事業推進。 2016年、AI開発案件に特化したクラウドソーシングサービスTeam AIを立ち上げる。 TBS"AI共存ラジオ 好奇心家族"火曜日コメンテーター。

Photo of Team AI (機械学習・機械翻訳 研究会) group
Team AI (機械学習・機械翻訳 研究会)
See more events
Team AI Base (New Shibuya Mansion 202)
36-17 Udagawa-cho, Shibuya-ku · Tokyo