Skip to content

What we’re about

R 是目前最紅的 Open Source 統計語言,而且,不只是對於傳統的統計檢定來說,或是,對於新世代的 Machine Learning 和 Data Mining 的許多技術而言,R 都有很完整的套件支援。因此,可以很快速的在R上面運用各種 Machine Learning 的技術來分析資料。

另外,R 也被是在知名的 Data Mining 網站 kdnuggets 上,被評選為 2012 年最火紅的 Data Mining 語言 http://www.kdnuggets.com/2012/08/poll-analy...

我相信,在這個「大資料」時代崛起的「掏資料潮」中,應該也許多 R 語言可以大展長才的地方! Taiwan useR Group 是一個讓大家可以討論與交流 R 的各種使用經驗的地方,希望大家可以來分享一下自己使用 R 的一些經驗,或是,在開發 R 套件時所遇到的一些困難與經驗。相信,透由大家一起交流,一定可以快速地幫彼此解決遇到的難題,增加彼此使用 R 的流暢度與開發速度。

另外,由於它是 Machine Learning 和 Data Mining 很強大的工具之一,因此,我們的聚會主題也會有很多是聚焦在這兩個領域上頭,如果大家對於這兩個領域有興趣,想要找同好一起討論或學習,也歡迎來我們的社群一起聚會 (不是用 R 語言來做 ML/DM 的問題也沒關係),相信,在社群中醫訂有很多 ML/DM 的同好,會很熱心地幫助大家的!


Taiwan R User Group 聚會的主題大概可以分成六大類:

(1) R 語言的學習、使用、問答與交流:

希望大家可以透由社群的力量,讓新手們可以快速地學會 R 的各種使用技巧,讓老手們也可以在彼此的身上學到許多自己沒用過的方法、套件與技巧!

(2) Machine Learning / Data Mining 的技術交流:

ML/DM 是 R 一個很重要的應用領域,因此,他們也會是社群中很重要的討論主題之一。在這類的主題中,我們會以 ML/DM 的技術、議題與應用為主,並不限定只能分享 R 中的 ML/DM 模組,也很觀迎使用其他語言(像是Python, Matlab, Julia ...等等) 的 ML/DM 的玩家們,可以依同來分享使用的心得與技巧唷。

(3) 各種 Data 的主題:

身為統計語言的社群,在統計之中最重要的「Data 」這塊,當然是不可少的主題之一。不論您是抓資料的高手,興趣是寫各種網路爬蟲;或是,剛好分析到一些有趣結構的 Data ;或是,發現某些超強的 Cleaning Data 的技術......等等,只要是跟「Data」有關的技術,我們也都很歡迎大家來分享唷!

另外,當然,如果您有:「想要抓資料抓不到、想要寫 Crawler 不會寫」、「手上有一些資料,但不知道該用甚麼演算法分析,不知道從何下手?」、「對於 Cleanning Data 的技巧不熟悉」...等等,跟 Data 相關的問題,也歡迎大家提出來一起討論,一起尋找解答!

(4) 統計:

當然,身為統計的第一大 Open Source 語言的社群,怎麼可能把統計的議題排除在外呢!我們也很觀迎各類統計的人員,來互相交流唷!

(5) Quantitative Finance and Trading System Development:

為什麼會把 QF 的主題獨立出來呢?因為,這應該是 R 在資料分析的各個領域中,市占率最高的一塊了!其他,像是 Computer Vision 或是 NLP (text mining) 之類的領域,R、Python 和 Matlab 的使用族群人數,都齊鼓相當。甚至,在 CV 或 MLP 的一些研究團隊中,有時候 R 也會比用另外兩種語言的使用人數更少一些。不過,在金融的領域中,R 卻享有了非常高的市佔率,它擁有大量個社群、使用者和套件,都是另外兩種語言所無法匹敵的!

關於這點,從每年會舉辦的 R Finance (賭徒大會?) 中,就可以看出一些端倪了!

http://www.rinfinance.com/

因此,我們也希望能夠在討論的主題中包含到這方面的內容。甚至,如果大家對於這些工具更熟悉之後,也可以寫一些套件回饋給 R 社群。希望有一天,大家也有機會可以去 R Finance 上面發表一起開發的成果^^

(6) 尋找一起在 ML/DM 領域闖蕩的夥伴:

除了一些學生能參加的競賽外,像是知名的網站 kaggle ( http://www.kaggle.com/ ) 也常常提供許多不同類型的資料,讓大家在上面捉對廝殺。大家可以將自己學過的 ML/DM 的技術拿出來磨磨刀,即使沒得獎,相信,能夠「學以致用」、「學而時習」本身就是一件讓人開心的事情;說不定,還有機會運氣好可以拿到高額的獎金也說不定唷!

另外,最近業界吹起了一股「資料掏金」的熱潮,大家都紛紛得在自己手上大量的資料中,探索著傳說中的「One Piece」!我們相信,這股熱潮應該會持續好一陣子!因此,我們也很歡迎大家來社群中尋找 ML/DM 的夥伴唷,包括公司的夥伴或是一起創業的同伴,也都可以唷!

Taiwan R User Group 的其他相關網站:

TW useR Group 的 Youtube 頻道: (每次聚會錄影 + 現場 Hangout直播)

http://www.youtube.com/user/TWuseRGroup

TW useR Group 的 Facebook 頁面:

http://www.facebook.com/Tw.R.User

[Taiwan R User Group] ML/DM Monday 聚會:

目前社群在每週一都會舉辦一次 ML/DM Monday 的活動,每次活動大概可以分成三個部分:(1) Warm up Discussion (2) Main Issue (3) Group Discussion

而時間的分配上大概是這樣的:

19:10 ~ 19:20 Warm up Discussion

19:30 ~ 19:50 Main Issue

20:00 ~ 21:00 Group Discussion

而如果遇到時間比較長一點的演講,或是遇到大家反應比較熱烈、討論比較激烈的演講,我們會自動將 Main Issue 的時間稍微延後 10 ~ 20 分鐘。

(1) Warm up Discussion:

Warm up Discussion 中,我們可能會分享一些 R 的 Tips 或是一些 MLDM 上的 Tips,做為每次聚會的開端。

(2) Main Issue

Main Issue 的部分,我們主要會排入一些經驗分享的議題:其中包含 MLDM 的經驗分享、一些好用的工具的使用經驗分享、R的工具介紹、MLDM 方法的介紹與討論、一些好玩的 Data 議題、或是一些資料庫的工具與議題......等等,都是我們希望能排入議程的主題。也歡迎與會的大家,可以不吝分享您的專長,讓大家可以有互相交流與學習的機會。

(3) Group Discussion:

最後的 Group Discussion,其實是讓大家有一個每週一起討論某個主題的機會與時間。也許大家會一起開讀書會,看看 coursera 上的影片,大就可以每週聚在一起,討論一下影片的進度與看到的問題;或許,大家是想要組隊去 Kaggle 比賽,也可以利用這時間,和隊友好好討論一下進度;更或許,你們是一起在關注某種 data 的夥伴,也可以利用這時間來討論一下彼此分析的心得唷,說不定因此就可以激發出火花,研發出某種特殊的服務......等等。其實,只要有人發起,有人跟隨,他就可以成為一個小小的討論群組,在會後可以一起交流與討論!

當然,每次會又一定會有 Free Discussion 這組,讓大家可以互相 Social 一下。也一定會有 R Tutorial 這組,讓大家可以來詢問一些 R 相關的議題!