[Text mining] R與中文分詞
Details
- Agenda
• 19:15-19:30 R Basic: 給初心者的統計概念與小故事
• 19:30-20:30 主議程: Word cloud in R @莊舒媛
• 20:30-20:50 閃電秀: 從外國語言到程式語言 @Pei Lee
• 20:50 - 自由交流時間
- Talk Information
• Word cloud in R
在R軟體裡先做分詞處理,最後將結果儲存到資料庫中。在分詞處理上我們使用Rwordseg、jiebaR做分詞,依據分詞後的結果計算出頻率即可繪製文字雲。
• 從外國語言到程式語言
先分享一個免費的資料來源:全世界最大的社會事件開放資料庫 GDELT,以及實際應用。再來談談用外國語言工作一陣子後,改以程式語言安身立命的歷程:怎麼會從日文系跑去當數據分析師?
- Speaker Information
• 莊舒媛
目前是國立臺北商業大學 研究生,在學生時期透過R軟體進行購物籃分析、關聯規則分析、網路爬蟲、LDA分析與類神經網路預測等研究。
• Pei Lee
大學主修日文跟廣告企劃,指考數學不及格,沒修過統計學,在傳產做過兩年日韓線採購,現在在當自己說出來都會心虛的數據分析師。剛過試用期不久,過著每天寫程式的生活,目前比較熟悉的語言是中文、日文、英文跟Python。
- Host information
• Kristen Chan