Skip to content

MLDM Monday -- 中文自然語言處理 - word2vec

Photo of Chia-Chi Chang
Hosted By
Chia-Chi C. and 陳嘉葳
MLDM Monday -- 中文自然語言處理 - word2vec

Details

聯絡人:

Chia-Chi (c3h3) 0988209252

Wush Wu 0973687970

聚會議程:

1910 ~ 1920 Warm Up

1930 ~

中文自然語言處理 - word2vec (陳嘉葳)

Google在2013年公佈了一套open source工具: word2vec ,可以高效率將文章單字轉變為實數向量,輸出的詞向量可以被用來做很多NLP相關的工作,例如文章分群、找同義詞、詞性分析、機器翻譯 等等。
其中詞向量的表示法可以做到單字之間的對應,並能以數學方式進行處理,例如 vector('Paris') - vector('France') + vector('Italy') ≈ vector('Rome'),vector('king') - vector('man') + vector('woman') ≈ vector('queen')
本次分享會以程式跑出實際例子,簡單地解釋word2vec的模型運作原理。

工具來源

https://code.google.com/p/word2vec/

Photo of Taiwan R User Group / MLDM Monday group
Taiwan R User Group / MLDM Monday
See more events
政大公企中心(創立方)西樓WB05
台北市金華街187號 西樓WB05 · Taipei