巨量資料視覺化創新研究

請洽臉書社群國立中山大學_巨量資料視覺化創新研究，時間：每週四 14:30 - 16:00，地點：管院 CM4091-1

【臉書社團】◇ 【】◇【】

召集人：郭上暐
組員人數上限：少於10人
會費：免費
指導老師：卓雍然
報名方式：請洽臉書社群

主旨：

數據分析為現今重要的議題，商管領域也致力於數據分析的應用，將資料視覺化並寫成shiny app，供使用者依自身需求查看結果。不同於一般的數據分析，大數據分析因資料量龐大，背後的運算相對複雜，在製作shiny app時受到許多限制，如：app開啟的速度較慢等，造成使用者的不便。
因此，本學習小組成立的目的在於透過小組成員間針對相關議題的分享、討論及共同研究，結合各自具備的專長與技能，使用yelp評論文集資料完成以大數據為基礎的app，解決製作大數據app時的諸多限制。

而讓迴歸複雜化的意義在於讓我們能在複雜的現實中，能用一條函數更容易了解變數間的關係，因此這個讀書會成立希望可以藉由線上資源以及老師的幫助，來了解資料特性、處理模型前置作業、追蹤資料、混合模型、時間序列以及空間序列的模型變化，以助於同學論文研究與共同成長。

線上教材分享區：主要學習教材：

AGENDA：

◆ 以PTT/Yelp評論文集為基礎，搭配線上課程，以專案型式進行大數據App製作

◆ 應用提案 (一週)

◆ 決定APP，分配工作 (一週)

◆ APP Prototype (三週)

◆ Text Analysis in Spark Cluster (三週)

◆ APP & Interactive Scheme Design (三週)

◆ 心得分享 (一週)

主要(線上)學習材料：

◆ Yelp Open Dataset[URL]

◆ Building Dashboards with shinydashboard [datacamp]

◆ Building Web Applications with Shiny in R [datacamp]

◆ Building Dashboards with flexdashboard [datacamp]

◆ Case Studies: Building Web Applications with Shiny in R [datacamp]

◆ sparklyr: R interface for Apache Spark [eBook]

◆ Manipulating Data with dplyr [eBook]

◆ Spark Machine Learning Library (MLlib) [eBook]

◆ Distributing R Computations [eBook]

◆ Text mining with Spark & sparklyr [eBook]

學期成果：

◆ Yelp文集網路評論內容分析 [ShinyApp]

◆ Yelp文集商業類別文字雲 [ShinyApp]

◆ Yelp文集類別比較文字雲 [yelp_app.Rmd]