4. 資料框整理套件 (CM512 2024.09)

單元大綱:
◆ 04A: `dplyr`套件簡介
◇ 欄位轉換與定義 Transform and Create Columns
◇ 記錄篩選與排列 Filtering and Ordering Rows
◇ 資料彙總與群組運算 Group Summary
◇ 更靈活的語法 Enhancement Features
◆ 04B: 資料群組與群組運算 `group_by` & group operations
◇ 巢套式的群組結構 Embedded Group Structure
◇ 群組匯總 Group Summarise
◇ 群組轉換 Group Mutate
◇ 匯總、向量和窗口功能 summarise, vector & windows functions
◆ 期中資料案: Tafeng DataSet
◇ 資料彙整 Data Aggregation

課堂筆記:
◆ UNIT4A:`dplyr`套件簡介 ( html )
◆ UNIT4B:資料群組與群組運算 ( html )
◆ tafeng/01_Prep:資料清理與彙整 ( html )

教材下載: 
◆ 教材資料夾 ( ~/1331cm512/ )
◆ Unit04單元資料夾 ( ~/1331cm512/04資料框整理套件/ )
◇ unit04_dplyr.zip (第四單元)
◇ tafeng.zip (期中案例)

第四周作業: Due: 2024/10/10 (四) 23:59
個人作業:
1. 回答課堂筆記unit04A/B之中的問題,knit好HTML檔,以檔名”學號_unit04A/B.html”
上傳到雲端資料夾[ ~/個人作業/04_dplyr/ ]
2. 完成DataCamp線上課程: Data manipulation with dplyr in R
將認證上傳, 檔名: 學號_dplyr.pdf → 資料夾【 ~/個人作業/04_datacamp_dplyr

課程影片:
◆ Week04 Video Recording

參考連結:
◆  Portal of Big Data BA Platform
◆  R: Self Learning Roadmap
◆  John Hopkins: R Programming online course
◆  John Hopkins: R Programming eBook
◆  Harvard: Data Science online course
◆  Harvard: Data Science ebook