💐AI商業大數據平台推廣說明會💐

📅 時間： 2025/05/07 (三) 12:10 ~ 13:00

🏠 地點：管理學院 3051 教室

👨 主持人：資管系康藝晃副教授

👉 報名網址： https://forms.gle/chWfoEfpEPHzt4Gt6

隨著大數據技術與機器學習應用的迅速發展，Hadoop、Spark與Kubeflow已成為現代資料處理與模型開發中不可或缺的三大核心架構。

Hadoop提供可靠的分散式儲存與批次處理功能，能處理超過單一電腦或伺服器容量的大型資料集，彷彿一座協同運作的資料倉儲中心，而Spark則透過記憶體內運算機制，大幅減少磁碟讀寫時間，讓資料處理的速度實現數十倍提升，特別適合需要快速反覆運算的應用場景。

Kubeflow則進一步滿足機器學習開發者的需求，透過網頁介面即可快速建置可執行的 Notebook環境，不需自行部署開發環境與套件，並支援GPU資源配置，你可以依需求選擇熟悉的開發工具，如 JupyterHub、RStudio 或 CodeServer，並彈性調整所需的 CPU、RAM與儲存空間，整個流程如同開啟一間雲端工作室，讓開發與訓練工作在同一平台上進行。

對於從事資料分析或雲端運算的研究人員與實務工作者而言，理解這些技術的架構設計與應用場景至關重要，本次工作坊將結合理論與實作，內容包括：

Topic 1 : Hadoop 與 Spark 在分散式資料處理中的應用

HDFS 基礎操作與 R 語言連線教學
巨量資料範例實作與效能分析

Topic 2 : 雲端機器學習平台 Kubeflow 操作實務

Notebook 環境配置與 GPU 資源申請
開發環境操作（RStudio、JupyterHub、CodeServer）

探索巨量資料與雲端AI技術──Hadoop、Spark、Kubeflow 整合應用平台說明會圓滿舉行

隨著大數據與機器學習技術日益成熟，分散式計算與雲端平台已成為現代資料分析與模型開發不可或缺的基礎。為推廣管理學院商業大數據平台的建置成果與應用潛力，大數據計畫團隊於2025年5月7日舉辦「AI商業大數據平台推廣說明會」，邀請院內師生參與，深入了解平台在資料儲存、分析處理與AI開發等方面的整合能力。

活動由資訊管理學系康藝晃副教授開場，引介平台架構與發展理念。主軸聚焦於三項核心技術：Hadoop、Spark 與 Kubeflow，康副教授及其研究室團隊成員李柏翰同學、鄒佩蓁同學、吳芃儀同學透過實機展示與操作說明，帶領與會者掌握從巨量資料儲存、快速處理，到雲端機器學習開發的完整流程。

說明會首先介紹Hadoop提供穩定的分散式儲存與批次處理能力，模擬企業級資料倉儲環境，協助使用者能處理超出單機容量的大型資料集。接著介紹的Spark，以記憶體內運算技術大幅提升資料處理效率，特別適用於需即時分析與反覆運算的商業應用場景。康副教授並以實例說明如何利用 Spark 進行商業交易資料分析，讓師生對其效能與應用情境有直觀理解。

說明會另一重點為 Kubeflow 雲端機器學習平台的操作實務。研究室團隊成員現場示範如何透過網頁介面快速建立 Notebook 開發環境，無需自行安裝複雜套件，即可啟動熟悉的工具如 JupyterHub、RStudio 或 CodeServer，並介紹 GPU 資源申請與配置方式，協助參與者彈性調整 CPU、RAM 與儲存空間，打造個人化的雲端開發工作室，實現 AI 開發與訓練流程的一站式整合。

康藝晃副教授表示，商業大數據平台不僅支援教學與研究工作，更可作為學生進行實務專題與企業模擬分析的重要基礎。透過本次說明會，與會師生對平台架構與實作流程有了更完整的認識，也為未來跨領域合作與創新應用奠定良好基礎。

撰稿：莊碧芬

編修：康藝晃副教授、卓雍然助理教授

海報

康藝晃副教授說明商業大數據平台可提供的應用與服務

研究室團隊成員鄒佩蓁同學呈現系統功能及實際操作示範

同學積極提問

康藝晃副教授回應學生們提問

說明會結束後，師生互動啟發學習的精彩瞬間(右三：康藝晃副教授)

說明會結束後，師生互動啟發學習的精彩瞬間(左二：卓雍然助理教授)