載入套件與資料

pacman::p_load(plotly,ggplot2,tidyr,dplyr,sf)
load("data/A.rdata")
load("data/B.rdata")


流量最大的6個州(top6)

🌻 SP周內的物流量很大



SP州內的物流狀況

[1] 0.0611 0.4779 0.3336

🌻 即使在SP本周之內,預計到達天數的估計也很不準確

顧客、廠商與訂單分佈

🌻 顧客與廠商的分佈(log trans.)類似但不完全相同

🌻 顧客的到貨天數和延遲天數的樣態是不相容的



預計到達和實際到達天數的相關性

🌻 看來OLIST一直在調整SP州內的物流機制和到貨時間的估計方法



使用模型估計到貨天數

§ 建立模型

用 …

  • a.day:廠商的平均到貨天數 (前三個月的平均值)
  • c_day:顧客所在位置的平均到貨天數 (前六個月的平均值)
  • freight_value:運費 (代表距離、重量、大小)

來估計 …

  • t.total:實際到貨天數
              Estimate Std. Error t value Pr(>|t|)
(Intercept)    -4.4715    0.34404  -13.00 3.21e-38
a.days          0.9708    0.01519   63.92 0.00e+00
c_day           0.5568    0.04265   13.06 1.50e-38
freight_value   0.0191    0.00484    3.95 8.03e-05

§ 估計模型的準確性

  • 對訓練資料的準確性
  • 對測試資料的準確性
[1] 0.622 0.403

🌻 訓練與測試的準確性差很多,但這個問題在我們課程的討論範圍之外



使用模型做策略規劃

§ 策略模擬、策略目標、策略優化

🎯 策略模擬: 試著調整「鬆弛時間(SLACK)」的值

  • 如果「預期到貨日期 = 模型預測值 + 7天」,延遲到貨比例會變成?
  • 如果我們希望「延遲到貨比例」不大於5%,「鬆弛時間」要設為多少天?
  • 鬆弛時間越大越好嗎?
  • 你覺得鬆弛時間設在哪裡最好呢? 為什麼?



🎯 策略模擬: 如果我們希望最大化預期到貨+10 > 實際到貨 > 預期到貨的比例