- 機器學習模型的簡介
藉由白話簡潔的圖文敘述,介紹機器學習的基礎概念與演算法,且建立正確的應用概念。
-
直方圖的分箱方法
介紹 6 種常見的分箱數計算方法,且探討每種方法的適用情境。 -
核密度估計 KDE
介紹核密度估計的概念,與說明其實作的細節。 -
常態性與同質性檢定
介紹常見的檢定方法,且探討不同檢定方法的適用性差異。 -
關聯性與相關性
介紹關聯性與相關性的統計評估指標,且探討其適用情境。 -
特徵縮放 Feature Scaling
介紹特徵縮放的常見方法,且說明其對於機器學習演算法的必要性。
-
判定係數 R-Squared 的解讀
彙整判定係數的概念與常見的誤解。 👈 -
機器學習模型指標的關係
在迴歸問題中,模型的解釋能力指標 R2 與預測能力指標 MAE、RMSE 的關係。 -
平均反正切絕對百分比誤差 MAAPE
在迴歸問題中, MAAPE 能克服 MAPE 當實際值為 0 的問題。
-
模型監控的觀念與策略
在迴歸問題中,模型的監控指標超標,意味著兩種可能 : 過擬合或模型飄移。 -
單點預測誤差的監控
在迴歸問題中,單點預測誤差的監控上界,可採用回測 MAE 作為界限的設定基準,其相當於回測的單點絕對誤差分布的 0.8 倍標準差。
- 2024 台灣資料科學領航計畫
此計畫旨在創造一個資料科學討論與交流園地,藉由業界前輩們的經驗分享,協助學生與社會新鮮人能有更清晰的職涯規劃與發展。