Skip to content

エビデンスに基づくモデル選択:線形モデルが勾配ブースティング決定木を上回る状況とその理由

License

Notifications You must be signed in to change notification settings

nshrhm/evidence-based-model-selection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

License: CC BY 4.0 Python 3.12.3

Pandas NumPy Scikit-learn Matplotlib Seaborn XGBoost LightGBM SHAP

エビデンスに基づくモデル選択:線形モデルが勾配ブースティング決定木を上回る状況とその理由

概要

本リポジトリは、論文「エビデンスに基づくモデル選択:線形モデルが勾配ブースティング決定木を上回る状況とその理由」で報告された実験コードを公開するものです。本研究は、勾配ブースティング決定木(GBDT)が広く採用されているにもかかわらず、線形モデルが有効な状況を判断するための体系的な基準が不足しているという問題意識に基づいています。計算効率、解釈可能性、外挿能力が要求される応用分野におけるモデル選択に影響を与えるこの知識のギャップに対し、データの特性を分離する5つの体系的な実験を通じて、線形モデルがGBDTを上回る4つの重要な条件を実証的に明らかにしました。

動作環境

本研究の実験コードは、以下の環境で動作確認されています。

  • Python 3.12.3
  • Ubuntu 24.04.3 LTS (WSL2)
  • Intel Core i5-1335U プロセッサ, 8GB RAM

必要なPythonパッケージは requirements.txt に記載されています。以下のコマンドでインストールしてください。

pip install -r requirements.txt

使用方法

リポジトリをクローンした後、以下の手順で各実験を実行できます。

  1. 必要なパッケージをインストールします。
    pip install -r requirements.txt
  2. 各実験は、対応するPythonスクリプトを実行することで再現できます。例えば、実験1を実行するには以下のコマンドを使用します。
    python ex1_model_comparison_linearity.py
    同様に、ex2_low_interaction_comparison.py, ex3_extrapolation_comparison.py, ex4_small_sample_comparison.py, ex5_interpretability_comparison.py を実行することで、それぞれの実験を再現できます。

ライセンス

本リポジトリのコンテンツは、Creative Commons Attribution 4.0 International (CC BY 4.0) ライセンスの下で公開されています。詳細については、LICENSE ファイルをご参照ください。

About

エビデンスに基づくモデル選択:線形モデルが勾配ブースティング決定木を上回る状況とその理由

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages