本リポジトリは、論文「エビデンスに基づくモデル選択:線形モデルが勾配ブースティング決定木を上回る状況とその理由」で報告された実験コードを公開するものです。本研究は、勾配ブースティング決定木(GBDT)が広く採用されているにもかかわらず、線形モデルが有効な状況を判断するための体系的な基準が不足しているという問題意識に基づいています。計算効率、解釈可能性、外挿能力が要求される応用分野におけるモデル選択に影響を与えるこの知識のギャップに対し、データの特性を分離する5つの体系的な実験を通じて、線形モデルがGBDTを上回る4つの重要な条件を実証的に明らかにしました。
本研究の実験コードは、以下の環境で動作確認されています。
- Python 3.12.3
- Ubuntu 24.04.3 LTS (WSL2)
- Intel Core i5-1335U プロセッサ, 8GB RAM
必要なPythonパッケージは requirements.txt
に記載されています。以下のコマンドでインストールしてください。
pip install -r requirements.txt
リポジトリをクローンした後、以下の手順で各実験を実行できます。
- 必要なパッケージをインストールします。
pip install -r requirements.txt
- 各実験は、対応するPythonスクリプトを実行することで再現できます。例えば、実験1を実行するには以下のコマンドを使用します。
同様に、
python ex1_model_comparison_linearity.py
ex2_low_interaction_comparison.py
,ex3_extrapolation_comparison.py
,ex4_small_sample_comparison.py
,ex5_interpretability_comparison.py
を実行することで、それぞれの実験を再現できます。
本リポジトリのコンテンツは、Creative Commons Attribution 4.0 International (CC BY 4.0) ライセンスの下で公開されています。詳細については、LICENSE
ファイルをご参照ください。