From f37daab5c44335bff17270110258229b13131855 Mon Sep 17 00:00:00 2001
From: Oscarwasoccupied <z_xw99@outlook.com>
Date: Wed, 5 Mar 2025 19:04:00 -0800
Subject: [PATCH 1/2] Add inference_autoregressive.py for autoregressive
 inference

---
 scripts/inference_autoregressive.py | 181 ++++++++++++++++++++++++++++
 1 file changed, 181 insertions(+)
 create mode 100644 scripts/inference_autoregressive.py

diff --git a/scripts/inference_autoregressive.py b/scripts/inference_autoregressive.py
new file mode 100644
index 0000000..bfff45f
--- /dev/null
+++ b/scripts/inference_autoregressive.py
@@ -0,0 +1,181 @@
+#!/usr/bin/env python3
+"""
+BubbleFormer Inference Script
+
+This script runs inference with BubbleFormer models (avit and avit_moe) on different datasets.
+It replaces the need for manually commenting/uncommenting code in Jupyter notebooks.
+
+Usage examples:
+    # Run both models on all datasets (default)
+    python inference_autoregressive.py
+    
+    # Run avit model on sat_92 dataset
+    python inference_autoregressive.py --model avit --dataset sat_92
+    
+    # Run avit_moe model on all datasets
+    python inference_autoregressive.py --model avit_moe --dataset all
+    
+    # Run both models on grav_0.2 dataset
+    python inference_autoregressive.py --model both --dataset grav_0.2
+"""
+
+import os
+import torch
+import argparse
+from collections import OrderedDict
+from bubbleformer.models import get_model
+from bubbleformer.data import BubblemlForecast
+from bubbleformer.utils.losses import LpLoss
+from bubbleformer.utils.plot_utils import plot_bubbleml
+
+def run_inference(model_type, dataset_name):
+    """Run inference with specified model on the specified dataset"""
+    print(f"\n=== Running inference with {model_type} on {dataset_name} ===\n")
+    
+    # Configure paths based on the dataset
+    dataset_paths = {
+        'sat_92': ["/share/crsp/lab/ai4ts/share/BubbleML_f32/PoolBoiling-Saturated-FC72-2D-0.1/Twall-92.hdf5"],
+        'subcooled_100': ["/share/crsp/lab/ai4ts/share/BubbleML_f32/PoolBoiling-SubCooled-FC72-2D-0.1/Twall-100.hdf5"],
+        'grav_0.2': ["/share/crsp/lab/ai4ts/share/BubbleML_f32/PoolBoiling-Gravity-FC72-2D-0.1/gravY-0.2.hdf5"]
+    }
+    
+    # Configure model parameters and paths based on the model type
+    if model_type == 'avit_moe':
+        model_kwargs = {
+            "fields": 4,
+            "patch_size": 16,
+            "embed_dim": 384,
+            "processor_blocks": 12,
+            "num_heads": 6,
+            "drop_path": 0.2,
+            "n_experts": 6,
+            "n_shared_experts": 1,
+            "top_k": 2
+        }
+        weights_path = "/share/crsp/lab/ai4ts/xianwz2/bubbleformer_modify/bubbleformer/bubbleformer_logs/E_6_S_1_A_2_avit_moe_poolboiling_combined_36230238/lightning_logs/version_0/checkpoints/epoch=398-step=199500.ckpt"
+        save_dir_base = "/share/crsp/lab/amowli/xianwz2/bubbleformer_modify/bubbleformer/bubbleformer_logs/E_6_S_1_A_2_avit_moe_poolboiling_combined_36230238/epoch_398_outputs"
+    else:  # avit
+        model_kwargs = {
+            "fields": 4,
+            "patch_size": 16,
+            "embed_dim": 384,
+            "processor_blocks": 12,
+            "num_heads": 6,
+            "drop_path": 0.2
+        }
+        weights_path = "/share/crsp/lab/ai4ts/xianwz2/bubbleformer_modify/bubbleformer/bubbleformer_logs/Modified_Combined_avit_poolboiling_combined_36188451/lightning_logs/version_0/checkpoints/epoch=399-step=200000.ckpt"
+        save_dir_base = "/share/crsp/lab/amowli/xianwz2/bubbleformer_modify/bubbleformer/bubbleformer_logs/Modified_Combined_avit_poolboiling_combined_36188451/epoch_399_outputs"
+    
+    # Set save directory based on dataset
+    save_dir = os.path.join(save_dir_base, dataset_name)
+    
+    # Create dataset
+    test_path = dataset_paths[dataset_name]
+    test_dataset = BubblemlForecast(
+        filenames=test_path,
+        fields=["dfun", "temperature", "velx", "vely"],
+        norm="none",
+        time_window=5,
+        start_time=95
+    )
+    
+    # Load model
+    model = get_model(model_type, **model_kwargs)
+    
+    # Load weights
+    model_data = torch.load(weights_path, weights_only=False)
+    print(model_data.keys())
+    
+    diff_term, div_term = model_data['hyper_parameters']['normalization_constants']
+    diff_term = torch.tensor(diff_term)
+    div_term = torch.tensor(div_term)
+    
+    weight_state_dict = OrderedDict()
+    for key, val in model_data["state_dict"].items():
+        name = key[6:]
+        weight_state_dict[name] = val
+    del model_data
+    
+    model.load_state_dict(weight_state_dict, strict=False)
+    
+    # Normalize dataset - ignoring return values as we already have the constants
+    _ = test_dataset.normalize(diff_term, div_term)
+    
+    criterion = LpLoss(d=2, p=2, reduce_dims=[0,1], reductions=["mean", "mean"])
+    model.eval()
+    
+    start_time = test_dataset.start_time
+    skip_itrs = test_dataset.time_window
+    model_preds = []
+    model_targets = []
+    timesteps = []
+    
+    # Run inference
+    for itr in range(0, 500, skip_itrs):
+        inp, tgt = test_dataset[itr]
+        print(f"Autoreg pred {itr}, inp tw [{start_time+itr}, {start_time+itr+skip_itrs}], tgt tw [{start_time+itr+skip_itrs}, {start_time+itr+2*skip_itrs}]")
+        
+        if len(model_preds) > 0:
+            inp = model_preds[-1]  # T, C, H, W
+            
+        inp = inp.float().unsqueeze(0)
+        pred = model(inp)
+        pred = pred.squeeze(0).detach().cpu()
+        tgt = tgt.detach().cpu()
+        
+        model_preds.append(pred)
+        model_targets.append(tgt)
+        timesteps.append(torch.arange(start_time+itr+skip_itrs, start_time+itr+2*skip_itrs))
+        
+        print(criterion(pred, tgt))
+    
+    # Process results
+    model_preds = torch.cat(model_preds, dim=0)         # T, C, H, W
+    model_targets = torch.cat(model_targets, dim=0)     # T, C, H, W
+    timesteps = torch.cat(timesteps, dim=0)             # T
+    
+    num_var = len(test_dataset.fields)                  # C
+    preds = model_preds * div_term.view(1, num_var, 1, 1) + diff_term.view(1, num_var, 1, 1)     # denormalize
+    targets = model_targets * div_term.view(1, num_var, 1, 1) + diff_term.view(1, num_var, 1, 1) # denormalize
+    
+    # Save results
+    os.makedirs(save_dir, exist_ok=True)
+    save_path = os.path.join(save_dir, "predictions.pt")
+    torch.save({"preds": preds, "targets": targets, "timesteps": timesteps}, save_path)
+    
+    # Plot results
+    plot_bubbleml(preds, targets, timesteps, save_dir)
+    
+    print(f"Inference completed for {model_type} on {dataset_name}")
+    print(f"Results saved to {save_dir}")
+
+def main():
+    # Parse command-line arguments
+    parser = argparse.ArgumentParser(description='Run inference with bubbleformer models')
+    parser.add_argument('--model', type=str, choices=['avit', 'avit_moe', 'both'], default='both',
+                        help='Model type: avit, avit_moe, or both (default: both)')
+    parser.add_argument('--dataset', type=str, choices=['sat_92', 'subcooled_100', 'grav_0.2', 'all'], default='all',
+                        help='Dataset to run inference on (default: all)')
+    args = parser.parse_args()
+    
+    # Determine which models to run
+    models_to_run = []
+    if args.model == 'both':
+        models_to_run = ['avit', 'avit_moe']
+    else:
+        models_to_run = [args.model]
+    
+    # Determine which datasets to run
+    datasets_to_run = []
+    if args.dataset == 'all':
+        datasets_to_run = ['sat_92', 'subcooled_100', 'grav_0.2']
+    else:
+        datasets_to_run = [args.dataset]
+    
+    # Run inference for each model on each dataset
+    for model_type in models_to_run:
+        for dataset_name in datasets_to_run:
+            run_inference(model_type, dataset_name)
+
+if __name__ == "__main__":
+    main()
\ No newline at end of file

From 3e2632f55a1ed8b1389c980881c2fb45f24cebab Mon Sep 17 00:00:00 2001
From: Oscarwasoccupied <z_xw99@outlook.com>
Date: Wed, 5 Mar 2025 19:05:44 -0800
Subject: [PATCH 2/2] Update .gitignore to exclude CSV files

---
 .gitignore | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/.gitignore b/.gitignore
index 9facdec..3190c90 100644
--- a/.gitignore
+++ b/.gitignore
@@ -26,3 +26,5 @@ outputs/
 
 # Wandb API key
 bubbleformer/config/wandb_api_key.txt
+
+*.csv
\ No newline at end of file