ML4SCI · aduplins · Sep 29, 2025 · Sep 29, 2025 · Sep 29, 2025 · Sep 29, 2025
diff --git a/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/RCAN.ipynb b/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/RCAN.ipynb
diff --git a/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/SwinIR.ipynb b/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/SwinIR.ipynb
diff --git a/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/readme.txt b/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/readme.txt
@@ -0,0 +1 @@
+Baseline models for superresolution
diff --git a/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/satGAN.ipynb b/Difflense_Aleksandr_Duplinskii/Baseline_SR_models/satGAN.ipynb
diff --git a/Difflense_Aleksandr_Duplinskii/Conditional_diffusion/dataloaders.py b/Difflense_Aleksandr_Duplinskii/Conditional_diffusion/dataloaders.py
diff --git a/Difflense_Aleksandr_Duplinskii/Conditional_diffusion/evaluation.py b/Difflense_Aleksandr_Duplinskii/Conditional_diffusion/evaluation.py
@@ -0,0 +1,248 @@
+from typing import Tuple
+import torch
+import torch.nn.functional as F
+
+@torch.no_grad()
+def psnr_torch(pred: torch.Tensor, target: torch.Tensor, eps: float = 1e-10) -> torch.Tensor:
+    """pred, target in [0,1], shape [B,1,H,W] -> [B]"""
+    mse = F.mse_loss(pred, target, reduction='none').mean(dim=[1,2,3])  # [B]
+    psnr = -10.0 * torch.log10(mse + eps)
+    return psnr  # [B]
+
+def _gaussian_window(window_size: int = 11, sigma: float = 1.5, device='cpu', dtype=torch.float32) -> torch.Tensor:
+    coords = torch.arange(window_size, dtype=dtype, device=device) - window_size // 2
+    g = torch.exp(-(coords**2) / (2 * sigma * sigma))
+    g = (g / g.sum()).unsqueeze(0)  # [1, W]
+    window = (g.t() @ g)           # [W, W]
+    return window
+
+def _ssim_components(x, y, window, K=(0.01, 0.03)):
+    """x,y in [0,1], shape [B,1,H,W], window [W,W] normalized."""
+    C1 = (K[0] ** 2)
+    C2 = (K[1] ** 2)
+    pad = window.shape[0] // 2
+    w = window.expand(x.size(1), 1, *window.shape).to(x.dtype).to(x.device)  # [C,1,W,W]
+
+    mu_x = F.conv2d(x, w, padding=pad, groups=x.size(1))
+    mu_y = F.conv2d(y, w, padding=pad, groups=y.size(1))
+    mu_x2, mu_y2, mu_xy = mu_x * mu_x, mu_y * mu_y, mu_x * mu_y
+
+    sigma_x2 = F.conv2d(x * x, w, padding=pad, groups=x.size(1)) - mu_x2
+    sigma_y2 = F.conv2d(y * y, w, padding=pad, groups=y.size(1)) - mu_y2
+    sigma_xy = F.conv2d(x * y, w, padding=pad, groups=x.size(1)) - mu_xy
+
+    # Luminance, contrast, structure terms
+    l = (2 * mu_xy + C1) / (mu_x2 + mu_y2 + C1)
+    c = (2 * torch.sqrt(torch.clamp(sigma_x2, min=0)) * torch.sqrt(torch.clamp(sigma_y2, min=0)) + C2) /         (sigma_x2 + sigma_y2 + C2)
+    s = (sigma_xy + C2 / 2) / (torch.sqrt(torch.clamp(sigma_x2, min=0)) * torch.sqrt(torch.clamp(sigma_y2, min=0)) + C2 / 2 + 1e-12)
+    return l, c, s  # each [B,1,H,W]
+
+@torch.no_grad()
+def ssim_torch(pred: torch.Tensor, target: torch.Tensor, window_size: int = 11, sigma: float = 1.5) -> torch.Tensor:
+    """Single-scale SSIM. Returns per-sample SSIM [B]."""
+    window = _gaussian_window(window_size, sigma, device=pred.device, dtype=pred.dtype)
+    l, c, s = _ssim_components(pred, target, window)
+    ssim_map = l * c * s
+    return ssim_map.mean(dim=[1,2,3])
+
+@torch.no_grad()
+def msssim_torch(pred: torch.Tensor, target: torch.Tensor, window_size: int = 11, sigma: float = 1.5, levels: int = 5) -> torch.Tensor:
+    """Multi-scale SSIM (Wang et al. 2003) with standard weights for 5 levels."""
+    weights = torch.tensor([0.0448, 0.2856, 0.3001, 0.2363, 0.1333], device=pred.device, dtype=pred.dtype)
+    weights = weights[:levels]
+    window = _gaussian_window(window_size, sigma, device=pred.device, dtype=pred.dtype)
+
+    mcs = []
+    x, y = pred, target
+    for i in range(levels):
+        l, c, s = _ssim_components(x, y, window)
+        if i < levels - 1:
+            mcs.append(c * s)  # contrast*structure for intermediate scales
+            x = F.avg_pool2d(x, kernel_size=2, stride=2, padding=0)
+            y = F.avg_pool2d(y, kernel_size=2, stride=2, padding=0)
+        else:
+            ms_ssim_map = l * c * s
+
+    mcs = torch.stack([mc.mean(dim=[1,2,3]) for mc in mcs], dim=1) if len(mcs) else torch.ones(pred.size(0), 0, device=pred.device, dtype=pred.dtype)
+    s_l = ms_ssim_map.mean(dim=[1,2,3])  # [B]
+    if mcs.numel() > 0:
+        out = torch.prod(mcs ** weights[:-1], dim=1) * (s_l ** weights[-1])
+    else:
+        out = s_l
+    return out  # [B]
+
+
+def mae(pred, target):
+    """Mean Absolute Error"""
+    return F.l1_loss(pred, target).item()
+
+def mse(pred, target):
+    """Mean Squared Error"""
+    return F.mse_loss(pred, target).item()
+
+
+@torch.no_grad()
+def evaluate_sr(
+    ema_model,
+    sample_epsilon_conditional,
+    test_loader,
+    DEVICE='cuda',
+    MAX_SAMPLES: int = 1000,
+):
+    ema_model.eval()
+    n_done = 0
+    psnr_sum = 0.0
+    ssim_sum = 0.0
+    msssim_sum = 0.0
+    mae_sum = 0.0
+    mse_sum = 0.0
+
+    for batch in test_loader:
+        high_res_batch, low_res_batch = batch
+
+        if n_done >= MAX_SAMPLES:
+            break
+        remain = MAX_SAMPLES - n_done
+        if high_res_batch.size(0) > remain:
+            high_res_batch = high_res_batch[:remain]
+            low_res_batch = low_res_batch[:remain]
+
+        high_res_batch = high_res_batch.to(DEVICE)
+        low_res_batch = low_res_batch.to(DEVICE)
+
+        preds = sample_epsilon_conditional(ema_model, x_cond=low_res_batch)
+
+        # Map to [0,1]
+        preds = preds.clamp(0.0, 1.0)               # predicted HR
+        high_res_batch = (high_res_batch + 1) / 2.0 # GT HR
+
+        # Ensure [B,1,H,W]
+        if preds.dim() == 3:
+            preds = preds.unsqueeze(1)
+        if high_res_batch.dim() == 3:
+            high_res_batch = high_res_batch.unsqueeze(1)
+
+        # Per-image metrics (assume psnr_torch/ssim_torch/msssim_torch -> [B])
+        psnr_vals   = psnr_torch(preds, high_res_batch)     # [B]
+        ssim_vals   = ssim_torch(preds, high_res_batch)     # [B]
+        msssim_vals = msssim_torch(preds, high_res_batch)   # [B]
+
+        # MAE/MSE per image: reduce over pixels per sample, then mean over batch
+        # reduction='none' -> [B,1,H,W] -> collapse spatial dims per sample
+        mae_vals = F.l1_loss(preds, high_res_batch, reduction='none') \
+                     .view(preds.size(0), -1).mean(dim=1)            # [B]
+        mse_vals = F.mse_loss(preds, high_res_batch, reduction='none') \
+                     .view(preds.size(0), -1).mean(dim=1)            # [B]
+
+        psnr_sum   += psnr_vals.sum().item()
+        ssim_sum   += ssim_vals.sum().item()
+        msssim_sum += msssim_vals.sum().item()
+        mae_sum    += mae_vals.sum().item()
+        mse_sum    += mse_vals.sum().item()
+        n_done     += preds.size(0)
+
+        # live progress
+        if n_done % 100 == 0 or n_done == MAX_SAMPLES:
+            print(f"[eval] {n_done}/{MAX_SAMPLES} — "
+                  f"PSNR: {psnr_sum/n_done:.3f}  "
+                  f"SSIM: {ssim_sum/n_done:.4f}  "
+                  f"MS-SSIM: {msssim_sum/n_done:.4f}  "
+                  f"MAE: {mae_sum/n_done:.6f}  "
+                  f"MSE: {mse_sum/n_done:.6f}")
+
+        if n_done >= MAX_SAMPLES:
+            break
+
+    psnr_avg    = psnr_sum / n_done
+    ssim_avg    = ssim_sum / n_done
+    msssim_avg  = msssim_sum / n_done
+    mae_avg     = mae_sum / n_done
+    mse_avg     = mse_sum / n_done
+    print(f"\nFINAL ({n_done} images) — "
+          f"PSNR: {psnr_avg:.3f}  SSIM: {ssim_avg:.4f}  MS-SSIM: {msssim_avg:.4f}  "
+          f"MAE: {mae_avg:.12f}  MSE: {mse_avg:.12f}")
+    return psnr_avg, ssim_avg, msssim_avg, mae_avg, mse_avg
+
+
+@torch.no_grad()
+def evaluate_sr_cfg(
+    ema_model,
+    sample_epsilon_conditional_cfg,
+    test_loader,
+    DEVICE='cuda',
+    MAX_SAMPLES: int = 1000,
+    guidance_scale = 1
+):
+    ema_model.eval()
+    n_done = 0
+    psnr_sum = 0.0
+    ssim_sum = 0.0
+    msssim_sum = 0.0
+    mae_sum = 0.0
+    mse_sum = 0.0
+
+    for batch in test_loader:
+        high_res_batch, low_res_batch = batch
+
+        if n_done >= MAX_SAMPLES:
+            break
+        remain = MAX_SAMPLES - n_done
+        if high_res_batch.size(0) > remain:
+            high_res_batch = high_res_batch[:remain]
+            low_res_batch = low_res_batch[:remain]
+
+        high_res_batch = high_res_batch.to(DEVICE)
+        low_res_batch = low_res_batch.to(DEVICE)
+
+        preds = sample_epsilon_conditional_cfg(ema_model, x_cond=low_res_batch, guidance_scale = guidance_scale)
+
+        # Map to [0,1]
+        preds = preds.clamp(0.0, 1.0)               # predicted HR
+        high_res_batch = (high_res_batch + 1) / 2.0 # GT HR
+
+        # Ensure [B,1,H,W]
+        if preds.dim() == 3:
+            preds = preds.unsqueeze(1)
+        if high_res_batch.dim() == 3:
+            high_res_batch = high_res_batch.unsqueeze(1)
+
+        # Per-image metrics (assume psnr_torch/ssim_torch/msssim_torch -> [B])
+        psnr_vals   = psnr_torch(preds, high_res_batch)     # [B]
+        ssim_vals   = ssim_torch(preds, high_res_batch)     # [B]
+        msssim_vals = msssim_torch(preds, high_res_batch)   # [B]
+
+        # MAE/MSE per image: reduce over pixels per sample, then mean over batch
+        # reduction='none' -> [B,1,H,W] -> collapse spatial dims per sample
+        mae_vals = F.l1_loss(preds, high_res_batch, reduction='none') \
+                     .view(preds.size(0), -1).mean(dim=1)            # [B]
+        mse_vals = F.mse_loss(preds, high_res_batch, reduction='none') \
+                     .view(preds.size(0), -1).mean(dim=1)            # [B]
+
+        psnr_sum   += psnr_vals.sum().item()
+        ssim_sum   += ssim_vals.sum().item()
+        msssim_sum += msssim_vals.sum().item()
+        mae_sum    += mae_vals.sum().item()
+        mse_sum    += mse_vals.sum().item()
+        n_done     += preds.size(0)
+
+        # live progress
+        if n_done % 100 == 0 or n_done == MAX_SAMPLES:
+            print(f"[eval] {n_done}/{MAX_SAMPLES} — "
+                  f"PSNR: {psnr_sum/n_done:.3f}  "
+                  f"SSIM: {ssim_sum/n_done:.4f}  "
+                  f"MS-SSIM: {msssim_sum/n_done:.4f}  "
+                  f"MAE: {mae_sum/n_done:.6f}  "
+                  f"MSE: {mse_sum/n_done:.6f}")
+
+        if n_done >= MAX_SAMPLES:
+            break
+
+    psnr_avg    = psnr_sum / n_done
+    ssim_avg    = ssim_sum / n_done
+    msssim_avg  = msssim_sum / n_done
+    mae_avg     = mae_sum / n_done
+    mse_avg     = mse_sum / n_done
+    print(f"\nFINAL ({n_done} images) — "
+          f"PSNR: {psnr_avg:.3f}  SSIM: {ssim_avg:.4f}  MS-SSIM: {msssim_avg:.4f}  "
+          f"MAE: {mae_avg:.12f}  MSE: {mse_avg:.12f}")
+    return psnr_avg, ssim_avg, msssim_avg, mae_avg, mse_avg