microhh
diff --git a/‎include_rt/Fluxes_rt.h
Lines changed: 2 additions & 2 deletions b/‎include_rt/Fluxes_rt.h
Lines changed: 2 additions & 2 deletions
diff --git a/‎src_cuda_rt/Fluxes_rt.cu
Lines changed: 6 additions & 59 deletions b/‎src_cuda_rt/Fluxes_rt.cu
Lines changed: 6 additions & 59 deletions
diff --git a/‎src_cuda_rt/Raytracer.cu
Lines changed: 26 additions & 19 deletions b/‎src_cuda_rt/Raytracer.cu
Lines changed: 26 additions & 19 deletions
@@ -58,7 +58,7 @@ class Fluxes_rt
 class Fluxes_broadband_rt : public Fluxes_rt
 {
     public:
-        Fluxes_broadband_rt(const int ncol_x, const int ncol_y, const int nlev);
+        Fluxes_broadband_rt(const int ncol_x, const int ncol_y, const int n_z, const int nlev);
         virtual ~Fluxes_broadband_rt() {};
 
         virtual void net_flux();
@@ -113,7 +113,7 @@ class Fluxes_broadband_rt : public Fluxes_rt
 class Fluxes_byband_rt : public Fluxes_broadband_rt
 {
     public:
-        Fluxes_byband_rt(const int ncol_x, const int ncol_y, const int nlev, const int nbnd);
+        Fluxes_byband_rt(const int ncol_x, const int ncol_y, const int n_z, const int nlev, const int nbnd);
         virtual ~Fluxes_byband_rt() {};
 
         virtual void reduce(
 
@@ -116,61 +116,8 @@ namespace
     }
 }
 
-//namespace rrtmgp_kernel_launcher
-//{
-//    
-//    void sum_broadband(
-//            int ncol, int nlev, int ngpt,
-//            const Array<Float,3>& spectral_flux, Array<Float,2>& broadband_flux)
-//    {
-//        rrtmgp_kernels::sum_broadband(
-//                &ncol, &nlev, &ngpt,
-//                const_cast<Float*>(spectral_flux.ptr()),
-//                broadband_flux.ptr());
-//    }
-//
-//    
-//    void net_broadband(
-//            int ncol, int nlev,
-//            const Array<Float,2>& broadband_flux_dn, const Array<Float,2>& broadband_flux_up,
-//            Array<Float,2>& broadband_flux_net)
-//    {
-//        rrtmgp_kernels::net_broadband_precalc(
-//                &ncol, &nlev,
-//                const_cast<Float*>(broadband_flux_dn.ptr()),
-//                const_cast<Float*>(broadband_flux_up.ptr()),
-//                broadband_flux_net.ptr());
-//    }
-//
-//    
-//    void sum_byband(
-//            int ncol, int nlev, int ngpt, int nbnd,
-//            const Array<int,2>& band_lims,
-//            const Array<Float,3>& spectral_flux,
-//            Array<Float,3>& byband_flux)
-//    {
-//        rrtmgp_kernels::sum_byband(
-//                &ncol, &nlev, &ngpt, &nbnd,
-//                const_cast<int*>(band_lims.ptr()),
-//                const_cast<Float*>(spectral_flux.ptr()),
-//                byband_flux.ptr());
-//    }
-//
-//    
-//    void net_byband(
-//            int ncol, int nlev, int nband,
-//            const Array<Float,3>& byband_flux_dn, const Array<Float,3>& byband_flux_up,
-//            Array<Float,3>& byband_flux_net)
-//    {
-//        rrtmgp_kernels::net_byband_precalc(
-//                &ncol, &nlev, &nband,
-//                const_cast<Float*>(byband_flux_dn.ptr()),
-//                const_cast<Float*>(byband_flux_up.ptr()),
-//                byband_flux_net.ptr());
-//    }
-
-
-Fluxes_broadband_rt::Fluxes_broadband_rt(const int ncol_x, const int ncol_y, const int nlev) :
+
+Fluxes_broadband_rt::Fluxes_broadband_rt(const int ncol_x, const int ncol_y, const int n_z, const int nlev) :
     flux_up     ({ncol_x*ncol_y, nlev}),
     flux_dn     ({ncol_x*ncol_y, nlev}),
     flux_dn_dir ({ncol_x*ncol_y, nlev}),
@@ -180,8 +127,8 @@ Fluxes_broadband_rt::Fluxes_broadband_rt(const int ncol_x, const int ncol_y, con
     flux_sfc_dir({ncol_x, ncol_y}),
     flux_sfc_dif({ncol_x, ncol_y}),
     flux_sfc_up ({ncol_x, ncol_y}),
-    flux_abs_dir({ncol_x, ncol_y, nlev-1}),
-    flux_abs_dif({ncol_x, ncol_y, nlev-1})
+    flux_abs_dir({ncol_x, ncol_y, n_z}),
+    flux_abs_dif({ncol_x, ncol_y, n_z})
 {}
 
 
@@ -259,8 +206,8 @@ void Fluxes_broadband_rt::reduce(
 }
 
 
-Fluxes_byband_rt::Fluxes_byband_rt(const int ncol_x, const int ncol_y, const int nlev, const int nbnd) :
-    Fluxes_broadband_rt(ncol_x, ncol_y, nlev),
+Fluxes_byband_rt::Fluxes_byband_rt(const int ncol_x, const int ncol_y, const int n_z, const int nlev, const int nbnd) :
+    Fluxes_broadband_rt(ncol_x, ncol_y, n_z, nlev),
     bnd_flux_up    ({ncol_x * ncol_y, nlev, nbnd}),
     bnd_flux_dn    ({ncol_x * ncol_y, nlev, nbnd}),
     bnd_flux_dn_dir({ncol_x * ncol_y, nlev, nbnd}),
 
@@ -86,8 +86,8 @@ namespace
         const int icol_x = blockIdx.x*blockDim.x + threadIdx.x;
         const int icol_y = blockIdx.y*blockDim.y + threadIdx.y;
         const int iz = blockIdx.z*blockDim.z + threadIdx.z;
-        
-        if ( (icol_x < grid_cells.x) && (icol_y < grid_cells.y) && (iz < (grid_cells.z - 1)) )
+
+        if ( (icol_x < grid_cells.x) && (icol_y < grid_cells.y) && (iz < (grid_cells.z-1)) )
         {
             const int idx = icol_x + icol_y*grid_cells.x + iz*grid_cells.y*grid_cells.x;
             const Float kext_tot = tau_tot[idx] / grid_d.z;
@@ -96,6 +96,7 @@ namespace
             const Float ksca_cld = kext_cld * ssa_cld[idx];
             const Float ksca_aer = kext_aer * ssa_aer[idx];
             const Float ksca_gas = kext_tot * ssa_tot[idx] - ksca_cld - ksca_aer;
+
             k_ext[idx] = tau_tot[idx] / grid_d.z;
 
             scat_asy[idx].k_sca_gas = ksca_gas;
@@ -106,6 +107,7 @@ namespace
         }
     }
 
+
     __global__
     void bundles_optical_props_tod(
             const Vector<int> grid_cells, const Vector<Float> grid_d, const int n_lev,
@@ -119,7 +121,7 @@ namespace
 
         const int z_tod = grid_cells.z - 1;
 
-        if ( (icol_x < grid_cells.x) && (icol_y < grid_cells.y))
+        if ( (icol_x < grid_cells.x) && (icol_y < grid_cells.y) )
         {
             Float tau_tot_sum = Float(0.);
             Float tausca_tot_sum = Float(0.);
@@ -129,27 +131,29 @@ namespace
 
             Float tausca_aer_sum = Float(0.);
             Float tauscag_aer_sum = Float(0.);
-            
+
             for (int iz=z_tod; iz<n_lev; ++iz)
             {
                 const int idx = icol_x + icol_y*grid_cells.x + iz*grid_cells.y*grid_cells.x;
+
                 tau_tot_sum += tau_tot[idx];
                 tausca_tot_sum += tau_tot[idx] * ssa_tot[idx];
-                
+
                 tausca_cld_sum += tau_cld[idx] * ssa_cld[idx];
                 tauscag_cld_sum += tau_cld[idx] * ssa_cld[idx] * asy_cld[idx];
-                
+
                 tausca_aer_sum += tau_aer[idx] * ssa_aer[idx];
                 tauscag_aer_sum += tau_aer[idx] * ssa_aer[idx] * asy_aer[idx];
             }
 
             const int idx = icol_x + icol_y*grid_cells.x + z_tod*grid_cells.y*grid_cells.x;
-            
+
             const Float kext_tot = tau_tot_sum / grid_d.z;
-            
+
             const Float ksca_cld = tausca_cld_sum / grid_d.z;
             const Float ksca_aer = tausca_aer_sum / grid_d.z;
             const Float ksca_gas = tausca_tot_sum / grid_d.z - ksca_cld - ksca_aer;
+
             k_ext[idx] = kext_tot;
 
             scat_asy[idx].k_sca_gas = ksca_gas;
@@ -171,7 +175,7 @@ namespace
         const int icol_x = blockIdx.x*blockDim.x + threadIdx.x;
         const int icol_y = blockIdx.y*blockDim.y + threadIdx.y;
 
-        if ( ( icol_x < grid_cells.x) && ( icol_y < grid_cells.y) )
+        if ( (icol_x < grid_cells.x) && (icol_y < grid_cells.y) )
         {
             const int idx = icol_x + icol_y*grid_cells.x;
             const Float flux_per_ray = toa_src / photons_per_col;
@@ -183,6 +187,7 @@ namespace
         }
     }
 
+
     __global__
     void count_to_flux_3d(
             const Vector<int> grid_cells, const Float photons_per_col,
@@ -197,7 +202,9 @@ namespace
         if ( ( icol_x < grid_cells.x) && ( icol_y < grid_cells.y) && ( iz < grid_cells.z))
         {
             const int idx = icol_x + icol_y*grid_cells.x + iz*grid_cells.x*grid_cells.y;
+
             const Float flux_per_ray = toa_src / photons_per_col;
+
             flux_1[idx] = count_1[idx] * flux_per_ray / grid_d.z;
             flux_2[idx] = count_2[idx] * flux_per_ray / grid_d.z;
         }
@@ -280,8 +287,8 @@ void Raytracer::trace_rays(
             tau_cloud.ptr(), ssa_cloud.ptr(), asy_cloud.ptr(),
             tau_aeros.ptr(), ssa_aeros.ptr(), asy_aeros.ptr(),
             k_ext.ptr(), scat_asy.ptr());
-    
-    // second, integrate from TOD to TOA 
+
+    // second, integrate from TOD to TOA
     bundles_optical_props_tod<<<grid_2d, block_2d>>>(
             grid_cells, grid_d, n_lay,
             tau_total.ptr(), ssa_total.ptr(),
@@ -337,37 +344,37 @@ void Raytracer::trace_rays(
     // smallest two power that is larger than grid dimension (minimum of 2 is currently required)
     const Int qrng_grid_x = std::max(Float(2), pow(Float(2.), ceil(std::log2(Float(grid_cells.x)))) );
     const Int qrng_grid_y = std::max(Float(2), pow(Float(2.), ceil(std::log2(Float(grid_cells.y)))) );
-   
+
     // total number of photons
     const Int photons_total = photons_per_pixel * qrng_grid_x * qrng_grid_y;
 
     // number of photons per thread, this should a power of 2 and nonzero
     Float photons_per_thread_tmp = std::max(Float(1), static_cast<Float>(photons_total) / (rt_kernel_grid * rt_kernel_block));
     Int photons_per_thread = pow(Float(2.), std::floor(std::log2(photons_per_thread_tmp)));
-    
+
     // with very low number of columns and photons_per_pixel, we may have too many threads firing a single photons, actually exceeding photons_per pixel
     // In that case, reduce grid and block size
     Int actual_photons_per_pixel = photons_per_thread * rt_kernel_grid * rt_kernel_block / (qrng_grid_x * qrng_grid_y);
-    
+
     int rt_kernel_grid_size = rt_kernel_grid;
     int rt_kernel_block_size = rt_kernel_block;
     while ( (actual_photons_per_pixel > photons_per_pixel) )
     {
         if (rt_kernel_grid_size > 1)
             rt_kernel_grid_size /= 2;
         else
-            rt_kernel_block_size /= 2;        
-        
+            rt_kernel_block_size /= 2;
+
         photons_per_thread_tmp = std::max(Float(1), static_cast<Float>(photons_total) / (rt_kernel_grid_size * rt_kernel_block_size));
         photons_per_thread = pow(Float(2.), std::floor(std::log2(photons_per_thread_tmp)));
         actual_photons_per_pixel = photons_per_thread * rt_kernel_grid_size * rt_kernel_block_size / (qrng_grid_x * qrng_grid_y);
     }
-    
+
     dim3 grid(rt_kernel_grid_size);
     dim3 block(rt_kernel_block_size);
-    
+
     const int mie_table_size = mie_cdf.size();
-    
+
     const int qrng_gpt_offset = (igpt-1) * rt_kernel_grid_size * rt_kernel_block_size * photons_per_thread;
     ray_tracer_kernel<<<grid, block,sizeof(Float)*mie_table_size>>>(
             switch_independent_column,