From ac29d3cce7d445c9e59a32552e20bf408428585a Mon Sep 17 00:00:00 2001
From: Doc CI Action <rasolca@users.noreply.github.com>
Date: Wed, 19 Jul 2023 13:13:31 +0000
Subject: [PATCH] Doc Refactor `RetiledMatrix` into `Matrix` (#935)

---
 master/annotated.html                         |   11 +-
 master/auxiliary_2norm_2mc_8h_source.html     |    2 +-
 master/band__to__tridiag_8h.html              |    8 +-
 master/band__to__tridiag_8h_source.html       |  108 +-
 master/bt__band__to__tridiag_8h_source.html   |   79 +-
 master/bt__reduction__to__band_8h.html        |   12 +-
 master/bt__reduction__to__band_8h_source.html |   96 +-
 master/cholesky_8h.html                       |    4 +
 master/cholesky_8h_source.html                |   58 +-
 ...lassdlaf_1_1matrix_1_1_matrix-members.html |    7 +-
 master/classdlaf_1_1matrix_1_1_matrix.html    |   67 +-
 ...x_3_01const_01_t_00_01_d_01_4-members.html |   57 +-
 ..._1_matrix_3_01const_01_t_00_01_d_01_4.html |  137 +-
 ..._1_1matrix_1_1_retiled_matrix-members.html |  116 -
 ...lassdlaf_1_1matrix_1_1_retiled_matrix.html |  421 ---
 ...classdlaf_1_1matrix_1_1_retiled_matrix.png |  Bin 775 -> 0 bytes
 ...1_1matrix_1_1internal_1_1_matrix_base.html |    3 +-
 ..._1_1matrix_1_1internal_1_1_matrix_base.png |  Bin 1114 -> 781 bytes
 master/classes.html                           |    2 +-
 master/copy_8h_source.html                    |    2 +-
 .../dir_21834082df7a318c018c9cc963be86ec.html |    2 -
 ...bt__band__to__tridiag_2impl_8h_source.html | 1929 ++++++------
 .../eigensolver_2eigensolver_8h_source.html   |   96 +-
 ..._2reduction__to__band_2impl_8h_source.html | 2697 ++++++++---------
 master/files.html                             |    7 +-
 master/functions_d.html                       |    3 +
 master/functions_func_d.html                  |    3 +
 master/functions_func_r.html                  |    9 +-
 master/functions_func_s.html                  |    6 +
 master/functions_func_w.html                  |    1 -
 master/functions_r.html                       |    9 +-
 master/functions_s.html                       |    6 +
 master/functions_w.html                       |    1 -
 master/gen__eigensolver_8h_source.html        |  154 +-
 master/gen__to__std_8h.html                   |    4 +
 master/gen__to__std_8h_source.html            |  102 +-
 master/hermitian_8h.html                      |    4 +
 master/hermitian_8h_source.html               |  134 +-
 master/hierarchy.html                         |    1 -
 master/matrix_8h.html                         |    1 +
 master/matrix_8h_source.html                  |  526 ++--
 master/multiplication_2general_8h.html        |    4 +
 master/multiplication_2general_8h_source.html |  164 +-
 master/multiplication_2triangular_8h.html     |    4 +
 .../multiplication_2triangular_8h_source.html |  208 +-
 master/norm_8h.html                           |    4 +-
 master/norm_8h_source.html                    |   74 +-
 master/panel_8h_source.html                   |    2 +-
 ...permutations_2general_2impl_8h_source.html |    4 +-
 master/permutations_2general_8h_source.html   |   94 +-
 master/print__csv_8h_source.html              |    4 +-
 master/reduction__to__band_8h.html            |    4 +
 master/reduction__to__band_8h_source.html     |   58 +-
 master/retiled__matrix_8h.html                |  105 -
 master/retiled__matrix_8h_source.html         |  260 --
 master/rot_8h_source.html                     |    2 +-
 master/search/all_10.js                       |   62 +-
 master/search/all_11.js                       |  133 +-
 master/search/all_12.js                       |  104 +-
 master/search/all_13.js                       |   48 +-
 master/search/all_14.js                       |   14 +-
 master/search/all_15.js                       |    8 +-
 master/search/all_16.js                       |   12 +-
 master/search/all_3.js                        |   13 +-
 master/search/all_4.js                        |   32 +-
 master/search/all_5.js                        |   14 +-
 master/search/all_6.js                        |   56 +-
 master/search/all_7.js                        |   36 +-
 master/search/all_8.js                        |   62 +-
 master/search/all_9.js                        |    2 +-
 master/search/all_a.js                        |   32 +-
 master/search/all_b.js                        |   76 +-
 master/search/all_c.js                        |   22 +-
 master/search/all_d.js                        |   28 +-
 master/search/all_e.js                        |   56 +-
 master/search/all_f.js                        |    6 +-
 master/search/classes_0.js                    |   20 +-
 master/search/classes_1.js                    |   14 +-
 master/search/classes_10.js                   |   40 +-
 master/search/classes_11.js                   |   32 +-
 master/search/classes_12.js                   |    8 +-
 master/search/classes_13.js                   |    6 +-
 master/search/classes_2.js                    |   60 +-
 master/search/classes_3.js                    |   32 +-
 master/search/classes_4.js                    |    6 +-
 master/search/classes_5.js                    |    2 +-
 master/search/classes_6.js                    |   14 +-
 master/search/classes_7.js                    |   24 +-
 master/search/classes_8.js                    |   30 +-
 master/search/classes_9.js                    |    2 +-
 master/search/classes_a.js                    |   42 +-
 master/search/classes_b.js                    |   10 +-
 master/search/classes_c.js                    |   30 +-
 master/search/classes_d.js                    |    4 +-
 master/search/classes_e.js                    |    7 +-
 master/search/classes_f.js                    |   42 +-
 master/search/defines_0.js                    |    2 +-
 master/search/defines_1.js                    |    2 +-
 master/search/enums_0.js                      |    2 +-
 master/search/files_0.js                      |    4 +-
 master/search/files_1.js                      |   12 +-
 master/search/files_10.js                     |   10 +-
 master/search/files_11.js                     |   18 +-
 master/search/files_12.js                     |   14 +-
 master/search/files_13.js                     |    4 +-
 master/search/files_2.js                      |   12 +-
 master/search/files_3.js                      |    8 +-
 master/search/files_4.js                      |    6 +-
 master/search/files_5.js                      |    6 +-
 master/search/files_6.js                      |    6 +-
 master/search/files_7.js                      |    2 +-
 master/search/files_8.js                      |    6 +-
 master/search/files_9.js                      |    2 +-
 master/search/files_a.js                      |    2 +-
 master/search/files_b.js                      |   12 +-
 master/search/files_c.js                      |    2 +-
 master/search/files_d.js                      |   14 +-
 master/search/files_e.js                      |    2 +-
 master/search/files_f.js                      |   11 +-
 master/search/functions_0.js                  |    6 +-
 master/search/functions_1.js                  |   16 +-
 master/search/functions_10.js                 |   50 +-
 master/search/functions_11.js                 |    2 +-
 master/search/functions_12.js                 |    4 +-
 master/search/functions_13.js                 |    2 +-
 master/search/functions_14.js                 |   12 +-
 master/search/functions_2.js                  |   52 +-
 master/search/functions_3.js                  |   26 +-
 master/search/functions_4.js                  |   12 +-
 master/search/functions_5.js                  |    6 +-
 master/search/functions_6.js                  |   36 +-
 master/search/functions_7.js                  |   10 +-
 master/search/functions_8.js                  |   22 +-
 master/search/functions_9.js                  |   30 +-
 master/search/functions_a.js                  |   34 +-
 master/search/functions_b.js                  |   10 +-
 master/search/functions_c.js                  |   26 +-
 master/search/functions_d.js                  |   16 +-
 master/search/functions_e.js                  |   45 +-
 master/search/functions_f.js                  |   79 +-
 master/search/related_0.js                    |    2 +-
 master/search/related_1.js                    |    2 +-
 master/search/related_2.js                    |    2 +-
 master/search/typedefs_0.js                   |    4 +-
 master/search/typedefs_1.js                   |    4 +-
 master/search/typedefs_2.js                   |    2 +-
 master/search/variables_0.js                  |    2 +-
 master/search/variables_1.js                  |    4 +-
 master/search/variables_2.js                  |    6 +-
 master/search/variables_3.js                  |    4 +-
 master/search/variables_4.js                  |    2 +-
 master/search/variables_5.js                  |    4 +-
 master/solver_2triangular_8h.html             |    4 +
 master/solver_2triangular_8h_source.html      |  198 +-
 ..._g_p_563250733b77a55bd996211659d75e42.html |    4 +-
 ..._g_p_e566a066992e6980ee13cab3c8831bc5.html |   12 +-
 ..._m_c_9c17309f77611319159a292eeae019d5.html |    4 +-
 ..._m_c_f6049763c467d19a4a2bae31f1d19649.html |   12 +-
 master/tridiag__solver_8h.html                |   16 +-
 master/tridiag__solver_8h_source.html         |  116 +-
 master/util__matrix_8h.html                   |    5 +
 master/util__matrix_8h_source.html            |  538 ++--
 162 files changed, 5097 insertions(+), 5622 deletions(-)
 delete mode 100644 master/classdlaf_1_1matrix_1_1_retiled_matrix-members.html
 delete mode 100644 master/classdlaf_1_1matrix_1_1_retiled_matrix.html
 delete mode 100644 master/classdlaf_1_1matrix_1_1_retiled_matrix.png
 delete mode 100644 master/retiled__matrix_8h.html
 delete mode 100644 master/retiled__matrix_8h_source.html

diff --git a/master/annotated.html b/master/annotated.html
index c1251c57db..2af7c85d4a 100644
--- a/master/annotated.html
+++ b/master/annotated.html
@@ -243,12 +243,11 @@
 <tr id="row_0_7_11_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_panel.html" target="_self">Panel</a></td><td class="desc"></td></tr>
 <tr id="row_0_7_12_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html" target="_self">Panel&lt; axis, const T, D, StoreTransposed::No &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_0_7_13_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_yes_01_4.html" target="_self">Panel&lt; axis, const T, D, StoreTransposed::Yes &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_7_14_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html" target="_self">RetiledMatrix</a></td><td class="desc"></td></tr>
-<tr id="row_0_7_15_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html" target="_self">SubTileSpec</a></td><td class="desc">Contains the information to create a subtile </td></tr>
-<tr id="row_0_7_16_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_tile.html" target="_self">Tile</a></td><td class="desc"></td></tr>
-<tr id="row_0_7_17_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html" target="_self">Tile&lt; const T, D &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_7_18_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_sub_matrix_view.html" target="_self">SubMatrixView</a></td><td class="desc"></td></tr>
-<tr id="row_0_7_19_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html" target="_self">SubPanelView</a></td><td class="desc"></td></tr>
+<tr id="row_0_7_14_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html" target="_self">SubTileSpec</a></td><td class="desc">Contains the information to create a subtile </td></tr>
+<tr id="row_0_7_15_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_tile.html" target="_self">Tile</a></td><td class="desc"></td></tr>
+<tr id="row_0_7_16_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html" target="_self">Tile&lt; const T, D &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_7_17_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_sub_matrix_view.html" target="_self">SubMatrixView</a></td><td class="desc"></td></tr>
+<tr id="row_0_7_18_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html" target="_self">SubPanelView</a></td><td class="desc"></td></tr>
 <tr id="row_0_8_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_8_" class="arrow" onclick="toggleFolder('0_8_')">&#9658;</span><span class="icona"><span class="icon">N</span></span><b>memory</b></td><td class="desc"></td></tr>
 <tr id="row_0_8_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1memory_1_1_memory_chunk.html" target="_self">MemoryChunk</a></td><td class="desc">The class <code><a class="el" href="classdlaf_1_1memory_1_1_memory_chunk.html" title="The class MemoryChunk represents a layer of abstraction over the underlying device memory.">MemoryChunk</a></code> represents a layer of abstraction over the underlying device memory </td></tr>
 <tr id="row_0_8_1_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1memory_1_1_memory_view.html" target="_self">MemoryView</a></td><td class="desc"></td></tr>
diff --git a/master/auxiliary_2norm_2mc_8h_source.html b/master/auxiliary_2norm_2mc_8h_source.html
index 79617de5e1..1f1d7e2f98 100644
--- a/master/auxiliary_2norm_2mc_8h_source.html
+++ b/master/auxiliary_2norm_2mc_8h_source.html
@@ -219,7 +219,7 @@
 <div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;}</div>
 <div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1internal_1_1_policy_html"><div class="ttname"><a href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a></div><div class="ttdef"><b>Definition:</b> policy.h:24</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="adata_8h_html_ae8a4cf6d87f0a72e5daad8a35478f051"><div class="ttname"><a href="data_8h.html#ae8a4cf6d87f0a72e5daad8a35478f051">dlaf::common::make_data</a></div><div class="ttdeci">auto make_data(Data &amp;&amp;data) noexcept</div><div class="ttdef"><b>Definition:</b> data.h:78</div></div>
 <div class="ttc" id="adistribution_8h_html"><div class="ttname"><a href="distribution_8h.html">distribution.h</a></div></div>
 <div class="ttc" id="alapack_2tile_8h_html"><div class="ttname"><a href="lapack_2tile_8h.html">tile.h</a></div></div>
diff --git a/master/band__to__tridiag_8h.html b/master/band__to__tridiag_8h.html
index 1af7e6f608..0d57ca0f0e 100644
--- a/master/band__to__tridiag_8h.html
+++ b/master/band__to__tridiag_8h.html
@@ -151,7 +151,9 @@ <h2 class="memtitle"><span class="permalink"><a href="#a5389b4333d5882eb71a9ccf6
 <dd>
 band_size is a divisor of mat_a.blockSize().cols(), and band_size &gt;= 2 </dd>
 <dd>
-mat_a is not distributed. </dd></dl>
+mat_a is not distributed, </dd>
+<dd>
+mat_a has equal tile and block sizes. </dd></dl>
 
 </div>
 </div>
@@ -221,7 +223,9 @@ <h2 class="memtitle"><span class="permalink"><a href="#ad81b7972326c06b90ed419d9
 <dd>
 band_size is a divisor of mat_a.blockSize().cols() and band_size &gt;= 2, </dd>
 <dd>
-mat_a is distributed according to grid. </dd></dl>
+mat_a is distributed according to grid, </dd>
+<dd>
+mat_a has equal tile and block sizes. </dd></dl>
 
 </div>
 </div>
diff --git a/master/band__to__tridiag_8h_source.html b/master/band__to__tridiag_8h_source.html
index 545db6cee3..8030391e23 100644
--- a/master/band__to__tridiag_8h_source.html
+++ b/master/band__to__tridiag_8h_source.html
@@ -93,60 +93,62 @@
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="keyword">namespace </span><a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a> {</div>
 <div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160; </div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">   74</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a> <a class="code" href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">bandToTridiag</a>(blas::Uplo uplo, SizeType band_size,</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                            Matrix&lt;const T, D&gt;&amp; mat_a) {</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  DLAF_ASSERT(mat_a.blockSize().rows() % band_size == 0, mat_a.blockSize().rows(), band_size);</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160; </div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag.html">internal::BandToTridiag&lt;B, D, T&gt;::call_L</a>(band_size, mat_a);</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  }</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160; </div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="keywordflow">return</span> DLAF_UNREACHABLE(<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a>);</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}</div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160; </div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00145"></a><span class="lineno"><a class="line" href="band__to__tridiag_8h.html#ad81b7972326c06b90ed419d9169351fc">  145</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a> <a class="code" href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">bandToTridiag</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo,</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                                            SizeType band_size, Matrix&lt;const T, device&gt;&amp; mat_a) {</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160; </div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="comment">// If the grid contains only one rank force local implementation.</span></div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keywordflow">if</span> (grid.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>() == <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">comm::Size2D</a>(1, 1))</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordflow">return</span> bandToTridiag&lt;backend, device, T&gt;(uplo, band_size, mat_a);</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">   75</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a> <a class="code" href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">bandToTridiag</a>(blas::Uplo uplo, SizeType band_size,</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                                            Matrix&lt;const T, D&gt;&amp; mat_a) {</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  DLAF_ASSERT(mat_a.blockSize().rows() % band_size == 0, mat_a.blockSize().rows(), band_size);</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160; </div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag.html">internal::BandToTridiag&lt;B, D, T&gt;::call_L</a>(band_size, mat_a);</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  }</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160; </div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="keywordflow">return</span> DLAF_UNREACHABLE(<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a>);</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;}</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160; </div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="band__to__tridiag_8h.html#ad81b7972326c06b90ed419d9169351fc">  148</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a> <a class="code" href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">bandToTridiag</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo,</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;                                            SizeType band_size, Matrix&lt;const T, device&gt;&amp; mat_a) {</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
 <div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160; </div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag.html">internal::BandToTridiag&lt;backend, device, T&gt;::call_L</a>(grid, band_size, mat_a);</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  }</div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160; </div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="keywordflow">return</span> DLAF_UNREACHABLE(<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a>);</div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;}</div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160; </div>
-<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;}</div>
-<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;}</div>
-<div class="ttc" id="aband__to__tridiag_8h_html_a5389b4333d5882eb71a9ccf6a24b2434"><div class="ttname"><a href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">dlaf::eigensolver::bandToTridiag</a></div><div class="ttdeci">TridiagResult&lt; T, Device::CPU &gt; bandToTridiag(blas::Uplo uplo, SizeType band_size, Matrix&lt; const T, D &gt; &amp;mat_a)</div><div class="ttdef"><b>Definition:</b> band_to_tridiag.h:74</div></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  <span class="comment">// If the grid contains only one rank force local implementation.</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  <span class="keywordflow">if</span> (grid.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>() == <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">comm::Size2D</a>(1, 1))</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <span class="keywordflow">return</span> bandToTridiag&lt;backend, device, T&gt;(uplo, band_size, mat_a);</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160; </div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag.html">internal::BandToTridiag&lt;backend, device, T&gt;::call_L</a>(grid, band_size, mat_a);</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  }</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160; </div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  <span class="keywordflow">return</span> DLAF_UNREACHABLE(<a class="code" href="structdlaf_1_1eigensolver_1_1_tridiag_result.html">TridiagResult&lt;T, Device::CPU&gt;</a>);</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;}</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160; </div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;}</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;}</div>
+<div class="ttc" id="aband__to__tridiag_8h_html_a5389b4333d5882eb71a9ccf6a24b2434"><div class="ttname"><a href="band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434">dlaf::eigensolver::bandToTridiag</a></div><div class="ttdeci">TridiagResult&lt; T, Device::CPU &gt; bandToTridiag(blas::Uplo uplo, SizeType band_size, Matrix&lt; const T, D &gt; &amp;mat_a)</div><div class="ttdef"><b>Definition:</b> band_to_tridiag.h:75</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html_a9307e8d79bffad58211c317c92c7dc77"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">dlaf::comm::CommunicatorGrid::size</a></div><div class="ttdeci">Size2D size() const noexcept</div><div class="ttdoc">Return the number of rows in the grid.</div><div class="ttdef"><b>Definition:</b> communicator_grid.h:68</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; IndexT_MPI, TAG_MPI &gt;</a></div></div>
diff --git a/master/bt__band__to__tridiag_8h_source.html b/master/bt__band__to__tridiag_8h_source.html
index b35d41624f..91c970c24f 100644
--- a/master/bt__band__to__tridiag_8h_source.html
+++ b/master/bt__band__to__tridiag_8h_source.html
@@ -121,43 +121,48 @@
 <div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="comment">// @pre band_size is a divisor of mat_hh.blockSize().cols()</span></div>
 <div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="comment">// @pre mat_e is not distributed</span></div>
 <div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="comment">// @pre mat_hh is not distributed</span></div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keywordtype">void</span> backTransformationBandToTridiag(<span class="keyword">const</span> SizeType band_size, matrix::Matrix&lt;T, D&gt;&amp; mat_e,</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                                     matrix::Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_e), mat_e);</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_hh), mat_hh);</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160; </div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_hh), mat_hh);</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_hh), mat_hh);</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160; </div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  DLAF_ASSERT(mat_hh.size().rows() == mat_e.size().rows(), mat_hh, mat_e);</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() == mat_e.blockSize().rows(), mat_hh, mat_e);</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() % band_size == 0, mat_hh.blockSize(), band_size);</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  internal::BackTransformationT2B&lt;B, D, T&gt;::call(band_size, mat_e, mat_hh);</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;}</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160; </div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="keywordtype">void</span> backTransformationBandToTridiag(comm::CommunicatorGrid grid, <span class="keyword">const</span> SizeType band_size,</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                                     matrix::Matrix&lt;T, D&gt;&amp; mat_e,</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                     matrix::Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_e, grid), mat_e, grid);</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_hh, grid), mat_hh, grid);</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160; </div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_hh), mat_hh);</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_hh), mat_hh);</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160; </div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  DLAF_ASSERT(mat_hh.size().rows() == mat_e.size().rows(), mat_hh, mat_e);</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() == mat_e.blockSize().rows(), mat_hh, mat_e);</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160; </div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() % band_size == 0, mat_hh.blockSize(), band_size);</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160; </div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  internal::BackTransformationT2B&lt;B, D, T&gt;::call(grid, band_size, mat_e, mat_hh);</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;}</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">// @pre mat_e has equal tile and block sizes</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">// @pre mat_hh has equal tile and block sizes</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keywordtype">void</span> backTransformationBandToTridiag(<span class="keyword">const</span> SizeType band_size, matrix::Matrix&lt;T, D&gt;&amp; mat_e,</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                                     matrix::Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_e), mat_e);</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_hh), mat_hh);</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160; </div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_hh), mat_hh);</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_hh), mat_hh);</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160; </div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  DLAF_ASSERT(mat_hh.size().rows() == mat_e.size().rows(), mat_hh, mat_e);</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() == mat_e.blockSize().rows(), mat_hh, mat_e);</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160; </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_e), mat_e);</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_hh), mat_hh);</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160; </div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() % band_size == 0, mat_hh.blockSize(), band_size);</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160; </div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  internal::BackTransformationT2B&lt;B, D, T&gt;::call(band_size, mat_e, mat_hh);</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;}</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160; </div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="keywordtype">void</span> backTransformationBandToTridiag(comm::CommunicatorGrid grid, <span class="keyword">const</span> SizeType band_size,</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                                     matrix::Matrix&lt;T, D&gt;&amp; mat_e,</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                                     matrix::Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_e, grid), mat_e, grid);</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_hh, grid), mat_hh, grid);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160; </div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_hh), mat_hh);</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_hh), mat_hh);</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160; </div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  DLAF_ASSERT(mat_hh.size().rows() == mat_e.size().rows(), mat_hh, mat_e);</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() == mat_e.blockSize().rows(), mat_hh, mat_e);</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160; </div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(mat_hh.blockSize().rows() % band_size == 0, mat_hh.blockSize(), band_size);</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160; </div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  internal::BackTransformationT2B&lt;B, D, T&gt;::call(grid, band_size, mat_e, mat_hh);</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;}</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}</div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
diff --git a/master/bt__reduction__to__band_8h.html b/master/bt__reduction__to__band_8h.html
index a8331c8c60..c3dcbe081c 100644
--- a/master/bt__reduction__to__band_8h.html
+++ b/master/bt__reduction__to__band_8h.html
@@ -147,7 +147,11 @@ <h2 class="memtitle"><span class="permalink"><a href="#aa0009f01a9bcae7b94d16e36
 </dl>
 <dl class="section pre"><dt>Precondition</dt><dd>mat_c is distributed, </dd>
 <dd>
-mat_v is distributed according to grid. </dd></dl>
+mat_v is distributed according to grid, </dd>
+<dd>
+mat_c has equal tile and block sizes, </dd>
+<dd>
+mat_v has equal tile and block sizes. </dd></dl>
 
 </div>
 </div>
@@ -202,7 +206,11 @@ <h2 class="memtitle"><span class="permalink"><a href="#a04e50376b3136f312c5c4114
 </dl>
 <dl class="section pre"><dt>Precondition</dt><dd>mat_c is not distributed, </dd>
 <dd>
-mat_v is not distributed. </dd></dl>
+mat_v is not distributed, </dd>
+<dd>
+mat_c has equal tile and block sizes, </dd>
+<dd>
+mat_v has equal tile and block sizes. </dd></dl>
 
 </div>
 </div>
diff --git a/master/bt__reduction__to__band_8h_source.html b/master/bt__reduction__to__band_8h_source.html
index b5bca2d98a..23e2b5e049 100644
--- a/master/bt__reduction__to__band_8h_source.html
+++ b/master/bt__reduction__to__band_8h_source.html
@@ -92,52 +92,56 @@
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="keyword">namespace </span><a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a> {</div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160; </div>
-<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">   39</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">backTransformationReductionToBand</a>(<span class="keyword">const</span> SizeType b, Matrix&lt;T, device&gt;&amp; mat_c,</div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;                                       Matrix&lt;const T, device&gt;&amp; mat_v,</div>
-<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;                                       Matrix&lt;const T, Device::CPU&gt;&amp; mat_taus) {</div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_c), mat_c);</div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_v), mat_v);</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(square_size(mat_v), mat_v);</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(square_blocksize(mat_v), mat_v);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(mat_c.size().rows() == mat_v.size().rows(), mat_c, mat_v);</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(mat_c.blockSize().rows() == mat_v.blockSize().rows(), mat_c, mat_v);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160; </div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  [[maybe_unused]] <span class="keyword">auto</span> nr_reflectors_blocks = [&amp;b, &amp;mat_v]() {</div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    <span class="keyword">const</span> SizeType m = mat_v.size().rows();</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keyword">const</span> SizeType mb = mat_v.blockSize().rows();</div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keywordflow">return</span> std::max&lt;SizeType&gt;(0, util::ceilDiv(m - b - 1, mb));</div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  };</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  DLAF_ASSERT(mat_taus.nrTiles().rows() == nr_reflectors_blocks(), mat_taus.size().rows(), mat_v, b);</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_reduction_to_band.html">internal::BackTransformationReductionToBand&lt;backend, device, T&gt;::call</a>(b, mat_c, mat_v, mat_taus);</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;}</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160; </div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="bt__reduction__to__band_8h.html#aa0009f01a9bcae7b94d16e3696433ef8">   73</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">backTransformationReductionToBand</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <span class="keyword">const</span> SizeType b,</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                                       Matrix&lt;T, device&gt;&amp; mat_c, Matrix&lt;const T, device&gt;&amp; mat_v,</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                       Matrix&lt;const T, Device::CPU&gt;&amp; mat_taus) {</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_c, grid), mat_c, grid);</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_v, grid), mat_v, grid);</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  DLAF_ASSERT(square_size(mat_v), mat_v);</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  DLAF_ASSERT(square_blocksize(mat_v), mat_v);</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  DLAF_ASSERT(mat_c.size().rows() == mat_v.size().rows(), mat_c, mat_v);</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  DLAF_ASSERT(mat_c.blockSize().rows() == mat_v.blockSize().rows(), mat_c, mat_v);</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160; </div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  [[maybe_unused]] <span class="keyword">auto</span> nr_reflectors_blocks = [&amp;b, &amp;mat_v]() {</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keyword">const</span> SizeType m = mat_v.size().rows();</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keyword">const</span> SizeType mb = mat_v.blockSize().rows();</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keywordflow">return</span> mat_v.distribution().template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        std::max&lt;SizeType&gt;(0, util::ceilDiv(m - b - 1, mb)));</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  };</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  DLAF_ASSERT(mat_taus.distribution().localNrTiles().rows() == nr_reflectors_blocks(), mat_taus, mat_v,</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;              b);</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160; </div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_reduction_to_band.html">internal::BackTransformationReductionToBand&lt;backend, device, T&gt;::call</a>(grid, b, mat_c, mat_v, mat_taus);</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;}</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;}</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}</div>
-<div class="ttc" id="abt__reduction__to__band_8h_html_a04e50376b3136f312c5c4114b917ae03"><div class="ttname"><a href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">dlaf::eigensolver::backTransformationReductionToBand</a></div><div class="ttdeci">void backTransformationReductionToBand(const SizeType b, Matrix&lt; T, device &gt; &amp;mat_c, Matrix&lt; const T, device &gt; &amp;mat_v, Matrix&lt; const T, Device::CPU &gt; &amp;mat_taus)</div><div class="ttdef"><b>Definition:</b> bt_reduction_to_band.h:39</div></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">   41</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">backTransformationReductionToBand</a>(<span class="keyword">const</span> SizeType b, Matrix&lt;T, device&gt;&amp; mat_c,</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;                                       Matrix&lt;const T, device&gt;&amp; mat_v,</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;                                       Matrix&lt;const T, Device::CPU&gt;&amp; mat_taus) {</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_c), mat_c);</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_v), mat_v);</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(square_size(mat_v), mat_v);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(square_blocksize(mat_v), mat_v);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(mat_c.size().rows() == mat_v.size().rows(), mat_c, mat_v);</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(mat_c.blockSize().rows() == mat_v.blockSize().rows(), mat_c, mat_v);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(single_tile_per_block(mat_c), mat_c);</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(single_tile_per_block(mat_v), mat_v);</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  [[maybe_unused]] <span class="keyword">auto</span> nr_reflectors_blocks = [&amp;b, &amp;mat_v]() {</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keyword">const</span> SizeType m = mat_v.size().rows();</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keyword">const</span> SizeType mb = mat_v.blockSize().rows();</div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordflow">return</span> std::max&lt;SizeType&gt;(0, util::ceilDiv(m - b - 1, mb));</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  };</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  DLAF_ASSERT(mat_taus.nrTiles().rows() == nr_reflectors_blocks(), mat_taus.size().rows(), mat_v, b);</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160; </div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_reduction_to_band.html">internal::BackTransformationReductionToBand&lt;backend, device, T&gt;::call</a>(b, mat_c, mat_v, mat_taus);</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;}</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160; </div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="bt__reduction__to__band_8h.html#aa0009f01a9bcae7b94d16e3696433ef8">   79</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">backTransformationReductionToBand</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <span class="keyword">const</span> SizeType b,</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                                       Matrix&lt;T, device&gt;&amp; mat_c, Matrix&lt;const T, device&gt;&amp; mat_v,</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                                       Matrix&lt;const T, Device::CPU&gt;&amp; mat_taus) {</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_c, grid), mat_c, grid);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_v, grid), mat_v, grid);</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  DLAF_ASSERT(square_size(mat_v), mat_v);</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  DLAF_ASSERT(square_blocksize(mat_v), mat_v);</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  DLAF_ASSERT(mat_c.size().rows() == mat_v.size().rows(), mat_c, mat_v);</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  DLAF_ASSERT(mat_c.blockSize().rows() == mat_v.blockSize().rows(), mat_c, mat_v);</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  DLAF_ASSERT(single_tile_per_block(mat_c), mat_c);</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  DLAF_ASSERT(single_tile_per_block(mat_v), mat_v);</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160; </div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  [[maybe_unused]] <span class="keyword">auto</span> nr_reflectors_blocks = [&amp;b, &amp;mat_v]() {</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    <span class="keyword">const</span> SizeType m = mat_v.size().rows();</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <span class="keyword">const</span> SizeType mb = mat_v.blockSize().rows();</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    <span class="keywordflow">return</span> mat_v.distribution().template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;        std::max&lt;SizeType&gt;(0, util::ceilDiv(m - b - 1, mb)));</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  };</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  DLAF_ASSERT(mat_taus.distribution().localNrTiles().rows() == nr_reflectors_blocks(), mat_taus, mat_v,</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;              b);</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160; </div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_reduction_to_band.html">internal::BackTransformationReductionToBand&lt;backend, device, T&gt;::call</a>(grid, b, mat_c, mat_v, mat_taus);</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;}</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;}</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;}</div>
+<div class="ttc" id="abt__reduction__to__band_8h_html_a04e50376b3136f312c5c4114b917ae03"><div class="ttname"><a href="bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03">dlaf::eigensolver::backTransformationReductionToBand</a></div><div class="ttdeci">void backTransformationReductionToBand(const SizeType b, Matrix&lt; T, device &gt; &amp;mat_c, Matrix&lt; const T, device &gt; &amp;mat_v, Matrix&lt; const T, Device::CPU &gt; &amp;mat_taus)</div><div class="ttdef"><b>Definition:</b> bt_reduction_to_band.h:41</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="aeigensolver_2eigensolver_8h_html_a7aeed252a1783c24f778eb250d0efd72"><div class="ttname"><a href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">dlaf::eigensolver::eigensolver</a></div><div class="ttdeci">void eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)</div><div class="ttdef"><b>Definition:</b> eigensolver.h:39</div></div>
diff --git a/master/cholesky_8h.html b/master/cholesky_8h.html
index 95ccbbe5aa..762c1b99b7 100644
--- a/master/cholesky_8h.html
+++ b/master/cholesky_8h.html
@@ -129,6 +129,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a016f168408d2fe4c2803538e
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a has equal tile and block sizes </dd>
+<dd>
 mat_a is not distributed. </dd></dl>
 
 </div>
@@ -179,6 +181,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#aed7e035a7eff7eb31eea2936
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a has equal tile and block sizes </dd>
+<dd>
 mat_a is distributed according to grid. </dd></dl>
 
 </div>
diff --git a/master/cholesky_8h_source.html b/master/cholesky_8h_source.html
index 7fce9a290e..cd17c7e960 100644
--- a/master/cholesky_8h_source.html
+++ b/master/cholesky_8h_source.html
@@ -92,34 +92,36 @@
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="keyword">namespace </span>factorization {</div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160; </div>
-<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">   39</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">cholesky</a>(blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a) {</div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160; </div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower)</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_L</a>(mat_a);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_U</a>(mat_a);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;}</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160; </div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="cholesky_8h.html#aed7e035a7eff7eb31eea293621b0c8fa">   65</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">cholesky</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a) {</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160; </div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="comment">// Method only for Lower triangular matrix</span></div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower)</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_L</a>(grid, mat_a);</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_U</a>(grid, mat_a);</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;}</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160; </div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;}</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;}</div>
-<div class="ttc" id="acholesky_8h_html_a016f168408d2fe4c2803538e486d7241"><div class="ttname"><a href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">dlaf::factorization::cholesky</a></div><div class="ttdeci">void cholesky(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a)</div><div class="ttdef"><b>Definition:</b> cholesky.h:39</div></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">   40</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">cholesky</a>(blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a) {</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160; </div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower)</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_L</a>(mat_a);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_U</a>(mat_a);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;}</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160; </div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="cholesky_8h.html#aed7e035a7eff7eb31eea293621b0c8fa">   68</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">cholesky</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a) {</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160; </div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="comment">// Method only for Lower triangular matrix</span></div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower)</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_L</a>(grid, mat_a);</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <a class="code" href="structdlaf_1_1factorization_1_1internal_1_1_cholesky.html">internal::Cholesky&lt;backend, device, T&gt;::call_U</a>(grid, mat_a);</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;}</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160; </div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;}</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;}</div>
+<div class="ttc" id="acholesky_8h_html_a016f168408d2fe4c2803538e486d7241"><div class="ttname"><a href="cholesky_8h.html#a016f168408d2fe4c2803538e486d7241">dlaf::factorization::cholesky</a></div><div class="ttdeci">void cholesky(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a)</div><div class="ttdef"><b>Definition:</b> cholesky.h:40</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
diff --git a/master/classdlaf_1_1matrix_1_1_matrix-members.html b/master/classdlaf_1_1matrix_1_1_matrix-members.html
index e060e8fb26..e0a473e6ad 100644
--- a/master/classdlaf_1_1matrix_1_1_matrix-members.html
+++ b/master/classdlaf_1_1matrix_1_1_matrix-members.html
@@ -89,9 +89,10 @@
   <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(const LocalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">readwrite</a>(const GlobalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>ReadWriteSenderType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>subPipeline</b>() (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>TileDataType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>TileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">retiledSubPipeline</a>(const LocalTileSize &amp;tiles_per_block)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">subPipeline</a>()</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>TileDataType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>TileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
diff --git a/master/classdlaf_1_1matrix_1_1_matrix.html b/master/classdlaf_1_1matrix_1_1_matrix.html
index e537d00dbc..d21a88e613 100644
--- a/master/classdlaf_1_1matrix_1_1_matrix.html
+++ b/master/classdlaf_1_1matrix_1_1_matrix.html
@@ -128,9 +128,10 @@
 <tr class="separator:ad11e9036fe317b6328ae71585b19c811"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:af486e66243b57df94b9822bd2553ae38"><td class="memItemLeft" align="right" valign="top">ReadWriteSenderType&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">readwrite</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;index) noexcept</td></tr>
 <tr class="separator:af486e66243b57df94b9822bd2553ae38"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a720bcfeb6db4c2f2d6e144f8570b8e23"><td class="memItemLeft" align="right" valign="top"><a id="a720bcfeb6db4c2f2d6e144f8570b8e23"></a>
-<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&#160;</td><td class="memItemRight" valign="bottom"><b>subPipeline</b> ()</td></tr>
+<tr class="memitem:a720bcfeb6db4c2f2d6e144f8570b8e23"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">subPipeline</a> ()</td></tr>
 <tr class="separator:a720bcfeb6db4c2f2d6e144f8570b8e23"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae1c8b22f9862944a006003f528595ff"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">retiledSubPipeline</a> (const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;tiles_per_block)</td></tr>
+<tr class="separator:aae1c8b22f9862944a006003f528595ff"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
@@ -430,6 +431,68 @@ <h2 class="memtitle"><span class="permalink"><a href="#ad11e9036fe317b6328ae7158
 <p>Returns a sender of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with local index <code>index</code>.</p>
 <dl class="section pre"><dt>Precondition</dt><dd>index.isIn(distribution().localNrTiles()). </dd></dl>
 
+</div>
+</div>
+<a id="aae1c8b22f9862944a006003f528595ff"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aae1c8b22f9862944a006003f528595ff">&#9670;&nbsp;</a></span>retiledSubPipeline()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;class T , Device D&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>&lt; T, D &gt;::retiledSubPipeline </td>
+          <td>(</td>
+          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;&#160;</td>
+          <td class="paramname"><em>tiles_per_block</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Create a sub-pipelined, retiled matrix which can be accessed thread-safely with respect to the original matrix</p>
+<p>All accesses to the sub-pipelined matrix are sequenced after previous accesses and before later accesses to the original matrix, independently of when tiles are accessed in the sub-pipelined matrix.</p>
+<dl class="section pre"><dt>Precondition</dt><dd>blockSize() is divisible by <code>tiles_per_block</code> </dd>
+<dd>
+blockSize() == baseTileSize() </dd></dl>
+
+</div>
+</div>
+<a id="a720bcfeb6db4c2f2d6e144f8570b8e23"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a720bcfeb6db4c2f2d6e144f8570b8e23">&#9670;&nbsp;</a></span>subPipeline()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;class T , Device D&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>&lt; T, D &gt;::subPipeline </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Create a sub-pipelined matrix which can be accessed thread-safely with respect to the original matrix</p>
+<p>All accesses to the sub-pipelined matrix are sequenced after previous accesses and before later accesses to the original matrix, independently of when tiles are accessed in the sub-pipelined matrix. </p>
+
 </div>
 </div>
 <hr/>The documentation for this class was generated from the following file:<ul>
diff --git a/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4-members.html b/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4-members.html
index 319dcdde6a..fbc1c50649 100644
--- a/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4-members.html
+++ b/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4-members.html
@@ -78,6 +78,8 @@
   <tr bgcolor="#f0f0f0"><td class="entry"><b>ConstTileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>device</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">done</a>(const LocalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2">done</a>(const GlobalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>ElementType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
   <tr bgcolor="#f0f0f0"><td class="entry"><b>Matrix</b>(const LayoutInfo &amp;layout, ElementType *ptr) (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>Matrix</b>(const LayoutInfo &amp;layout, const ElementType *ptr) (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
@@ -87,32 +89,35 @@
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>Matrix</b>(Matrix &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
   <tr bgcolor="#f0f0f0"><td class="entry"><b>Matrix</b>(Distribution distribution) (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">protected</span></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>Matrix</b>(Matrix &amp;mat, const SubPipelineTag) (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>Matrix&lt; ElementType, D &gt;</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>MatrixBase</b>(Distribution distribution) (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>MatrixBase</b>(const Distribution &amp;distribution, const LocalTileSize &amp;tiles_per_block) (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>MatrixBase</b>(const MatrixBase &amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>MatrixBase</b>(MatrixBase &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d">nrTiles</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>operator=</b>(const Matrix &amp;rhs)=delete (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>operator=</b>(Matrix &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>operator=</b>(const MatrixBase &amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>operator=</b>(MatrixBase &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f">rankGlobalTile</a>(const GlobalTileIndex &amp;global_tile) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d">rankIndex</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">read</a>(const LocalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">read</a>(const GlobalTileIndex &amp;index)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>ReadOnlySenderType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>setUpSubPipelines</b>(Matrix&lt; const T, D &gt; &amp;) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>setUpTiles</b>(const memory::MemoryView&lt; ElementType, D &gt; &amp;mem, const LayoutInfo &amp;layout) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805">size</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>sourceRankIndex</b>() const noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>subPipelineConst</b>() (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>tile_managers_</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>TileDataType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(const LocalTileIndex &amp;index) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">protected</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5">tileSize</a>(const GlobalTileIndex &amp;index) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>TileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">waitLocalTiles</a>() noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>Matrix</b>(Matrix &amp;mat, const LocalTileSize &amp;tiles_per_block) (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>Matrix&lt; ElementType, D &gt;</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>MatrixBase</b>(Distribution distribution) (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>MatrixBase</b>(const Distribution &amp;distribution, const LocalTileSize &amp;tiles_per_block) (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>MatrixBase</b>(const MatrixBase &amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>MatrixBase</b>(MatrixBase &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d">nrTiles</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>operator=</b>(const Matrix &amp;rhs)=delete (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>operator=</b>(Matrix &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>operator=</b>(const MatrixBase &amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>operator=</b>(MatrixBase &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f">rankGlobalTile</a>(const GlobalTileIndex &amp;global_tile) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d">rankIndex</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">read</a>(const LocalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">read</a>(const GlobalTileIndex &amp;index)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>ReadOnlySenderType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">retiledSubPipelineConst</a>(const LocalTileSize &amp;tiles_per_block)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>setUpRetiledSubPipelines</b>(Matrix&lt; const T, D &gt; &amp;, const LocalTileSize &amp;tiles_per_block) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>setUpSubPipelines</b>(Matrix&lt; const T, D &gt; &amp;) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>setUpTiles</b>(const memory::MemoryView&lt; ElementType, D &gt; &amp;mem, const LayoutInfo &amp;layout) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805">size</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>sourceRankIndex</b>() const noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c">subPipelineConst</a>()</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>tile_managers_</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>TileDataType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(const LocalTileIndex &amp;index) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">protected</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5">tileSize</a>(const GlobalTileIndex &amp;index) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>TileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">waitLocalTiles</a>() noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
diff --git a/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html b/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html
index c30a5680a1..fb7388cfb7 100644
--- a/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html
+++ b/master/classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html
@@ -143,9 +143,14 @@
 <tr class="separator:a8485d802a7f318a845de46e1b4e48118"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:abffc73bf079f7f7c23af3fca4dec329f"><td class="memItemLeft" align="right" valign="top">void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">waitLocalTiles</a> () noexcept</td></tr>
 <tr class="separator:abffc73bf079f7f7c23af3fca4dec329f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa00bb4dd8e50ec14ad04c8d600982d8c"><td class="memItemLeft" align="right" valign="top"><a id="aa00bb4dd8e50ec14ad04c8d600982d8c"></a>
-<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&#160;</td><td class="memItemRight" valign="bottom"><b>subPipelineConst</b> ()</td></tr>
+<tr class="memitem:aa00bb4dd8e50ec14ad04c8d600982d8c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c">subPipelineConst</a> ()</td></tr>
 <tr class="separator:aa00bb4dd8e50ec14ad04c8d600982d8c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa10512ea4bde924a55e73bfe07050942"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">retiledSubPipelineConst</a> (const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;tiles_per_block)</td></tr>
+<tr class="separator:aa10512ea4bde924a55e73bfe07050942"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaac68e6ec599e12aac6e7e4bd32570a8"><td class="memItemLeft" align="right" valign="top">void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">done</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;index) noexcept</td></tr>
+<tr class="separator:aaac68e6ec599e12aac6e7e4bd32570a8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade093c346a4df7e85c94b71fd86eaec2"><td class="memItemLeft" align="right" valign="top">void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2">done</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;index) noexcept</td></tr>
+<tr class="separator:ade093c346a4df7e85c94b71fd86eaec2"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td></tr>
 <tr class="memitem:a479c0ef6c74d77945a118df8c3c25e1a inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a479c0ef6c74d77945a118df8c3c25e1a"></a>
 &#160;</td><td class="memItemRight" valign="bottom"><b>MatrixBase</b> (<a class="el" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>)</td></tr>
@@ -217,12 +222,18 @@
 <tr class="memitem:a009985fe5ab588bb8e3bb218e9359b58"><td class="memItemLeft" align="right" valign="top"><a id="a009985fe5ab588bb8e3bb218e9359b58"></a>
 &#160;</td><td class="memItemRight" valign="bottom"><b>Matrix</b> (<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> &amp;mat, const SubPipelineTag)</td></tr>
 <tr class="separator:a009985fe5ab588bb8e3bb218e9359b58"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9cf76f83d092a541b697b50969d15b29"><td class="memItemLeft" align="right" valign="top"><a id="a9cf76f83d092a541b697b50969d15b29"></a>
+&#160;</td><td class="memItemRight" valign="bottom"><b>Matrix</b> (<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> &amp;mat, const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;tiles_per_block)</td></tr>
+<tr class="separator:a9cf76f83d092a541b697b50969d15b29"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:ac6c16902f2b9a4ae9b52e2cb5ef458a1"><td class="memItemLeft" align="right" valign="top"><a id="ac6c16902f2b9a4ae9b52e2cb5ef458a1"></a>
 void&#160;</td><td class="memItemRight" valign="bottom"><b>setUpTiles</b> (const <a class="el" href="classdlaf_1_1memory_1_1_memory_view.html">memory::MemoryView</a>&lt; ElementType, D &gt; &amp;mem, const <a class="el" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a> &amp;layout) noexcept</td></tr>
 <tr class="separator:ac6c16902f2b9a4ae9b52e2cb5ef458a1"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:ae1908773cee6f10d630ffc7cf3dc0c5a"><td class="memItemLeft" align="right" valign="top"><a id="ae1908773cee6f10d630ffc7cf3dc0c5a"></a>
 void&#160;</td><td class="memItemRight" valign="bottom"><b>setUpSubPipelines</b> (<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt; const T, D &gt; &amp;) noexcept</td></tr>
 <tr class="separator:ae1908773cee6f10d630ffc7cf3dc0c5a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa48bb6428b4c1bb36e42983a63689963"><td class="memItemLeft" align="right" valign="top"><a id="aa48bb6428b4c1bb36e42983a63689963"></a>
+void&#160;</td><td class="memItemRight" valign="bottom"><b>setUpRetiledSubPipelines</b> (<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt; const T, D &gt; &amp;, const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;tiles_per_block) noexcept</td></tr>
+<tr class="separator:aa48bb6428b4c1bb36e42983a63689963"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td colspan="2" onclick="javascript:toggleInherit('pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base')"><img src="closed.png" alt="-"/>&#160;Protected Member Functions inherited from <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td></tr>
 <tr class="memitem:acaf5e5361f3fac47106c19a139774a13 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="acaf5e5361f3fac47106c19a139774a13"></a>
 &#160;</td><td class="memItemRight" valign="bottom"><b>MatrixBase</b> (<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;&amp;rhs)=default</td></tr>
@@ -240,6 +251,66 @@
 <tr class="separator:a0cc6b2728f73f065497efe6f2296d9a5"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Function Documentation</h2>
+<a id="ade093c346a4df7e85c94b71fd86eaec2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ade093c346a4df7e85c94b71fd86eaec2">&#9670;&nbsp;</a></span>done() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;class T , Device D&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">void <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>&lt; const T, D &gt;::done </td>
+          <td>(</td>
+          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;&#160;</td>
+          <td class="paramname"><em>index</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Mark the tile at <code>index</code> as done</p>
+<p>Marking a tile as done means it can no longer be accessed. Marking a tile as done also disallows creation of sub pipelines from the full matrix. </p>
+
+</div>
+</div>
+<a id="aaac68e6ec599e12aac6e7e4bd32570a8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaac68e6ec599e12aac6e7e4bd32570a8">&#9670;&nbsp;</a></span>done() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;class T , Device D&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">void <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>&lt; const T, D &gt;::done </td>
+          <td>(</td>
+          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;&#160;</td>
+          <td class="paramname"><em>index</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Mark the tile at <code>index</code> as done</p>
+<p>Marking a tile as done means it can no longer be accessed. Marking a tile as done also disallows creation of sub pipelines from the full matrix. </p>
+
+</div>
+</div>
 <a id="a8485d802a7f318a845de46e1b4e48118"></a>
 <h2 class="memtitle"><span class="permalink"><a href="#a8485d802a7f318a845de46e1b4e48118">&#9670;&nbsp;</a></span>read() <span class="overload">[1/2]</span></h2>
 
@@ -300,6 +371,68 @@ <h2 class="memtitle"><span class="permalink"><a href="#abd8114d7c9ff03a2ff5c8613
 <p>Returns a read-only sender of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with local index <code>index</code>.</p>
 <dl class="section pre"><dt>Precondition</dt><dd>index.isIn(<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402" title="Returns the distribution of the matrix.">distribution()</a>.localNrTiles()). </dd></dl>
 
+</div>
+</div>
+<a id="aa10512ea4bde924a55e73bfe07050942"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa10512ea4bde924a55e73bfe07050942">&#9670;&nbsp;</a></span>retiledSubPipelineConst()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;class T , Device D&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>&lt; const T, D &gt;::retiledSubPipelineConst </td>
+          <td>(</td>
+          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;&#160;</td>
+          <td class="paramname"><em>tiles_per_block</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Create a sub-pipelined, retiled matrix which can be accessed thread-safely with respect to the original matrix</p>
+<p>All accesses to the sub-pipelined matrix are sequenced after previous accesses and before later accesses to the original matrix, independently of when tiles are accessed in the sub-pipelined matrix.</p>
+<dl class="section pre"><dt>Precondition</dt><dd><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a3f645fd23ce4c20591fdd2738b235f92" title="Returns the block size of the matrix.">blockSize()</a> is divisible by <code>tiles_per_block</code> </dd>
+<dd>
+<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a3f645fd23ce4c20591fdd2738b235f92" title="Returns the block size of the matrix.">blockSize()</a> == <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#add48022e3fd9298035052a023fa6dbb0" title="Returns the complete tile size of the matrix.">baseTileSize()</a> </dd></dl>
+
+</div>
+</div>
+<a id="aa00bb4dd8e50ec14ad04c8d600982d8c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa00bb4dd8e50ec14ad04c8d600982d8c">&#9670;&nbsp;</a></span>subPipelineConst()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;class T , Device D&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>&lt; const T, D &gt;::subPipelineConst </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Create a sub-pipelined matrix which can be accessed thread-safely with respect to the original matrix</p>
+<p>All accesses to the sub-pipelined matrix are sequenced after previous accesses and before later accesses to the original matrix, independently of when tiles are accessed in the sub-pipelined matrix. </p>
+
 </div>
 </div>
 <a id="abffc73bf079f7f7c23af3fca4dec329f"></a>
diff --git a/master/classdlaf_1_1matrix_1_1_retiled_matrix-members.html b/master/classdlaf_1_1matrix_1_1_retiled_matrix-members.html
deleted file mode 100644
index cde2bec303..0000000000
--- a/master/classdlaf_1_1matrix_1_1_retiled_matrix-members.html
+++ /dev/null
@@ -1,116 +0,0 @@
-<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
-<html xmlns="http://www.w3.org/1999/xhtml">
-<head>
-<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
-<meta http-equiv="X-UA-Compatible" content="IE=9"/>
-<meta name="generator" content="Doxygen 1.9.1"/>
-<meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>DLAF: Member List</title>
-<link href="tabs.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="jquery.js"></script>
-<script type="text/javascript" src="dynsections.js"></script>
-<link href="search/search.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="search/searchdata.js"></script>
-<script type="text/javascript" src="search/search.js"></script>
-<link href="doxygen.css" rel="stylesheet" type="text/css" />
-</head>
-<body>
-<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
-<div id="titlearea">
-<table cellspacing="0" cellpadding="0">
- <tbody>
- <tr style="height: 56px;">
-  <td id="projectalign" style="padding-left: 0.5em;">
-   <div id="projectname">DLAF
-   </div>
-  </td>
- </tr>
- </tbody>
-</table>
-</div>
-<!-- end header part -->
-<!-- Generated by Doxygen 1.9.1 -->
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-var searchBox = new SearchBox("searchBox", "search",false,'Search','.html');
-/* @license-end */
-</script>
-<script type="text/javascript" src="menudata.js"></script>
-<script type="text/javascript" src="menu.js"></script>
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-$(function() {
-  initMenu('',true,false,'search.php','Search');
-  $(document).ready(function() { init_search(); });
-});
-/* @license-end */</script>
-<div id="main-nav"></div>
-<!-- window showing the filter options -->
-<div id="MSearchSelectWindow"
-     onmouseover="return searchBox.OnSearchSelectShow()"
-     onmouseout="return searchBox.OnSearchSelectHide()"
-     onkeydown="return searchBox.OnSearchSelectKey(event)">
-</div>
-
-<!-- iframe showing the search results (closed by default) -->
-<div id="MSearchResultsWindow">
-<iframe src="javascript:void(0)" frameborder="0" 
-        name="MSearchResults" id="MSearchResults">
-</iframe>
-</div>
-
-<div id="nav-path" class="navpath">
-  <ul>
-<li class="navelem"><b>dlaf</b></li><li class="navelem"><b>matrix</b></li><li class="navelem"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a></li>  </ul>
-</div>
-</div><!-- top -->
-<div class="header">
-  <div class="headertitle">
-<div class="title">dlaf::matrix::RetiledMatrix&lt; T, D &gt; Member List</div>  </div>
-</div><!--header-->
-<div class="contents">
-
-<p>This is the complete list of members for <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>, including all inherited members.</p>
-<table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#add48022e3fd9298035052a023fa6dbb0">baseTileSize</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a3f645fd23ce4c20591fdd2738b235f92">blockSize</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a1f81375953df07b80ddb5cae672319bd">commGridSize</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>ConstTileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>device</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>done</b>(const LocalTileIndex &amp;index) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>done</b>(const GlobalTileIndex &amp;index) noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>ElementType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>MatrixBase</b>(Distribution distribution) (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>MatrixBase</b>(const Distribution &amp;distribution, const LocalTileSize &amp;tiles_per_block) (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>MatrixBase</b>(const MatrixBase &amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>MatrixBase</b>(MatrixBase &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d">nrTiles</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>operator=</b>(const RetiledMatrix &amp;rhs)=delete (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>operator=</b>(RetiledMatrix &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>operator=</b>(const MatrixBase &amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>operator=</b>(MatrixBase &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f">rankGlobalTile</a>(const GlobalTileIndex &amp;global_tile) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d">rankIndex</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">read</a>(const LocalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579">read</a>(const GlobalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">readwrite</a>(const LocalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167">readwrite</a>(const GlobalTileIndex &amp;index) noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">RetiledMatrix</a>(Matrix&lt; T, D &gt; &amp;mat, const LocalTileSize &amp;tiles_per_block)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>RetiledMatrix</b>(const RetiledMatrix &amp;rhs)=delete (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>RetiledMatrix</b>(RetiledMatrix &amp;&amp;rhs)=default (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805">size</a>() const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>sourceRankIndex</b>() const noexcept (defined in <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>tile_managers_</b> (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">protected</span></td></tr>
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>TileDataType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(const LocalTileIndex &amp;index) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">protected</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5">tileSize</a>(const GlobalTileIndex &amp;index) const noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>TileType</b> typedef (defined in <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>)</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">waitLocalTiles</a>() noexcept</td><td class="entry"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-</table></div><!-- contents -->
-<!-- start footer part -->
-<hr class="footer"/><address class="footer"><small>
-Generated by&#160;<a href="https://www.doxygen.org/index.html"><img class="footer" src="doxygen.svg" width="104" height="31" alt="doxygen"/></a> 1.9.1
-</small></address>
-</body>
-</html>
diff --git a/master/classdlaf_1_1matrix_1_1_retiled_matrix.html b/master/classdlaf_1_1matrix_1_1_retiled_matrix.html
deleted file mode 100644
index c4b62fb410..0000000000
--- a/master/classdlaf_1_1matrix_1_1_retiled_matrix.html
+++ /dev/null
@@ -1,421 +0,0 @@
-<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
-<html xmlns="http://www.w3.org/1999/xhtml">
-<head>
-<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
-<meta http-equiv="X-UA-Compatible" content="IE=9"/>
-<meta name="generator" content="Doxygen 1.9.1"/>
-<meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>DLAF: dlaf::matrix::RetiledMatrix&lt; T, D &gt; Class Template Reference</title>
-<link href="tabs.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="jquery.js"></script>
-<script type="text/javascript" src="dynsections.js"></script>
-<link href="search/search.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="search/searchdata.js"></script>
-<script type="text/javascript" src="search/search.js"></script>
-<link href="doxygen.css" rel="stylesheet" type="text/css" />
-</head>
-<body>
-<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
-<div id="titlearea">
-<table cellspacing="0" cellpadding="0">
- <tbody>
- <tr style="height: 56px;">
-  <td id="projectalign" style="padding-left: 0.5em;">
-   <div id="projectname">DLAF
-   </div>
-  </td>
- </tr>
- </tbody>
-</table>
-</div>
-<!-- end header part -->
-<!-- Generated by Doxygen 1.9.1 -->
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-var searchBox = new SearchBox("searchBox", "search",false,'Search','.html');
-/* @license-end */
-</script>
-<script type="text/javascript" src="menudata.js"></script>
-<script type="text/javascript" src="menu.js"></script>
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-$(function() {
-  initMenu('',true,false,'search.php','Search');
-  $(document).ready(function() { init_search(); });
-});
-/* @license-end */</script>
-<div id="main-nav"></div>
-<!-- window showing the filter options -->
-<div id="MSearchSelectWindow"
-     onmouseover="return searchBox.OnSearchSelectShow()"
-     onmouseout="return searchBox.OnSearchSelectHide()"
-     onkeydown="return searchBox.OnSearchSelectKey(event)">
-</div>
-
-<!-- iframe showing the search results (closed by default) -->
-<div id="MSearchResultsWindow">
-<iframe src="javascript:void(0)" frameborder="0" 
-        name="MSearchResults" id="MSearchResults">
-</iframe>
-</div>
-
-<div id="nav-path" class="navpath">
-  <ul>
-<li class="navelem"><b>dlaf</b></li><li class="navelem"><b>matrix</b></li><li class="navelem"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a></li>  </ul>
-</div>
-</div><!-- top -->
-<div class="header">
-  <div class="summary">
-<a href="#pub-types">Public Types</a> &#124;
-<a href="#pub-methods">Public Member Functions</a> &#124;
-<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
-<a href="#pro-attribs">Protected Attributes</a> &#124;
-<a href="classdlaf_1_1matrix_1_1_retiled_matrix-members.html">List of all members</a>  </div>
-  <div class="headertitle">
-<div class="title">dlaf::matrix::RetiledMatrix&lt; T, D &gt; Class Template Reference</div>  </div>
-</div><!--header-->
-<div class="contents">
-
-<p><code>#include &lt;<a class="el" href="retiled__matrix_8h_source.html">retiled_matrix.h</a>&gt;</code></p>
-<div class="dynheader">
-Inheritance diagram for dlaf::matrix::RetiledMatrix&lt; T, D &gt;:</div>
-<div class="dyncontent">
- <div class="center">
-  <img src="classdlaf_1_1matrix_1_1_retiled_matrix.png" usemap="#dlaf::matrix::RetiledMatrix_3C_20T_2C_20D_20_3E_map" alt=""/>
-  <map id="dlaf::matrix::RetiledMatrix_3C_20T_2C_20D_20_3E_map" name="dlaf::matrix::RetiledMatrix_3C_20T_2C_20D_20_3E_map">
-<area href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html" alt="dlaf::matrix::internal::MatrixBase" shape="rect" coords="0,0,200,24"/>
-  </map>
-</div></div>
-<table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
-Public Types</h2></td></tr>
-<tr class="memitem:a459cd6ced67c64e0901d6b8c7e9b9229"><td class="memItemLeft" align="right" valign="top"><a id="a459cd6ced67c64e0901d6b8c7e9b9229"></a>
-using&#160;</td><td class="memItemRight" valign="bottom"><b>ElementType</b> = T</td></tr>
-<tr class="separator:a459cd6ced67c64e0901d6b8c7e9b9229"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aba42fb62c983ac0ee101dfbfbcd7ddaa"><td class="memItemLeft" align="right" valign="top"><a id="aba42fb62c983ac0ee101dfbfbcd7ddaa"></a>
-using&#160;</td><td class="memItemRight" valign="bottom"><b>TileType</b> = <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a>&lt; ElementType, D &gt;</td></tr>
-<tr class="separator:aba42fb62c983ac0ee101dfbfbcd7ddaa"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a43310bac94cd4a4d8ec517fa606f0ac6"><td class="memItemLeft" align="right" valign="top"><a id="a43310bac94cd4a4d8ec517fa606f0ac6"></a>
-using&#160;</td><td class="memItemRight" valign="bottom"><b>ConstTileType</b> = <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a>&lt; const ElementType, D &gt;</td></tr>
-<tr class="separator:a43310bac94cd4a4d8ec517fa606f0ac6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2bdd0f7d9f7f009bc52d71e814a16ad2"><td class="memItemLeft" align="right" valign="top"><a id="a2bdd0f7d9f7f009bc52d71e814a16ad2"></a>
-using&#160;</td><td class="memItemRight" valign="bottom"><b>TileDataType</b> = <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">internal::TileData</a>&lt; const ElementType, D &gt;</td></tr>
-<tr class="separator:a2bdd0f7d9f7f009bc52d71e814a16ad2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
-Public Member Functions</h2></td></tr>
-<tr class="memitem:a4e208b9159a478b3fa20167ec8e04318"><td class="memItemLeft" align="right" valign="top">&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">RetiledMatrix</a> (<a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt; T, D &gt; &amp;mat, const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;tiles_per_block)</td></tr>
-<tr class="separator:a4e208b9159a478b3fa20167ec8e04318"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0160d02e84b414eaad4a5e783437e046"><td class="memItemLeft" align="right" valign="top"><a id="a0160d02e84b414eaad4a5e783437e046"></a>
-&#160;</td><td class="memItemRight" valign="bottom"><b>RetiledMatrix</b> (const <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> &amp;rhs)=delete</td></tr>
-<tr class="separator:a0160d02e84b414eaad4a5e783437e046"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e5cc1c98e845a9e13d9b771335a4e68"><td class="memItemLeft" align="right" valign="top"><a id="a4e5cc1c98e845a9e13d9b771335a4e68"></a>
-&#160;</td><td class="memItemRight" valign="bottom"><b>RetiledMatrix</b> (<a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> &amp;&amp;rhs)=default</td></tr>
-<tr class="separator:a4e5cc1c98e845a9e13d9b771335a4e68"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5368da5cdbaa0f729ea5a3f1526d2229"><td class="memItemLeft" align="right" valign="top"><a id="a5368da5cdbaa0f729ea5a3f1526d2229"></a>
-<a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><b>operator=</b> (const <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> &amp;rhs)=delete</td></tr>
-<tr class="separator:a5368da5cdbaa0f729ea5a3f1526d2229"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acddb115c3d9007a051b296b5d1076175"><td class="memItemLeft" align="right" valign="top"><a id="acddb115c3d9007a051b296b5d1076175"></a>
-<a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><b>operator=</b> (<a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> &amp;&amp;rhs)=default</td></tr>
-<tr class="separator:acddb115c3d9007a051b296b5d1076175"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a814972188382d0ae0120b6acfddd92bb"><td class="memItemLeft" align="right" valign="top">ReadOnlyTileSender&lt; T, D &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">read</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;index) noexcept</td></tr>
-<tr class="separator:a814972188382d0ae0120b6acfddd92bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afacf9af5a45a341c284844d866227579"><td class="memItemLeft" align="right" valign="top">ReadOnlyTileSender&lt; T, D &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579">read</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;index) noexcept</td></tr>
-<tr class="separator:afacf9af5a45a341c284844d866227579"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab731cfea1c5b07288bc3b34c59cb37d0"><td class="memItemLeft" align="right" valign="top">void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">waitLocalTiles</a> () noexcept</td></tr>
-<tr class="separator:ab731cfea1c5b07288bc3b34c59cb37d0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa0e45d9a97f8d3ff418d2bd08211a5bf"><td class="memItemLeft" align="right" valign="top">ReadWriteTileSender&lt; T, D &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">readwrite</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;index) noexcept</td></tr>
-<tr class="separator:aa0e45d9a97f8d3ff418d2bd08211a5bf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac3ca2e52e6627f5890bcb25fcff60167"><td class="memItemLeft" align="right" valign="top">ReadWriteTileSender&lt; T, D &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167">readwrite</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;index) noexcept</td></tr>
-<tr class="separator:ac3ca2e52e6627f5890bcb25fcff60167"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a23d2629cba4ffb74794cf7d24be624b5"><td class="memItemLeft" align="right" valign="top"><a id="a23d2629cba4ffb74794cf7d24be624b5"></a>
-void&#160;</td><td class="memItemRight" valign="bottom"><b>done</b> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;index) noexcept</td></tr>
-<tr class="separator:a23d2629cba4ffb74794cf7d24be624b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af79e6f89e6cfb5ae359d6fc5b5ad5d6d"><td class="memItemLeft" align="right" valign="top"><a id="af79e6f89e6cfb5ae359d6fc5b5ad5d6d"></a>
-void&#160;</td><td class="memItemRight" valign="bottom"><b>done</b> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;index) noexcept</td></tr>
-<tr class="separator:af79e6f89e6cfb5ae359d6fc5b5ad5d6d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td></tr>
-<tr class="memitem:a479c0ef6c74d77945a118df8c3c25e1a inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a479c0ef6c74d77945a118df8c3c25e1a"></a>
-&#160;</td><td class="memItemRight" valign="bottom"><b>MatrixBase</b> (<a class="el" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>)</td></tr>
-<tr class="separator:a479c0ef6c74d77945a118df8c3c25e1a inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6cda2dcd127f37aa056cfab63c51d33c inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a6cda2dcd127f37aa056cfab63c51d33c"></a>
-&#160;</td><td class="memItemRight" valign="bottom"><b>MatrixBase</b> (const <a class="el" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> &amp;<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>, const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;tiles_per_block)</td></tr>
-<tr class="separator:a6cda2dcd127f37aa056cfab63c51d33c inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaed066a2a7439c25653c25514856ef93 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="aaed066a2a7439c25653c25514856ef93"></a>
-&#160;</td><td class="memItemRight" valign="bottom"><b>MatrixBase</b> (const <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;rhs)=default</td></tr>
-<tr class="separator:aaed066a2a7439c25653c25514856ef93 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7a152e1c4b6c58574dad922332ed703a inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a7a152e1c4b6c58574dad922332ed703a"></a>
-<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><b>operator=</b> (const <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;rhs)=default</td></tr>
-<tr class="separator:a7a152e1c4b6c58574dad922332ed703a inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adc5a25970dab7cdea07e2f98328df805 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="adc5a25970dab7cdea07e2f98328df805"></a>
-const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805">size</a> () const noexcept</td></tr>
-<tr class="memdesc:adc5a25970dab7cdea07e2f98328df805 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the global size in elements of the matrix. <br /></td></tr>
-<tr class="separator:adc5a25970dab7cdea07e2f98328df805 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3f645fd23ce4c20591fdd2738b235f92 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a3f645fd23ce4c20591fdd2738b235f92"></a>
-const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a3f645fd23ce4c20591fdd2738b235f92">blockSize</a> () const noexcept</td></tr>
-<tr class="memdesc:a3f645fd23ce4c20591fdd2738b235f92 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the block size of the matrix. <br /></td></tr>
-<tr class="separator:a3f645fd23ce4c20591fdd2738b235f92 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:add48022e3fd9298035052a023fa6dbb0 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="add48022e3fd9298035052a023fa6dbb0"></a>
-const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#add48022e3fd9298035052a023fa6dbb0">baseTileSize</a> () const noexcept</td></tr>
-<tr class="memdesc:add48022e3fd9298035052a023fa6dbb0 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the complete tile size of the matrix. <br /></td></tr>
-<tr class="separator:add48022e3fd9298035052a023fa6dbb0 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a068e58f7f6c2956f92e69fd7c8d8f68d inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a068e58f7f6c2956f92e69fd7c8d8f68d"></a>
-const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">GlobalTileSize</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d">nrTiles</a> () const noexcept</td></tr>
-<tr class="memdesc:a068e58f7f6c2956f92e69fd7c8d8f68d inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the number of tiles of the global matrix (2D size). <br /></td></tr>
-<tr class="separator:a068e58f7f6c2956f92e69fd7c8d8f68d inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a685f321909fc853e023bff712c964c2d inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a685f321909fc853e023bff712c964c2d"></a>
-const <a class="el" href="communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e">comm::Index2D</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d">rankIndex</a> () const noexcept</td></tr>
-<tr class="memdesc:a685f321909fc853e023bff712c964c2d inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the id associated to the matrix of this rank. <br /></td></tr>
-<tr class="separator:a685f321909fc853e023bff712c964c2d inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2542519489cf0234ec4cb42ec5322daa inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a2542519489cf0234ec4cb42ec5322daa"></a>
-const <a class="el" href="communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e">comm::Index2D</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><b>sourceRankIndex</b> () const noexcept</td></tr>
-<tr class="separator:a2542519489cf0234ec4cb42ec5322daa inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1f81375953df07b80ddb5cae672319bd inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a1f81375953df07b80ddb5cae672319bd"></a>
-const <a class="el" href="communicator__grid_8h.html#a1af44f2ea119a10f873e64cf048ba94a">comm::Size2D</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a1f81375953df07b80ddb5cae672319bd">commGridSize</a> () const noexcept</td></tr>
-<tr class="memdesc:a1f81375953df07b80ddb5cae672319bd inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the size of the communicator grid associated to the matrix. <br /></td></tr>
-<tr class="separator:a1f81375953df07b80ddb5cae672319bd inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a622f4764a792986112c89f282e04080f inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a class="el" href="communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e">comm::Index2D</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f">rankGlobalTile</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;global_tile) const noexcept</td></tr>
-<tr class="separator:a622f4764a792986112c89f282e04080f inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a28967ff509064a6e04cfc8b2d35af402 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a28967ff509064a6e04cfc8b2d35af402"></a>
-const <a class="el" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a> () const noexcept</td></tr>
-<tr class="memdesc:a28967ff509064a6e04cfc8b2d35af402 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the distribution of the matrix. <br /></td></tr>
-<tr class="separator:a28967ff509064a6e04cfc8b2d35af402 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a891c1da69cefcfdfb73b3915ccc2cce5 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a891c1da69cefcfdfb73b3915ccc2cce5"></a>
-<a class="el" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5">tileSize</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;index) const noexcept</td></tr>
-<tr class="memdesc:a891c1da69cefcfdfb73b3915ccc2cce5 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the size of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with global index <code>index</code>. <br /></td></tr>
-<tr class="separator:a891c1da69cefcfdfb73b3915ccc2cce5 inherit pub_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
-Static Public Attributes</h2></td></tr>
-<tr class="memitem:afa2d9aa1cead46d49c0e50249b7bfbe1"><td class="memItemLeft" align="right" valign="top"><a id="afa2d9aa1cead46d49c0e50249b7bfbe1"></a>
-static constexpr Device&#160;</td><td class="memItemRight" valign="bottom"><b>device</b> = D</td></tr>
-<tr class="separator:afa2d9aa1cead46d49c0e50249b7bfbe1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pro-attribs"></a>
-Protected Attributes</h2></td></tr>
-<tr class="memitem:ad0a039890a8ee9bf882b4a9f83fb5257"><td class="memItemLeft" align="right" valign="top"><a id="ad0a039890a8ee9bf882b4a9f83fb5257"></a>
-std::vector&lt; <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html">internal::TilePipeline</a>&lt; T, D &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><b>tile_managers_</b></td></tr>
-<tr class="separator:ad0a039890a8ee9bf882b4a9f83fb5257"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
-Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td colspan="2" onclick="javascript:toggleInherit('pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base')"><img src="closed.png" alt="-"/>&#160;Protected Member Functions inherited from <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></td></tr>
-<tr class="memitem:acaf5e5361f3fac47106c19a139774a13 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="acaf5e5361f3fac47106c19a139774a13"></a>
-&#160;</td><td class="memItemRight" valign="bottom"><b>MatrixBase</b> (<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;&amp;rhs)=default</td></tr>
-<tr class="separator:acaf5e5361f3fac47106c19a139774a13 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9d7a3cb3991fb98999b1523a250e0f84 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top"><a id="a9d7a3cb3991fb98999b1523a250e0f84"></a>
-<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><b>operator=</b> (<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">MatrixBase</a> &amp;&amp;rhs)=default</td></tr>
-<tr class="separator:a9d7a3cb3991fb98999b1523a250e0f84 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5cdaa0376724e6f624591a6a6bcf46d9 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memItemLeft" align="right" valign="top">std::size_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a> (const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;index) const noexcept</td></tr>
-<tr class="separator:a5cdaa0376724e6f624591a6a6bcf46d9 inherit pro_methods_classdlaf_1_1matrix_1_1internal_1_1_matrix_base"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table>
-<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
-<div class="textblock"><h3>template&lt;class T, Device D&gt;<br />
-class dlaf::matrix::RetiledMatrix&lt; T, D &gt;</h3>
-
-<p>A <code><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a></code> object represents a collection of tiles which contain all the elements of a matrix. It is constructed on top of a <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> and allows to divide the distribution block in multiple tiles.</p>
-<p>The tiles are distributed according to a distribution (see <code>Matrix::distribution()</code>), therefore some tiles are stored locally on this rank, while the others are available on other ranks. </p>
-</div><h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a4e208b9159a478b3fa20167ec8e04318"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4e208b9159a478b3fa20167ec8e04318">&#9670;&nbsp;</a></span>RetiledMatrix()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;class T , Device D&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a>&lt; T, D &gt;::<a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt; T, D &gt; &amp;&#160;</td>
-          <td class="paramname"><em>mat</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> &amp;&#160;</td>
-          <td class="paramname"><em>tiles_per_block</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<dl class="section pre"><dt>Precondition</dt><dd>mat.blockSize() is divisible by tiles_per_block. </dd></dl>
-
-</div>
-</div>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="afacf9af5a45a341c284844d866227579"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#afacf9af5a45a341c284844d866227579">&#9670;&nbsp;</a></span>read() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;class T , Device D&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">ReadOnlyTileSender&lt;T, D&gt; <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a>&lt; T, D &gt;::read </td>
-          <td>(</td>
-          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;&#160;</td>
-          <td class="paramname"><em>index</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<p>Returns a read-only sender of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with global index <code>index</code>.</p>
-<dl class="section pre"><dt>Precondition</dt><dd>the global tile is stored in the current process, </dd>
-<dd>
-index.isIn(globalNrTiles()). </dd></dl>
-
-</div>
-</div>
-<a id="a814972188382d0ae0120b6acfddd92bb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a814972188382d0ae0120b6acfddd92bb">&#9670;&nbsp;</a></span>read() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;class T , Device D&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">ReadOnlyTileSender&lt;T, D&gt; <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a>&lt; T, D &gt;::read </td>
-          <td>(</td>
-          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;&#160;</td>
-          <td class="paramname"><em>index</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<p>Returns a read-only sender of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with local index <code>index</code>.</p>
-<dl class="section pre"><dt>Precondition</dt><dd>index.isIn(<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402" title="Returns the distribution of the matrix.">distribution()</a>.localNrTiles()). </dd></dl>
-
-</div>
-</div>
-<a id="ac3ca2e52e6627f5890bcb25fcff60167"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac3ca2e52e6627f5890bcb25fcff60167">&#9670;&nbsp;</a></span>readwrite() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;class T , Device D&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">ReadWriteTileSender&lt;T, D&gt; <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a>&lt; T, D &gt;::readwrite </td>
-          <td>(</td>
-          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> &amp;&#160;</td>
-          <td class="paramname"><em>index</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<p>Returns a sender of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with global index <code>index</code>.</p>
-<dl class="section pre"><dt>Precondition</dt><dd>the global tile is stored in the current process, </dd>
-<dd>
-index.isIn(globalNrTiles()). </dd></dl>
-
-</div>
-</div>
-<a id="aa0e45d9a97f8d3ff418d2bd08211a5bf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa0e45d9a97f8d3ff418d2bd08211a5bf">&#9670;&nbsp;</a></span>readwrite() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;class T , Device D&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">ReadWriteTileSender&lt;T, D&gt; <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a>&lt; T, D &gt;::readwrite </td>
-          <td>(</td>
-          <td class="paramtype">const <a class="el" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> &amp;&#160;</td>
-          <td class="paramname"><em>index</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<p>Returns a sender of the <a class="el" href="classdlaf_1_1matrix_1_1_tile.html">Tile</a> with local index <code>index</code>.</p>
-<dl class="section pre"><dt>Precondition</dt><dd>index.isIn(<a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402" title="Returns the distribution of the matrix.">distribution()</a>.localNrTiles()). </dd></dl>
-
-</div>
-</div>
-<a id="ab731cfea1c5b07288bc3b34c59cb37d0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab731cfea1c5b07288bc3b34c59cb37d0">&#9670;&nbsp;</a></span>waitLocalTiles()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;class T , Device D&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">void <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a>&lt; T, D &gt;::waitLocalTiles </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">noexcept</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<p>Synchronization barrier for all local tiles in the matrix</p>
-<p>This blocking call does not return until all operations, i.e. both RO and RW, involving any of the locally available tiles are completed. </p>
-
-</div>
-</div>
-<hr/>The documentation for this class was generated from the following file:<ul>
-<li>/home/runner/work/DLA-Future/DLA-Future/include/dlaf/matrix/<a class="el" href="retiled__matrix_8h_source.html">retiled_matrix.h</a></li>
-</ul>
-</div><!-- contents -->
-<!-- start footer part -->
-<hr class="footer"/><address class="footer"><small>
-Generated by&#160;<a href="https://www.doxygen.org/index.html"><img class="footer" src="doxygen.svg" width="104" height="31" alt="doxygen"/></a> 1.9.1
-</small></address>
-</body>
-</html>
diff --git a/master/classdlaf_1_1matrix_1_1_retiled_matrix.png b/master/classdlaf_1_1matrix_1_1_retiled_matrix.png
deleted file mode 100644
index 317ef1cf17621ff4cc8ab01922b7c92d9ebf754c..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 775
zcmeAS@N?(olHy`uVBq!ia0vp^CxAGBgBeI>Z$8xoq$C1-LR|m<{|{uoc=NTi|Ih>=
z3ycpOIKbL@M;^%KC<*clW&kPzfvcxNj2IZ0rg^$JhEy=VoqK!T9R(g&@jjFP|4+`1
zVVIqLWz{71!XwvIB+S+%6vtWiJ&tgcQBvB!o>xifk*Bna%aO@h6AHF|SvJpAW&4fz
zBcHSL7x7**3-!17@8Z%ntKkdpvTOQ|@6@+m&boKiFm@foPboWv>)`?Ol~_ZbyxINh
zZ26yWOBlcZNspO#m+hs5`u`WpYN`~b2U>}IE>=oA^+HGJ)w1|cJ1&`T+nt_sXHJ&?
zN~XY-p=yz$7p1p$MmA`O?&DgLz9w76x0b)?d|u;|6CzJ;Hpyn!JYLAtQ<`P^vQ6Pz
zj#T@qYpcz|zTMjR^~c7-iBVUN{@Uf1rck<(KWH`MB@W5Q`&UkUbghe1$FZn;;*)9D
zH!t~h&1mIS2^*8X$dcpnccYY)>{lWDYu3@xp}v--Napy)28MsT?HIH(L?@h27n~I8
zuump?f)4Yhd|ih4TM7*Gwm34_WHvKYTw-JVu!NWCfu}UffyrhZ4eGf94E|^eDpm_P
zML4oF+`kS}%=YB>iu+X^8~1nIFLzH&JHDb%=EaSd+FN&@ke=|*vs5X(+;Tr#<*)lX
zSIS-}Jm)X6otH1ZnaQ6~)bjVdozJ>w{k)~GyTGBXjCq2XCsXCMj_lX-i`gr~3yTF-
zh54=NoyXc<wwQUdLRthHBt$)f4$u4Yw)u`d=aTI7RS7jpnHk(q?genGxJM~iZhlia
zGjih6{BV)aI$M+0T>}Pd*ZJrgCtJVeVV0|B7;gN1U3g`73fm=}Z;`zwt2S(szV7j_
ztXE1iZ|#gzEWmKx@+&#J`|r-BRokce9-1b*AS&`+{=a?(i>oEm?U{`3KUqJA<3Io`
ieAcoEIdO2m;6J}r^RuCx%4uM#W$<+Mb6Mw<&;$S?^I9JO

diff --git a/master/classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html b/master/classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html
index bb8d3273d2..9af618856c 100644
--- a/master/classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html
+++ b/master/classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html
@@ -80,8 +80,7 @@
  <div class="center">
   <img src="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.png" usemap="#dlaf::matrix::internal::MatrixBase_map" alt=""/>
   <map id="dlaf::matrix::internal::MatrixBase_map" name="dlaf::matrix::internal::MatrixBase_map">
-<area href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html" alt="dlaf::matrix::Matrix&lt; const T, D &gt;" shape="rect" coords="0,56,200,80"/>
-<area href="classdlaf_1_1matrix_1_1_retiled_matrix.html" alt="dlaf::matrix::RetiledMatrix&lt; T, D &gt;" shape="rect" coords="210,56,410,80"/>
+<area href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html" alt="dlaf::matrix::Matrix&lt; const T, D &gt;" shape="rect" coords="0,56,197,80"/>
   </map>
 </div></div>
 <table class="memberdecls">
diff --git a/master/classdlaf_1_1matrix_1_1internal_1_1_matrix_base.png b/master/classdlaf_1_1matrix_1_1internal_1_1_matrix_base.png
index d1641a0d9bdd74b8c6bf99125752462e74ad5dba..0c7fbbc175529ab2cf01b3611461bf5dc75ee11b 100644
GIT binary patch
delta 737
zcmcb`(aWaT8Q|y6%O%Cdz`(%k>ERLtq>ln|00%RWoagIkG*Qv2o@tJ!i(^Oy<J-Bn
z*Bw^iVQF`L^}qg;=VXRwv*xsWsVqvmdd#e?lehM$<#RcGnFEKnYA`&zu!v!Xv*^)p
z89KLLvab+*^YzU(W&>rb*Ctb+?r3KCB^CT7JwEJ%+R=}vb2iV~F0D81v}RxT_w1WL
z&w6+8J^p#?+|OscdDA2c&e%V$zx2k;RlV?x{HB>UzFoH7I_}@TKK1TU)ZI~aqg^EY
z8Smo_J;LV8pGlwB^l_iMH?;DN-sd_Ujh?POZHuPgnAdIbRqd$ZR@aF((?y>Ds?3>Y
zJ|%g=jj|Bowf+;smj-%oj@Y{T(yZgxK0ZF;>K=Oi#oppV*TDJj9NkSdq}J(t+<(5_
zwa~qF+0lt^AC81%Zj`xvFEG;Gw5h$*`LoQw*VbGQCPs-c6lVl7oLT6~XwV+#{BTaO
zzxaXvuZ$IY;v7Hz+{5@-R7Cm+x4}KfjqfxXBDcUor<*B(PnWB~l8``sgY~C-zwf_#
zy!ZQl(YQ%+>s%E*f%bV^k~yVu$L`VOpSqg83HpDw?iAMWbe{Y1-H#ixsr}^|zr4$B
zo-?J*{r_&?yy@vT=0|x7AKmuLb0f3#s}~0I*5_`YZJwvm*7)-5vh})8YP6=UdnqL`
zF=@W+>4~+qKZTMMrp8#Fd;5hscV&H7>YSA0yj;O0-ibm}R%-cA;q4Z=dtleyRpn(@
z1FuQfZPVy8zOu+;o?5G>i?M<AEZ?rp^7%nWdU(6`XkCk0H{-ZuSKfnA-DBZr)<#`<
z{-{gI{_fd-8qC$t7sWjP)t5E5`%xd4uikQ#CiQhy%g#!;H%_{w@lNA*;8EGB=RVK<
zZ_e#GD{%UMYySm1{(Y`-(N)P@0S|#H-q!E;>|^WgmTJzk$eqIvOtlQ2u6{1-oD!M<
DFOXUP

literal 1114
zcmeAS@N?(olHy`uVBq!ia0y~yV4MYH2XHV0N%1?*=0Hj!z$e7@|Ns9$=8HF9OZyK^
z0J6aNz<~p-op<DcT#k|;zhDNSA`rNGD#VC^f%&DUi(^Oy<J-BfC(SnCX|?AwuKe$w
zCv;$%e#6aNYp%fd%R1X8)PDK-N&Lb8j9JTG@-gk0nfFNZ0>h4w1&jqN9he^kHL@L8
zx{vYf=es7p)zh|rTV=mr?wVHVw#-@6UVi0&5D?#<cK<`BCfh}w`kA-P@9&kaGnYBQ
zzUsplor_)1_6D6T@|9io{OY$n{cFEAtFr3cUtjq1wcV__M>PLWJNx9PoXPu3OL~L<
z>{*bS7riziOaAwy$FKI>-n>Od{asy@u2#eBl}^cgTYhC^SLM7s{dj{@a>!HDjBi4>
zcdOO@I-4=A>dS>E^MXyX15e*jdcUoZPv|!D+S9L3UzqZHdGVAPTxLtxMW4Q5_RpfQ
zbiq~O-_LeG<MEBUs>~k6?z?=ohfMj|Pf7mMO9Txj&R?s3RXuz|%Jw-Kp?{0-@$H>^
z<o3<2U)CQ_FP(Q+p7%hy7J85{@ius~N-<35GGWjw^)|U|;%hG8!0}*`9D^c5K2T8Z
zYXyrmLpzwIBAmnU2N<Xpp$$lZifn>t215*z6$P&S#~&9OGv0Ch9(@KB0eI9xVhEdp
zEA@pY=Rf~h|8>Um%74dqEnFNq$u3^3SEY6zQ?JU-kOdP}fUckPB&gACQp_qB<Gu60
zr2U&VW&YZ|ukvS?GpW7|$o{kC&t_w-xbqkPTnaF)n!8>m;mo%k%b87nf4%cE(%pbL
z*7Z`|b&(|fmkhIBw^bEqUX0ml`{Lw+%4czN_ZUh|TY31)o?G|crcIn-DaZEg>!kX5
zim#(hOR}@ldrdRy@-u$xyWXtHZ0O$RZkuZITH*GCZ_iCzZPw<NT?(<!?)}dE_SLGk
znJT||ZfKlq6gzw0;7ZL6wOv`&H-a0Fg)Cj?e|d7s;Y%{*%(o@YO0BIg<g7Qn<oG$-
z`L*eW{$)`UmAAFqmR{5`er0*mHr6EVZ3%O=u}<x}=Z8K#Gk4>=@aIkd*Q_OfMB-z&
z*uGiWzAPs1YS+rJ)?VY{JG?fxO^=6v=Py62&$IRR>WcLjdT#u?xh}K+nX&rWwKwJb
zOCQ{ez5Mas_KDixn|D9kv~c3?XOrG0`b+limAGGDroQFNl84v#9PR06Qhl0kdE)x~
zPY&AR>vpPK&sSL)(*5kcgjZnczD*CC-Uj-!^{QB2<?9m$Mnm}Wd3H=^8D{o77r%RH
zT-K{H_r+r%DXVqCV-hf>c^0j7Q1;Xl%}_bH6cl||gwNWX|IC|m;ml{7`wsOC=7&NR
Usu_xMfCT}Ar>mdKI;Vst0C5ZrKL7v#

diff --git a/master/classes.html b/master/classes.html
index 8262688254..1ccedec598 100644
--- a/master/classes.html
+++ b/master/classes.html
@@ -111,7 +111,7 @@
 <dd><a class="el" href="structdlaf_1_1factorization_1_1internal_1_1_q_r.html">QR</a> (dlaf::factorization::internal)</dd><dd><a class="el" href="structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html">QR_Tfactor</a> (dlaf::factorization::internal)</dd></dl>
 <dl class="classindex even">
 <dt class="alphachar"><a name="letter_R">R</a></dt>
-<dd><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">ReductionToBand</a> (dlaf::eigensolver::internal)</dd><dd><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> (dlaf::matrix)</dd><dd><a class="el" href="structdlaf_1_1common_1_1_round_robin.html">RoundRobin</a> (dlaf::common)</dd></dl>
+<dd><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">ReductionToBand</a> (dlaf::eigensolver::internal)</dd><dd><a class="el" href="structdlaf_1_1common_1_1_round_robin.html">RoundRobin</a> (dlaf::common)</dd></dl>
 <dl class="classindex odd">
 <dt class="alphachar"><a name="letter_S">S</a></dt>
 <dd><a class="el" href="structdlaf_1_1_scoped_initializer.html">ScopedInitializer</a> (dlaf)</dd><dd><a class="el" href="structdlaf_1_1internal_1_1_sender_single_value_type_impl.html">SenderSingleValueTypeImpl</a> (dlaf::internal)</dd><dd><a class="el" href="structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_356df456d49829a554002eacb85cc5b7.html">SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::read &gt; &gt; &gt; &gt;</a> (dlaf::internal)</dd><dd><a class="el" href="structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_3535bbe9d77284105a6158ec315ee38c.html">SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::readwrite &gt; &gt; &gt; &gt;</a> (dlaf::internal)</dd><dd><a class="el" href="structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01std_1b569951bd408b620bb545799a6089d25.html">SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; std::reference_wrapper&lt; T &gt; &gt; &gt; &gt;</a> (dlaf::internal)</dd><dd><a class="el" href="structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01_t_01_4_01_4_01_4.html">SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; T &gt; &gt; &gt;</a> (dlaf::internal)</dd><dd><a class="el" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">SingleThreadedBlasScope</a> (dlaf::common::internal)</dd><dd><a class="el" href="classdlaf_1_1common_1_1_size2_d.html">Size2D</a> (dlaf::common)</dd><dd><a class="el" href="structdlaf_1_1common_1_1internal_1_1source__location.html">source_location</a> (dlaf::common::internal)</dd><dd><a class="el" href="structdlaf_1_1matrix_1_1_sub_matrix_view.html">SubMatrixView</a> (dlaf::matrix)</dd><dd><a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">SubPanelView</a> (dlaf::matrix)</dd><dd><a class="el" href="structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html">Matrix&lt; const T, D &gt;::SubPipelineTag</a> (dlaf::matrix)</dd><dd><a class="el" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">SubTileSpec</a> (dlaf::matrix)</dd><dd><a class="el" href="classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker.html">SweepWorker</a> (dlaf::eigensolver::internal)</dd><dd><a class="el" href="classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker_dist.html">SweepWorkerDist</a> (dlaf::eigensolver::internal)</dd></dl>
diff --git a/master/copy_8h_source.html b/master/copy_8h_source.html
index e97f2399b7..6d6a219a23 100644
--- a/master/copy_8h_source.html
+++ b/master/copy_8h_source.html
@@ -131,7 +131,7 @@
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::LocalTile_TAG &gt;</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1internal_1_1_policy_html"><div class="ttname"><a href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a></div><div class="ttdef"><b>Definition:</b> policy.h:24</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix&lt; const T, Source &gt;</a></div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:121</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:122</div></div>
 <div class="ttc" id="acopy__tile_8h_html"><div class="ttname"><a href="copy__tile_8h.html">copy_tile.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
 <div class="ttc" id="arange2d_8h_html"><div class="ttname"><a href="range2d_8h.html">range2d.h</a></div></div>
diff --git a/master/dir_21834082df7a318c018c9cc963be86ec.html b/master/dir_21834082df7a318c018c9cc963be86ec.html
index bdf58ac8c6..d213edd02b 100644
--- a/master/dir_21834082df7a318c018c9cc963be86ec.html
+++ b/master/dir_21834082df7a318c018c9cc963be86ec.html
@@ -99,8 +99,6 @@
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:print__numpy_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="print__numpy_8h.html">print_numpy.h</a> <a href="print__numpy_8h_source.html">[code]</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:retiled__matrix_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="retiled__matrix_8h.html">retiled_matrix.h</a> <a href="retiled__matrix_8h_source.html">[code]</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:matrix_2tile_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="matrix_2tile_8h.html">tile.h</a> <a href="matrix_2tile_8h_source.html">[code]</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:util__distribution_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="util__distribution_8h.html">util_distribution.h</a> <a href="util__distribution_8h_source.html">[code]</a></td></tr>
diff --git a/master/eigensolver_2bt__band__to__tridiag_2impl_8h_source.html b/master/eigensolver_2bt__band__to__tridiag_2impl_8h_source.html
index 9766a50f56..e8ab1d2087 100644
--- a/master/eigensolver_2bt__band__to__tridiag_2impl_8h_source.html
+++ b/master/eigensolver_2bt__band__to__tridiag_2impl_8h_source.html
@@ -110,966 +110,965 @@
 <div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="index_8h.html">dlaf/matrix/index.h</a>&gt;</span></div>
 <div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_8h.html">dlaf/matrix/matrix.h</a>&gt;</span></div>
 <div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="panel_8h.html">dlaf/matrix/panel.h</a>&gt;</span></div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="retiled__matrix_8h.html">dlaf/matrix/retiled_matrix.h</a>&gt;</span></div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/policy.h&gt;</span></div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/traits.h&gt;</span></div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/transform.h&gt;</span></div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/when_all_lift.h&gt;</span></div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tune_8h.html">dlaf/tune.h</a>&gt;</span></div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__math_8h.html">dlaf/util_math.h</a>&gt;</span></div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__matrix_8h.html">dlaf/util_matrix.h</a>&gt;</span></div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">namespace </span>dlaf::eigensolver::internal {</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160; </div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">namespace </span>bt_tridiag {</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160; </div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;matrix::Tile&lt;T, Device::CPU&gt; setupVWellFormed(<span class="keyword">const</span> SizeType b,</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                                              <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_hh,</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                                              matrix::Tile&lt;T, Device::CPU&gt; tile_v) {</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">using</span> <a class="code" href="util__lapack_8h.html#a2a62e0ec6768b42ae19efff5ea5e4331">lapack::lacpy</a>;</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="keyword">using</span> <a class="code" href="util__lapack_8h.html#a653b4d466d700c7d6d3befb51c8ca9d8">lapack::laset</a>;</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160; </div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="comment">// Note: the size of of tile_hh and tile_v embeds a relevant information about the number of</span></div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="comment">// reflecotrs and their max size. This will be exploited to correctly setup the well formed</span></div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="comment">// tile with reflectors in place as they will be applied.</span></div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> k = tile_v.size().cols();</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160; </div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="comment">// copy from compact representation reflector values (the first component set to 1 is not there)</span></div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; k; ++j) {</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> compact_refl_size =</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;        std::min&lt;SizeType&gt;(tile_v.size().rows() - (1 + j), tile_hh.size().rows() - 1);</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="comment">// this is needed because of complex last reflector (i.e. just 1 element long)</span></div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keywordflow">if</span> (compact_refl_size == 0)</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="keywordflow">continue</span>;</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160; </div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    lacpy(blas::Uplo::General, compact_refl_size, 1, tile_hh.ptr({1, j}), tile_hh.ld(),</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          tile_v.ptr({1 + j, j}), tile_v.ld());</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  }</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160; </div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="comment">// In addition to setting the diagonal to 1 for missing first components, here it zeros out</span></div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="comment">// both the upper and the lower part. Indeed due to the skewed shape, reflectors do not occupy</span></div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  <span class="comment">// the full tile height, and V should be fully well-formed because the next triangular</span></div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <span class="comment">// multiplication, i.e. `V . T`, and the gemm `V* . E`, will use V as a general matrix.</span></div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  laset(blas::Uplo::Upper, tile_v.size().rows(), k, T(0), T(1), tile_v.ptr({0, 0}), tile_v.ld());</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160; </div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="keywordflow">if</span> (tile_v.size().rows() &gt; b)</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    laset(blas::Uplo::Lower, tile_v.size().rows() - b, k - 1, T(0), T(0), tile_v.ptr({b, 0}),</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;          tile_v.ld());</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160; </div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="keywordflow">return</span> tile_v;</div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;}</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160; </div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keywordtype">void</span> computeTFactor(<span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_taus,</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                    <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_v,</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                    <span class="keyword">const</span> matrix::Tile&lt;T, Device::CPU&gt;&amp; tile_t) {</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">using namespace </span>lapack;</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160; </div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160; </div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="comment">// taus have to be extracted from the compact form (i.e. first row of the input tile)</span></div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  std::vector&lt;T&gt; taus;</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  taus.resize(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(tile_v.size().cols()));</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  <span class="keywordflow">for</span> (SizeType i = 0; i &lt; <a class="code" href="types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9">to_SizeType</a>(taus.size()); ++i)</div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    taus[<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(i)] = tile_taus({0, i});</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160; </div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> n = tile_v.size().rows();</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> k = tile_v.size().cols();</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  larft(Direction::Forward, StoreV::Columnwise, n, k, tile_v.ptr(), tile_v.ld(), taus.data(),</div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;        tile_t.ptr(), tile_t.ld());</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;}</div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160; </div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;std::tuple&lt;matrix::Tile&lt;T, Device::CPU&gt;, matrix::Tile&lt;T, Device::CPU&gt;&gt; computeVT(</div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_hh, <span class="keyword">const</span> SizeType hhr_nb,</div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    matrix::Tile&lt;T, Device::CPU&gt; tile_v, matrix::Tile&lt;T, Device::CPU&gt; tile_t) {</div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="keyword">auto</span> tile_v2 = setupVWellFormed(b, tile_hh, std::move(tile_v));</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile_v2.size().cols(); j += hhr_nb) {</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v2.size().cols() - j);</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">const</span> SizeType ib = std::min(jb + b - 1, tile_v2.size().rows() - j);</div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="keyword">auto</span> subtile_t = tile_t.subTileReference({{j, j}, {jb, jb}});</div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keyword">auto</span> subtile_hh = tile_hh.subTileReference({{0, j}, {1, jb}});</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keyword">auto</span> subtile_v = tile_v2.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    computeTFactor(subtile_hh, subtile_v, subtile_t);</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  }</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="keywordflow">return</span> std::make_tuple(std::move(tile_v2), std::move(tile_t));</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;}</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160; </div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;std::tuple&lt;matrix::Tile&lt;T, Device::CPU&gt;, matrix::Tile&lt;T, Device::CPU&gt;&gt; computeVW(</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_hh, <span class="keyword">const</span> SizeType hhr_nb,</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    matrix::Tile&lt;T, Device::CPU&gt; tile_v, matrix::Tile&lt;T, Device::CPU&gt; tile_t,</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    matrix::Tile&lt;T, Device::CPU&gt; tile_w) {</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160; </div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <span class="keyword">auto</span> [tile_v2, tile_t2] = computeVT(b, tile_hh, hhr_nb, std::move(tile_v), std::move(tile_t));</div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160; </div>
-<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile_v2.size().cols(); j += hhr_nb) {</div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v2.size().cols() - j);</div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keyword">const</span> SizeType ib = std::min(jb + b - 1, tile_v2.size().rows() - j);</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keyword">auto</span> subtile_t = tile_t2.subTileReference({{j, j}, {jb, jb}});</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keyword">auto</span> subtile_v = tile_v2.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keyword">auto</span> subtile_w = tile_w.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160; </div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    dlaf::tile::internal::trmm3(Side::Right, Uplo::Upper, Op::NoTrans, Diag::NonUnit, T(1), subtile_t,</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;                                subtile_v, subtile_w);</div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  }</div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keywordflow">return</span> std::make_tuple(std::move(tile_v2), std::move(tile_w));</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;}</div>
-<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160; </div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> Tile, <span class="keyword">class</span> CTile&gt;</div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;std::tuple&lt;CTile, CTile, Tile, Tile&gt; applyHHToSingleTileRowSubtileHelper(  <span class="comment">//</span></div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <span class="keyword">const</span> SizeType j, <span class="keyword">const</span> SizeType jb, <span class="keyword">const</span> CTile&amp; tile_v, <span class="keyword">const</span> CTile&amp; tile_w, <span class="keyword">const</span> Tile&amp; tile_w2,</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <span class="keyword">const</span> Tile&amp; tile_e) {</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  DLAF_ASSERT_HEAVY(tile_v.size() == tile_w.size(), tile_v, tile_w);</div>
-<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  DLAF_ASSERT_HEAVY(tile_e.size().rows() - 1 == tile_v.size().rows(), tile_e, tile_v);</div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  DLAF_ASSERT_HEAVY(tile_e.size().cols() == tile_w2.size().cols(), tile_e, tile_w2);</div>
-<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160; </div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <span class="keyword">const</span> SizeType ib = tile_v.size().rows() - j;</div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <span class="keyword">auto</span> subtile_v = tile_v.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">auto</span> subtile_w = tile_w.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="keyword">auto</span> subtile_w2 = tile_w2.subTileReference({{0, 0}, {jb, tile_w2.size().cols()}});</div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="keyword">auto</span> subtile_e = tile_e.subTileReference({{j + 1, 0}, tile_e.size() - TileElementSize{j + 1, 0}});</div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160; </div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  <span class="keywordflow">return</span> {std::move(subtile_v), std::move(subtile_w), std::move(subtile_w2), std::move(subtile_e)};</div>
-<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;}</div>
-<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160; </div>
-<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">  174</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">ApplyHHToSingleTileRow</a>;</div>
-<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160; </div>
-<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html">  177</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">ApplyHHToSingleTileRow</a>&lt;Backend::MC, T&gt; {</div>
-<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <span class="keywordtype">void</span> operator()(<span class="keyword">const</span> SizeType hhr_nb, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_v,</div>
-<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_w,</div>
-<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_w2,</div>
-<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_e) {</div>
-<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
-<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160; </div>
-<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
-<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160; </div>
-<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
-<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
-<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      <span class="keyword">auto</span> [subtile_v, subtile_w, subtile_w2, subtile_e] =</div>
-<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;          applyHHToSingleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e);</div>
-<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160; </div>
-<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
-<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;      gemm(Op::ConjTrans, Op::NoTrans, T(1), subtile_v, subtile_e, T(0), subtile_w2);</div>
-<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      <span class="comment">// E -= W . W2</span></div>
-<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      gemm(Op::NoTrans, Op::NoTrans, T(-1), subtile_w, subtile_w2, T(1), subtile_e);</div>
-<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    }</div>
-<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;  }</div>
-<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;};</div>
-<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160; </div>
-<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
-<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00202"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html">  202</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">ApplyHHToSingleTileRow</a>&lt;Backend::GPU, T&gt; {</div>
-<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  <span class="keywordtype">void</span> operator()(cublasHandle_t handle, <span class="keyword">const</span> SizeType hhr_nb,</div>
-<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_v,</div>
-<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_w,</div>
-<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_w2,</div>
-<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_e) {</div>
-<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
-<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160; </div>
-<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
-<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160; </div>
-<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
-<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
-<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="keyword">auto</span> [subtile_v, subtile_w, subtile_w2, subtile_e] =</div>
-<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;          applyHHToSingleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e);</div>
-<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160; </div>
-<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
-<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      gemm(handle, Op::ConjTrans, Op::NoTrans, T(1), subtile_v, subtile_e, T(0), subtile_w2);</div>
-<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      <span class="comment">// E -= W . W2</span></div>
-<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      gemm(handle, Op::NoTrans, Op::NoTrans, T(-1), subtile_w, subtile_w2, T(1), subtile_e);</div>
-<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    }</div>
-<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  }</div>
-<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;};</div>
-<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160; </div>
-<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> Tile, <span class="keyword">class</span> CTile&gt;</div>
-<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;std::tuple&lt;CTile, CTile, CTile, CTile, Tile, Tile, Tile&gt; applyHHToDoubleTileRowSubtileHelper(  <span class="comment">//</span></div>
-<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="keyword">const</span> SizeType j, <span class="keyword">const</span> SizeType jb, <span class="keyword">const</span> CTile&amp; tile_v, <span class="keyword">const</span> CTile&amp; tile_w, <span class="keyword">const</span> Tile&amp; tile_w2,</div>
-<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keyword">const</span> Tile&amp; tile_e_top, <span class="keyword">const</span> Tile&amp; tile_e_bottom) {</div>
-<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;  DLAF_ASSERT_HEAVY(tile_v.size() == tile_w.size(), tile_v, tile_w);</div>
-<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  DLAF_ASSERT_HEAVY(tile_e_top.size().rows() + tile_e_bottom.size().rows() - 1 == tile_v.size().rows(),</div>
-<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;                    tile_e_top, tile_e_bottom, tile_v);</div>
-<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  DLAF_ASSERT_HEAVY(tile_e_top.size().cols() == tile_w2.size().cols(), tile_e_top, tile_w2);</div>
-<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;  DLAF_ASSERT_HEAVY(tile_e_bottom.size().cols() == tile_w2.size().cols(), tile_e_bottom, tile_w2);</div>
-<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160; </div>
-<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;  <span class="keyword">auto</span> subtile_e_top =</div>
-<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      tile_e_top.subTileReference({{j + 1, 0}, tile_e_top.size() - <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>{j + 1, 0}});</div>
-<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  <span class="keyword">auto</span> subtile_e_bottom = tile_e_bottom.subTileReference(</div>
-<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      {{0, 0},</div>
-<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;       TileElementSize{std::min(tile_e_bottom.size().rows(), j + jb), tile_e_bottom.size().cols()}});</div>
-<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160; </div>
-<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;  matrix::SubTileSpec spec_top{{j, j}, {subtile_e_top.size().rows(), jb}};</div>
-<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  matrix::SubTileSpec spec_bottom{{tile_e_top.size().rows() - 1, j},</div>
-<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;                                  {subtile_e_bottom.size().rows(), jb}};</div>
-<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160; </div>
-<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;  <span class="keyword">auto</span> subtile_v_top = tile_v.subTileReference(spec_top);</div>
-<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;  <span class="keyword">auto</span> subtile_v_bottom = tile_v.subTileReference(spec_bottom);</div>
-<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <span class="keyword">auto</span> subtile_w_top = tile_w.subTileReference(spec_top);</div>
-<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;  <span class="keyword">auto</span> subtile_w_bottom = tile_w.subTileReference(spec_bottom);</div>
-<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;  <span class="keyword">auto</span> subtile_w2 = tile_w2.subTileReference({{0, 0}, {jb, tile_w2.size().cols()}});</div>
-<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160; </div>
-<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;  <span class="keywordflow">return</span> {std::move(subtile_v_top),    std::move(subtile_v_bottom), std::move(subtile_w_top),</div>
-<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;          std::move(subtile_w_bottom), std::move(subtile_w2),       std::move(subtile_e_top),</div>
-<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;          std::move(subtile_e_bottom)};</div>
-<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;}</div>
-<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160; </div>
-<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">  259</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">ApplyHHToDoubleTileRow</a>;</div>
-<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160; </div>
-<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00262"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html">  262</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">ApplyHHToDoubleTileRow</a>&lt;Backend::MC, T&gt; {</div>
-<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;  <span class="keywordtype">void</span> operator()(<span class="keyword">const</span> SizeType hhr_nb, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_v,</div>
-<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_w,</div>
-<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_w2,</div>
-<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_e_top,</div>
-<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_e_bottom) {</div>
-<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
-<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160; </div>
-<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
-<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160; </div>
-<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
-<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
-<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;      <span class="keyword">auto</span> [subtile_v_top, subtile_v_bottom, subtile_w_top, subtile_w_bottom, subtile_w2, subtile_e_top,</div>
-<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;            subtile_e_bottom] =</div>
-<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;          applyHHToDoubleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e_top, tile_e_bottom);</div>
-<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160; </div>
-<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
-<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      gemm(Op::ConjTrans, Op::NoTrans, T(1), subtile_v_top, subtile_e_top, T(0), subtile_w2);</div>
-<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      gemm(Op::ConjTrans, Op::NoTrans, T(1), subtile_v_bottom, subtile_e_bottom, T(1), subtile_w2);</div>
-<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      <span class="comment">// E -= W . W2</span></div>
-<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      gemm(Op::NoTrans, Op::NoTrans, T(-1), subtile_w_top, subtile_w2, T(1), subtile_e_top);</div>
-<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      gemm(Op::NoTrans, Op::NoTrans, T(-1), subtile_w_bottom, subtile_w2, T(1), subtile_e_bottom);</div>
-<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    }</div>
-<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;  }</div>
-<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;};</div>
-<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160; </div>
-<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
-<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00291"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html">  291</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">ApplyHHToDoubleTileRow</a>&lt;Backend::GPU, T&gt; {</div>
-<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;  <span class="keywordtype">void</span> operator()(cublasHandle_t handle, <span class="keyword">const</span> SizeType hhr_nb,</div>
-<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_v,</div>
-<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_w,</div>
-<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_w2,</div>
-<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_e_top,</div>
-<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_e_bottom) {</div>
-<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
-<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160; </div>
-<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
-<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160; </div>
-<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
-<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
-<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;      <span class="keyword">auto</span> [subtile_v_top, subtile_v_bottom, subtile_w_top, subtile_w_bottom, subtile_w2, subtile_e_top,</div>
-<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;            subtile_e_bottom] =</div>
-<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;          applyHHToDoubleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e_top, tile_e_bottom);</div>
-<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160; </div>
-<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
-<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      gemm(handle, Op::ConjTrans, Op::NoTrans, T(1), subtile_v_top, subtile_e_top, T(0), subtile_w2);</div>
-<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      gemm(handle, Op::ConjTrans, Op::NoTrans, T(1), subtile_v_bottom, subtile_e_bottom, T(1),</div>
-<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;           subtile_w2);</div>
-<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <span class="comment">// E -= W . W2</span></div>
-<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      gemm(handle, Op::NoTrans, Op::NoTrans, T(-1), subtile_w_top, subtile_w2, T(1), subtile_e_top);</div>
-<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      gemm(handle, Op::NoTrans, Op::NoTrans, T(-1), subtile_w_bottom, subtile_w2, T(1),</div>
-<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;           subtile_e_bottom);</div>
-<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;    }</div>
-<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;  }</div>
-<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;};</div>
-<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160; </div>
-<div class="line"><a name="l00322"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">  322</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a> {</div>
-<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>(<span class="keyword">const</span> SizeType b, <span class="keyword">const</span> SizeType nrefls, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>&amp; dist_hh,</div>
-<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;                   <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>&amp; dist_e, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a> offset)</div>
-<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;      : nrefls_(nrefls), input_spec_{dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a71ad776a93750b9c6d1ebfa2d36e28db">tileElementIndex</a>(offset),</div>
-<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;                                     {std::min(b, dist_hh.size().rows() - offset.row()),</div>
-<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;                                      std::min(b, dist_hh.size().cols() - offset.col())}},</div>
-<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;        index_e_(dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d">globalTileFromGlobalElement</a>&lt;Coord::Row&gt;(offset.row())) {</div>
-<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <span class="comment">// Next logic is about detecting the available application space for reflectors, which once</span></div>
-<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    <span class="comment">// extracted they expands to a matrix with 2 * b - 1 height.</span></div>
-<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <span class="comment">// There are two main scenarios:</span></div>
-<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;    <span class="comment">// - reflectors involves rows of a single tile;</span></div>
-<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    <span class="comment">// - reflectors involves rows across two different tiles.</span></div>
-<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160; </div>
-<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    rows_v_ = std::min(2 * b, dist_e.size().rows() - offset.row()) - 1;</div>
-<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    rows_v_top_ = std::min(rows_v_, b - 1);</div>
-<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160; </div>
-<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="comment">// In general, keep in mind that the first row of the top tile_e should not be touched.</span></div>
-<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;    <span class="comment">// The structs ApplyHHTo... take care of it.</span></div>
-<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <span class="comment">// e.g. b = 4</span></div>
-<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    <span class="comment">// reflectors   matrix</span></div>
-<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="comment">//              X X X X</span></div>
-<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="comment">// 1 0 0 0      X X X X</span></div>
-<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="comment">// a 1 0 0      X X X X</span></div>
-<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    <span class="comment">// a b 1 0      X X X X</span></div>
-<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;    <span class="comment">//              -------</span></div>
-<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    <span class="comment">// a b c 1      Y Y Y Y</span></div>
-<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;    <span class="comment">// 0 b c d      Y Y Y Y</span></div>
-<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    <span class="comment">// 0 0 c d      Y Y Y Y</span></div>
-<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    <span class="comment">// 0 0 0 d      Y Y Y Y</span></div>
-<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    <span class="comment">// From the drawing above, it is possible to see the dashed tile separation between X and Y,</span></div>
-<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    <span class="comment">// and how the reflectors on the left are going to be applied. In particular, the first row of</span></div>
-<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    <span class="comment">// the upper tile is not affected.</span></div>
-<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160; </div>
-<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    <span class="comment">// A single tile is involved only if it is the last row tile, so by construction reflectors will be</span></div>
-<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;    <span class="comment">// applied to a single tile;</span></div>
-<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    across_tiles_ = !(index_e_ == dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516">nrTiles</a>().rows() - 1);</div>
-<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160; </div>
-<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    across_ranks_ = across_tiles_ &amp;&amp; (dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">rankGlobalTile</a>&lt;Coord::Row&gt;(index_e_) !=</div>
-<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;                                      dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">rankGlobalTile</a>&lt;Coord::Row&gt;(index_e_ + 1));</div>
-<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;  }</div>
-<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160; </div>
-<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;  <span class="comment">// Return true if the application of Householder reflectors involves multiple tiles</span></div>
-<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;  <span class="keywordtype">bool</span> affectsMultipleTiles() <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    <span class="keywordflow">return</span> across_tiles_;</div>
-<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;  }</div>
-<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160; </div>
-<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;  <span class="comment">// Return true if the application of Householder reflectors involves multiple ranks</span></div>
-<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;  <span class="keywordtype">bool</span> affectsMultipleRanks() <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;    <span class="keywordflow">return</span> across_ranks_;</div>
-<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;  }</div>
-<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160; </div>
-<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing Householder reflectors in compact form</span></div>
-<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  <span class="comment">// SubTileSpec returned points to the sub-block in the full tile containing the HH data in compact</span></div>
-<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;  <span class="comment">// form. If @p reset_origin is true, then the origin component of the SubTileSpec is resetted and</span></div>
-<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;  <span class="comment">// it will just describe the size of the sub-block containing the Householder reflectors (useful</span></div>
-<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;  <span class="comment">// for panel access which might not have full-tiles).</span></div>
-<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specHHCompact(<span class="keyword">const</span> <span class="keywordtype">bool</span> reset_origin = <span class="keyword">false</span>) <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;    <span class="keywordflow">if</span> (reset_origin)</div>
-<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      <span class="keywordflow">return</span> {{0, 0}, input_spec_.size};</div>
-<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    <span class="keywordflow">return</span> input_spec_;</div>
-<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;  }</div>
-<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160; </div>
-<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing Householder reflectors in well formed form</span></div>
-<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specHH() <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;    <span class="keywordflow">return</span> {{0, 0}, {rows_v_, nrefls_}};</div>
-<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;  }</div>
-<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160; </div>
-<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing Householder reflectors in well formed form</span></div>
-<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;  <span class="comment">// for the distributed case.</span></div>
-<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specHH(<span class="keywordtype">bool</span> is_top_rank) <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;    <span class="keywordflow">if</span> (is_top_rank)</div>
-<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;      <span class="keywordflow">return</span> {{0, 0}, {rows_v_top_, nrefls_}};</div>
-<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    DLAF_ASSERT_MODERATE(affectsMultipleTiles(), affectsMultipleTiles());</div>
-<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;    <span class="keywordflow">return</span> {{rows_v_top_, 0}, {rows_v_ - rows_v_top_, nrefls_}};</div>
-<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;  }</div>
-<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160; </div>
-<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing T factor</span></div>
-<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specT() <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;    <span class="keywordflow">return</span> {{0, 0}, {nrefls_, nrefls_}};</div>
-<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;  }</div>
-<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160; </div>
-<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specW2(<span class="keyword">const</span> SizeType cols) <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;    <span class="keywordflow">return</span> {{0, 0}, {nrefls_, cols}};</div>
-<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;  }</div>
-<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160; </div>
-<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> topIndexE(<span class="keyword">const</span> SizeType j) <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;    <span class="keywordflow">return</span> {index_e_, j};</div>
-<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;  }</div>
-<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160; </div>
-<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> bottomIndexE(<span class="keyword">const</span> SizeType j) <span class="keyword">const</span> noexcept {</div>
-<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;    DLAF_ASSERT_MODERATE(affectsMultipleTiles(), affectsMultipleTiles());</div>
-<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;    <span class="keywordflow">return</span> {index_e_ + 1, j};</div>
-<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;  }</div>
-<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160; </div>
-<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;<span class="keyword">private</span>:</div>
-<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;  SizeType nrefls_;</div>
-<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> input_spec_;</div>
-<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;  SizeType index_e_;</div>
-<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;  SizeType rows_v_;</div>
-<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;  SizeType rows_v_top_;</div>
-<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160; </div>
-<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;  <span class="keywordtype">bool</span> across_tiles_;</div>
-<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;  <span class="keywordtype">bool</span> across_ranks_;</div>
-<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;};</div>
-<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160; </div>
-<div class="line"><a name="l00446"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">  446</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">DistIndexing</a> {</div>
-<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">DistIndexing</a>(<span class="keyword">const</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>&amp; helper, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>&amp; dist_hh, <span class="keyword">const</span> SizeType b,</div>
-<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;               <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; ij, <span class="keyword">const</span> SizeType&amp; ij_b_row)</div>
-<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;      : dist_hh(dist_hh), b(b), mb(dist_hh.blockSize().rows()), helper(helper), ij(ij),</div>
-<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;        ij_b_row(ij_b_row) {</div>
-<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;    rank = dist_hh.rankIndex();</div>
-<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;    rankHH = dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">rankGlobalTile</a>(ij);</div>
-<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;    n_ws_per_block = <a class="code" href="types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9">to_SizeType</a>(<span class="keyword">static_cast&lt;</span><span class="keywordtype">size_t</span><span class="keyword">&gt;</span>(std::ceil(mb / b / 2.0f)) + 1);</div>
-<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;  }</div>
-<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160; </div>
-<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  <a class="code" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rankRowPartner()<span class="keyword"> const </span>{</div>
-<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;    <span class="keywordflow">return</span> (rankHH.row() + 1) % dist_hh.commGridSize().rows();</div>
-<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;  }</div>
-<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160; </div>
-<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;  <span class="keywordtype">bool</span> isInvolved()<span class="keyword"> const </span>{</div>
-<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isSameRow = rank.row() == rankHH.row();</div>
-<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isPartnerRow = rank.row() == rankRowPartner();</div>
-<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;    <span class="keywordflow">return</span> isSameRow || (isPartnerRow &amp;&amp; helper.affectsMultipleRanks());</div>
-<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;  }</div>
-<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160; </div>
-<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> wsIndexHH()<span class="keyword"> const </span>{</div>
-<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;    <span class="keyword">const</span> SizeType row = [&amp;]() -&gt; SizeType {</div>
-<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;      <span class="keywordflow">if</span> (rank.row() == rankHH.row()) {</div>
-<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;        <span class="comment">// Note: index starts at 1 (0 is the extra workspace), moreover max half blocks will run in parallel</span></div>
-<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;        <span class="keyword">const</span> SizeType intra_idx = 1 + (ij_b_row % (mb / b)) / 2;</div>
-<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        DLAF_ASSERT_HEAVY(intra_idx &lt; n_ws_per_block, intra_idx, n_ws_per_block);</div>
-<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;        <span class="keywordflow">return</span> dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811">localTileFromGlobalTile</a>&lt;Coord::Row&gt;(ij.row()) * n_ws_per_block + intra_idx;</div>
-<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;      }</div>
-<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;        DLAF_ASSERT_HEAVY(helper.affectsMultipleRanks() &amp;&amp; (rank.row() == rankRowPartner()),</div>
-<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;                          helper.affectsMultipleRanks(), rank.row(), rankRowPartner());</div>
-<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        <span class="keywordflow">return</span> dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>().<a class="code" href="classdlaf_1_1common_1_1_size2_d.html#afe5870841ddc785db5d4c81cc22aeb93">isEmpty</a>()</div>
-<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;                   ? 0</div>
-<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;                   : dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811">localTileFromGlobalTile</a>&lt;Coord::Row&gt;(ij.row() + 1) * n_ws_per_block;</div>
-<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;      }</div>
-<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;    }();</div>
-<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;    <span class="keywordflow">return</span> {row, 0};</div>
-<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;  }</div>
-<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160; </div>
-<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_hh;</div>
-<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;  SizeType b;</div>
-<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;  SizeType mb;</div>
-<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;  SizeType n_ws_per_block;</div>
-<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160; </div>
-<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a> helper;</div>
-<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160; </div>
-<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a> rank;</div>
-<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a> rankHH;</div>
-<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160; </div>
-<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> ij;</div>
-<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;  SizeType ij_b_row;</div>
-<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;};</div>
-<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160; </div>
-<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00501"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">  501</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>;</div>
-<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160; </div>
-<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00504"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html">  504</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>&lt;Backend::MC, Device::CPU, T&gt; {</div>
-<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;  <span class="keyword">static</span> constexpr Backend B = Backend::MC;</div>
-<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;  <span class="keyword">static</span> constexpr Device D = Device::CPU;</div>
-<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160; </div>
-<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>(<span class="keyword">const</span> SizeType b, <span class="keyword">const</span> std::size_t, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>) : b(b) {}</div>
-<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160; </div>
-<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">class</span> SenderHH&gt;</div>
-<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;  <span class="keyword">auto</span> computeVW(<span class="keyword">const</span> SizeType nb_apply, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> ij, <span class="keyword">const</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>&amp; helper,</div>
-<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;                 SenderHH&amp;&amp; tile_hh, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_v,</div>
-<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;                 <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_t, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_w) {</div>
-<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160; </div>
-<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;    <span class="keywordflow">return</span> dlaf::internal::whenAllLift(b, std::forward&lt;SenderHH&gt;(tile_hh), nb_apply,</div>
-<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;                                       splitTile(mat_v.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH()),</div>
-<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;                                       splitTile(mat_t.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specT()),</div>
-<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;                                       splitTile(mat_w.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH())) |</div>
-<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;           dlaf::internal::transform(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), bt_tridiag::computeVW&lt;T&gt;) |</div>
-<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;           ex::split_tuple();</div>
-<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;  }</div>
-<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160; </div>
-<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;  <span class="keyword">const</span> SizeType b;</div>
-<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;};</div>
-<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160; </div>
-<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
-<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00530"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html">  530</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>&lt;Backend::GPU, Device::GPU, T&gt; {</div>
-<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;  <span class="keyword">static</span> constexpr Backend B = Backend::GPU;</div>
-<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;  <span class="keyword">static</span> constexpr Device D = Device::GPU;</div>
-<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160; </div>
-<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>(<span class="keyword">const</span> SizeType b, <span class="keyword">const</span> std::size_t n_workspaces, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_t,</div>
-<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;            <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_w)</div>
-<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;      : b(b), t_panels_h(n_workspaces, dist_t), w_panels_h(n_workspaces, dist_w) {}</div>
-<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160; </div>
-<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">class</span> SenderHH&gt;</div>
-<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;  <span class="keyword">auto</span> computeVW(<span class="keyword">const</span> SizeType hhr_nb, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> ij, <span class="keyword">const</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>&amp; helper,</div>
-<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;                 SenderHH&amp;&amp; tile_hh, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_v,</div>
-<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;                 <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_t, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_w) {</div>
-<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160; </div>
-<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;    <span class="keyword">auto</span>&amp; mat_v_h = w_panels_h.nextResource();</div>
-<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;    <span class="keyword">auto</span>&amp; mat_t_h = t_panels_h.nextResource();</div>
-<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160; </div>
-<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;    <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> ij_t = ij;</div>
-<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;    <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> t_spec = helper.specT();</div>
-<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160; </div>
-<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;    <span class="keyword">auto</span> [tile_v_h, tile_t_h] =</div>
-<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        dlaf::internal::whenAllLift(b, std::forward&lt;SenderHH&gt;(tile_hh), hhr_nb,</div>
-<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;                                    splitTile(mat_v_h.readwrite(ij), helper.specHH()),</div>
-<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;                                    splitTile(mat_t_h.readwrite(ij_t), t_spec)) |</div>
-<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        dlaf::internal::transform(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), computeVT&lt;T&gt;) |</div>
-<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        ex::split_tuple();</div>
-<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160; </div>
-<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;    <span class="keyword">auto</span> copyVTandComputeW =</div>
-<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;        [b = this-&gt;b, hhr_nb](cublasHandle_t handle, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_v_h,</div>
-<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;                              <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_t_h,</div>
-<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;                              <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_v, <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_t,</div>
-<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;                              <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_w) {</div>
-<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;          whip::stream_t stream;</div>
-<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;          DLAF_GPUBLAS_CHECK_ERROR(cublasGetStream(handle, &amp;stream));</div>
-<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160; </div>
-<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;          matrix::internal::copy(tile_v_h, tile_v, stream);</div>
-<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;          matrix::internal::copy(tile_t_h, tile_t, stream);</div>
-<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160; </div>
-<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;          <span class="comment">// W = V . T</span></div>
-<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;          <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;          <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile_v_h.size().cols(); j += hhr_nb) {</div>
-<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;            <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v_h.size().cols() - j);</div>
-<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;            <span class="keyword">const</span> SizeType ib = std::min(jb + b - 1, tile_v_h.size().rows() - j);</div>
-<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;            <span class="keyword">auto</span> subtile_t = tile_t.subTileReference({{j, j}, {jb, jb}});</div>
-<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;            <span class="keyword">auto</span> subtile_v = tile_v.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;            <span class="keyword">auto</span> subtile_w = tile_w.subTileReference({{j, j}, {ib, jb}});</div>
-<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160; </div>
-<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;            dlaf::tile::internal::trmm3(handle, Side::Right, Uplo::Upper, Op::NoTrans, Diag::NonUnit,</div>
-<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;                                        T(1), subtile_t, subtile_v, subtile_w);</div>
-<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;          }</div>
-<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160; </div>
-<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;          <span class="keywordflow">return</span> std::make_tuple(std::move(tile_v), std::move(tile_w));</div>
-<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;        };</div>
-<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160; </div>
-<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;    <span class="keywordflow">return</span> ex::when_all(std::move(tile_v_h), std::move(tile_t_h),</div>
-<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;                        splitTile(mat_v.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH()),</div>
-<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;                        splitTile(mat_t.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij_t), t_spec),</div>
-<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;                        splitTile(mat_w.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH())) |</div>
-<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;           dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
-<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;               <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::GPU&gt;</a>(), copyVTandComputeW) |</div>
-<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;           ex::split_tuple();</div>
-<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;  }</div>
-<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160; </div>
-<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;  <span class="keyword">const</span> SizeType b;</div>
-<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&gt; t_panels_h;</div>
-<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&gt; w_panels_h;</div>
-<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;};</div>
-<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;}</div>
-<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160; </div>
-<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;<span class="keywordtype">void</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_t2_b.html">BackTransformationT2B&lt;B, D, T&gt;::call</a>(<span class="keyword">const</span> SizeType band_size, Matrix&lt;T, D&gt;&amp; mat_e,</div>
-<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;                                          Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
-<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160; </div>
-<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
-<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;  <span class="keyword">using</span> <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin</a>;</div>
-<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;  <span class="keyword">using</span> <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel</a>;</div>
-<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;  <span class="keyword">using namespace </span>bt_tridiag;</div>
-<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160; </div>
-<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;  <span class="keywordflow">if</span> (mat_hh.size().isEmpty() || mat_e.size().isEmpty())</div>
-<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;    <span class="keywordflow">return</span>;</div>
-<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160; </div>
-<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;  <span class="comment">// Note: if no householder reflectors are going to be applied (in case of trivial matrix)</span></div>
-<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;  <span class="keywordflow">if</span> (mat_hh.size().rows() &lt;= (dlaf::isComplex_v&lt;T&gt; ? 1 : 2))</div>
-<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;    <span class="keywordflow">return</span>;</div>
-<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160; </div>
-<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;  <span class="keyword">const</span> SizeType b = band_size;</div>
-<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;  <span class="keyword">const</span> SizeType group_size = getTuneParameters().bt_band_to_tridiag_hh_apply_group_size;</div>
-<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;  <span class="keyword">const</span> SizeType nsweeps = nrSweeps&lt;T&gt;(mat_hh.size().cols());</div>
-<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160; </div>
-<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> tiles_per_block(mat_e.blockSize().rows() / b, 1);</div>
-<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix&lt;T, D&gt;</a> mat_e_rt(mat_e, tiles_per_block);</div>
-<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160; </div>
-<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_hh = mat_hh.distribution();</div>
-<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_e_rt = mat_e_rt.distribution();</div>
-<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160; </div>
-<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;  <span class="comment">// Note: w_tile_sz can store reflectors as they are actually applied, opposed to how they are</span></div>
-<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;  <span class="comment">// stored in compact form.</span></div>
-<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;  <span class="comment">// e.g. Given b = 4</span></div>
-<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;  <span class="comment">// compact       w_tile_sz</span></div>
-<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;  <span class="comment">// 1 1 1 1       1 0 0 0</span></div>
-<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;  <span class="comment">// a b c d       a 1 0 0</span></div>
-<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;  <span class="comment">// a b c d       a b 1 0</span></div>
-<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;  <span class="comment">// a b c d       a b c 1</span></div>
-<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;  <span class="comment">//               0 b c d</span></div>
-<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;  <span class="comment">//               0 0 c d</span></div>
-<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;  <span class="comment">//               0 0 0 d</span></div>
-<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a> w_tile_sz(2 * b - 1, b);</div>
-<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160; </div>
-<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;  <span class="keyword">const</span> SizeType dist_w_rows = mat_e_rt.nrTiles().rows() * w_tile_sz.rows();</div>
-<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_w({dist_w_rows, b}, w_tile_sz);</div>
-<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_t({mat_hh.size().rows(), b}, {b, b});</div>
-<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_w2({b, mat_e_rt.size().cols()}, {b, mat_e_rt.blockSize().cols()});</div>
-<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160; </div>
-<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
-<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; t_panels(n_workspaces, dist_t);</div>
-<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; v_panels(n_workspaces, dist_w);</div>
-<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; w_panels(n_workspaces, dist_w);</div>
-<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Row, T, D&gt;&gt; w2_panels(n_workspaces, dist_w2);</div>
-<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160; </div>
-<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;  HHManager&lt;B, D, T&gt; helperBackend(b, n_workspaces, dist_t, dist_w);</div>
-<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160; </div>
-<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;  <span class="comment">// Note: sweep are on diagonals, steps are on verticals</span></div>
-<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;  <span class="keyword">const</span> SizeType j_last_sweep = (nsweeps - 1) / b;</div>
-<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;  <span class="keywordflow">for</span> (SizeType j = j_last_sweep; j &gt;= 0; --j) {</div>
-<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;    <span class="keyword">auto</span>&amp; mat_t = t_panels.nextResource();</div>
-<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;    <span class="keyword">auto</span>&amp; mat_v = v_panels.nextResource();</div>
-<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;    <span class="keyword">auto</span>&amp; mat_w = w_panels.nextResource();</div>
-<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;    <span class="keyword">auto</span>&amp; mat_w2 = w2_panels.nextResource();</div>
-<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160; </div>
-<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;    <span class="comment">// Note: apply the entire column (steps)</span></div>
-<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;    <span class="keyword">const</span> SizeType steps = nrStepsForSweep(j * b, mat_hh.size().cols(), b);</div>
-<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;    <span class="keywordflow">for</span> (SizeType step = 0; step &lt; steps; ++step) {</div>
-<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;      <span class="keyword">const</span> SizeType i = j + step;</div>
-<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160; </div>
-<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;      <span class="keyword">const</span> GlobalElementIndex ij_el(i * b, j * b);</div>
-<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij(dist_hh.localTileIndex(dist_hh.globalTileIndex(ij_el)));</div>
-<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160; </div>
-<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;      <span class="comment">// Note:  reflector with size = 1 must be ignored, except for the last step of the last sweep</span></div>
-<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;      <span class="comment">//        with complex type</span></div>
-<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;      <span class="keyword">const</span> SizeType nrefls = [&amp;]() {</div>
-<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;        <span class="keyword">const</span> <span class="keywordtype">bool</span> allowSize1 = isComplex_v&lt;T&gt; &amp;&amp; j == j_last_sweep &amp;&amp; step == steps - 1;</div>
-<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;        <span class="keyword">const</span> GlobalElementSize delta(dist_hh.size().rows() - ij_el.row() - 1,</div>
-<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;                                      std::min(b, dist_hh.size().cols() - ij_el.col()));</div>
-<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;        <span class="keywordflow">return</span> std::min(b, std::min(delta.rows() - (allowSize1 ? 0 : 1), delta.cols()));</div>
-<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;      }();</div>
-<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160; </div>
-<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;      <span class="keyword">const</span> TileAccessHelper helper(b, nrefls, dist_hh, dist_e_rt, ij_el);</div>
-<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160; </div>
-<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;      <span class="keywordflow">if</span> (nrefls &lt; b) {</div>
-<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;        mat_t.setWidth(nrefls);</div>
-<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;        mat_v.setWidth(nrefls);</div>
-<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;        mat_w.setWidth(nrefls);</div>
-<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;        mat_w2.setHeight(nrefls);</div>
-<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;      }</div>
-<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160; </div>
-<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;      <span class="keyword">auto</span> [tile_v_unshared, tile_w_unshared] =</div>
-<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;          helperBackend.computeVW(group_size, ij, helper,</div>
-<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;                                  <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij), helper.specHHCompact()), mat_v, mat_t,</div>
-<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;                                  mat_w);</div>
-<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;      <span class="keyword">auto</span> tile_v = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_v_unshared)));</div>
-<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;      <span class="keyword">auto</span> tile_w = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_w_unshared)));</div>
-<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160; </div>
-<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;      <span class="keywordflow">for</span> (SizeType j_e = 0; j_e &lt; dist_e_rt.nrTiles().cols(); ++j_e) {</div>
-<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> idx_e = helper.topIndexE(j_e);</div>
-<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160; </div>
-<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;        <span class="keywordflow">if</span> (!helper.affectsMultipleTiles()) {</div>
-<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;          ex::start_detached(</div>
-<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;              ex::when_all(ex::just(group_size), tile_v, tile_w,</div>
-<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;                           mat_w2.readwrite(LocalTileIndex(0, j_e)), mat_e_rt.readwrite(idx_e)) |</div>
-<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;              dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
-<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;                  <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal), ApplyHHToSingleTileRow&lt;B, T&gt;{}));</div>
-<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;        }</div>
-<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;        <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;          ex::start_detached(</div>
-<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;              ex::when_all(ex::just(group_size), tile_v, tile_w,</div>
-<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;                           mat_w2.readwrite(LocalTileIndex(0, j_e)), mat_e_rt.readwrite(idx_e),</div>
-<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;                           mat_e_rt.readwrite(helper.bottomIndexE(j_e))) |</div>
-<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;              dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
-<div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;                  <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal), ApplyHHToDoubleTileRow&lt;B, T&gt;{}));</div>
-<div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;        }</div>
-<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;      }</div>
-<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160; </div>
-<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;      mat_t.reset();</div>
-<div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;      mat_v.reset();</div>
-<div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;      mat_w.reset();</div>
-<div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;      mat_w2.reset();</div>
-<div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;    }</div>
-<div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;  }</div>
-<div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;}</div>
-<div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160; </div>
-<div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;<span class="keywordtype">void</span> BackTransformationT2B&lt;B, D, T&gt;::call(comm::CommunicatorGrid grid, <span class="keyword">const</span> SizeType band_size,</div>
-<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;                                          Matrix&lt;T, D&gt;&amp; mat_e, Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
-<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160; </div>
-<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
-<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;  <span class="keyword">using</span> common::RoundRobin;</div>
-<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;  <span class="keyword">using</span> matrix::Panel;</div>
-<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;  <span class="keyword">using namespace </span>bt_tridiag;</div>
-<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160; </div>
-<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;  <span class="keywordflow">if</span> (mat_hh.size().isEmpty() || mat_e.size().isEmpty())</div>
-<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;    <span class="keywordflow">return</span>;</div>
-<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160; </div>
-<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;  <span class="comment">// Note: if no householder reflectors are going to be applied (in case of trivial matrix)</span></div>
-<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;  <span class="keywordflow">if</span> (nrSweeps&lt;T&gt;(mat_hh.size().rows()) == 0)</div>
-<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;    <span class="keywordflow">return</span>;</div>
-<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160; </div>
-<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;  <span class="keyword">const</span> SizeType b = band_size;</div>
-<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;  <span class="keyword">const</span> SizeType mb = mat_hh.blockSize().rows();</div>
-<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;  <span class="keyword">const</span> SizeType group_size = getTuneParameters().bt_band_to_tridiag_hh_apply_group_size;</div>
-<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160; </div>
-<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;  <span class="keyword">const</span> LocalTileSize tiles_per_block(mat_e.blockSize().rows() / b, 1);</div>
-<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;  matrix::RetiledMatrix&lt;T, D&gt; mat_e_rt(mat_e, tiles_per_block);</div>
-<div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160; </div>
-<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_hh = mat_hh.distribution();</div>
-<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_e_rt = mat_e_rt.distribution();</div>
-<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160; </div>
-<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;  <span class="comment">// Note: w_tile_sz can store reflectors as they are actually applied, opposed to how they are</span></div>
-<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;  <span class="comment">// stored in compact form.</span></div>
-<div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;  <span class="comment">// e.g. Given b = 4</span></div>
-<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;  <span class="comment">// compact       w_tile_sz</span></div>
-<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;  <span class="comment">// 1 1 1 1       1 0 0 0</span></div>
-<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;  <span class="comment">// a b c d       a 1 0 0</span></div>
-<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;  <span class="comment">// a b c d       a b 1 0</span></div>
-<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;  <span class="comment">// a b c d       a b c 1</span></div>
-<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;  <span class="comment">//               0 b c d</span></div>
-<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;  <span class="comment">//               0 0 c d</span></div>
-<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;  <span class="comment">//               0 0 0 d</span></div>
-<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;  <span class="keyword">const</span> TileElementSize w_tile_sz(2 * b - 1, b);</div>
-<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160; </div>
-<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;  <span class="keyword">const</span> SizeType nlocal_ws =</div>
-<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;      std::max&lt;SizeType&gt;(1, dist_hh.localNrTiles().rows() * (util::ceilDiv&lt;SizeType&gt;(mb / b, 2) + 1));</div>
-<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_ws_hh({nlocal_ws * b, b}, {b, b});</div>
-<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_ws_v({nlocal_ws * w_tile_sz.rows(), w_tile_sz.cols()}, w_tile_sz);</div>
-<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_ws_w2({nlocal_ws * b, mat_e_rt.size().cols()},</div>
-<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;                                        {b, mat_e_rt.blockSize().cols()});</div>
-<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160; </div>
-<div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
-<div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160; </div>
-<div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; t_panels(n_workspaces, dist_ws_hh);</div>
-<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, Device::CPU&gt;&gt; hh_panels(n_workspaces, dist_ws_hh);</div>
-<div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160; </div>
-<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; v_panels(n_workspaces, dist_ws_v);</div>
-<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; w_panels(n_workspaces, dist_ws_v);</div>
-<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160; </div>
-<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Row, T, D&gt;&gt; w2_panels(n_workspaces, dist_ws_w2);</div>
-<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Row, T, D&gt;&gt; w2tmp_panels(n_workspaces, dist_ws_w2);</div>
-<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160; </div>
-<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;  HHManager&lt;B, D, T&gt; helperBackend(b, n_workspaces, dist_ws_hh, dist_ws_v);</div>
-<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160; </div>
-<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;  <span class="comment">// Note: This distributed algorithm encompass two communication categories:</span></div>
-<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;  <span class="comment">// 1. exchange of HH: broadcast + send p2p</span></div>
-<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;  <span class="comment">// 2. reduction for computing W2: all reduce p2p</span></div>
-<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;  <span class="comment">// P2P communication can happen out of order since they can be matched via tags, but this is not</span></div>
-<div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;  <span class="comment">// possible for collective operations such as the broadcast.</span></div>
-<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;  <span class="comment">// For this reason, communications of the phase 1 will be ordered with a pipeline. Instead, for the</span></div>
-<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;  <span class="comment">// second part, with the aim to not over constrain execution of the update, no order will be</span></div>
-<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;  <span class="comment">// enforced by relying solely on tags.</span></div>
-<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_chain_row(grid.rowCommunicator().clone());</div>
-<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_chain_col(grid.colCommunicator().clone());</div>
-<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> mpi_col_comm = ex::just(grid.colCommunicator().clone());</div>
-<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160; </div>
-<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;  <span class="keyword">const</span> SizeType idx_last_sweep_b = (nrSweeps&lt;T&gt;(mat_hh.size().cols()) - 1) / b;</div>
-<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;  <span class="keyword">const</span> SizeType maxsteps_b = nrStepsForSweep(0, mat_hh.size().rows(), b);</div>
-<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160; </div>
-<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;  <span class="comment">// Note: Next two nested `for`s describe a special order loop over the matrix, which allow to</span></div>
-<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;  <span class="comment">// better schedule communications considering the structure of the algorithm.</span></div>
-<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;  <span class="comment">// Each element depends on:</span></div>
-<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;  <span class="comment">// - top</span></div>
-<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;  <span class="comment">// - bottom-right</span></div>
-<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;  <span class="comment">// - right</span></div>
-<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;  <span class="comment">// This basic rule for dependencies can be described collectively as a mechanism where elements are</span></div>
-<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;  <span class="comment">// &quot;unlocked&quot; in different epochs, which forms a pattern like if the matrix get scanned not</span></div>
-<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;  <span class="comment">// perpendicularly to their main axis, but instead it gets scanned by a slightly skewed line that goes</span></div>
-<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;  <span class="comment">// from top right to bottom left.</span></div>
-<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;  <span class="comment">//  5 x x x x</span></div>
-<div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;  <span class="comment">//  6 4 x x x</span></div>
-<div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;  <span class="comment">//  7 5 3 x x</span></div>
-<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;  <span class="comment">//  8 6 4 2 x</span></div>
-<div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;  <span class="comment">//  9 7 5 3 1</span></div>
-<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;  <span class="comment">// Elements of the same epoch are somehow &quot;independent&quot; and so they can potentially run in parallel,</span></div>
-<div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;  <span class="comment">// given that previous epoch has been completed. Since scheduling happens sequentially, elements</span></div>
-<div class="line"><a name="l00826"></a><span class="lineno">  826</span>&#160;  <span class="comment">// of the same epoch will be ordered starting from top-most one, resulting in</span></div>
-<div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;  <span class="comment">//  7  x x x x</span></div>
-<div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;  <span class="comment">// 10  5 x x x</span></div>
-<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;  <span class="comment">// 12  8 3 x x</span></div>
-<div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;  <span class="comment">// 14 11 6 2 x</span></div>
-<div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;  <span class="comment">// 15 13 9 4 1</span></div>
-<div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;  <span class="keywordflow">for</span> (SizeType k = idx_last_sweep_b; k &gt; -maxsteps_b; --k) {</div>
-<div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;    <span class="keyword">auto</span>&amp; mat_t = t_panels.nextResource();</div>
-<div class="line"><a name="l00835"></a><span class="lineno">  835</span>&#160;    <span class="keyword">auto</span>&amp; panel_hh = hh_panels.nextResource();</div>
-<div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160;    <span class="keyword">auto</span>&amp; mat_v = v_panels.nextResource();</div>
-<div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;    <span class="keyword">auto</span>&amp; mat_w = w_panels.nextResource();</div>
-<div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;    <span class="keyword">auto</span>&amp; mat_w2 = w2_panels.nextResource();</div>
-<div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160;    <span class="keyword">auto</span>&amp; mat_w2tmp = w2tmp_panels.nextResource();</div>
-<div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160; </div>
-<div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;    <span class="keywordflow">for</span> (SizeType i_b = std::abs&lt;SizeType&gt;(k), j_b = std::max&lt;SizeType&gt;(0, k);</div>
-<div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;         i_b &lt; j_b + nrStepsForSweep(j_b * b, mat_hh.size().cols(), b); i_b += 2, ++j_b) {</div>
-<div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;      <span class="keyword">const</span> SizeType step_b = i_b - j_b;</div>
-<div class="line"><a name="l00844"></a><span class="lineno">  844</span>&#160;      <span class="keyword">const</span> GlobalElementIndex ij_el(i_b * b, j_b * b);</div>
-<div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij_g(dist_hh.globalTileIndex(ij_el));</div>
-<div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160; </div>
-<div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160;      <span class="keyword">const</span> comm::Index2D rank = dist_hh.rankIndex();</div>
-<div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160;      <span class="keyword">const</span> comm::Index2D rankHH = dist_hh.rankGlobalTile(ij_g);</div>
-<div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160; </div>
-<div class="line"><a name="l00850"></a><span class="lineno">  850</span>&#160;      <span class="comment">// Note:  reflector with size = 1 must be ignored, except for the last step of the last sweep</span></div>
-<div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;      <span class="comment">//        with complex type</span></div>
-<div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;      <span class="keyword">const</span> SizeType nrefls = [&amp;]() {</div>
-<div class="line"><a name="l00853"></a><span class="lineno">  853</span>&#160;        <span class="keyword">const</span> <span class="keywordtype">bool</span> allowSize1 = isComplex_v&lt;T&gt; &amp;&amp; j_b == idx_last_sweep_b &amp;&amp;</div>
-<div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;                                step_b == nrStepsForSweep(j_b * b, mat_hh.size().cols(), b) - 1;</div>
-<div class="line"><a name="l00855"></a><span class="lineno">  855</span>&#160;        <span class="keyword">const</span> GlobalElementSize delta(dist_hh.size().rows() - ij_el.row() - 1,</div>
-<div class="line"><a name="l00856"></a><span class="lineno">  856</span>&#160;                                      std::min(b, dist_hh.size().cols() - ij_el.col()));</div>
-<div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;        <span class="keywordflow">return</span> std::min(b, std::min(delta.rows() - (allowSize1 ? 0 : 1), delta.cols()));</div>
-<div class="line"><a name="l00858"></a><span class="lineno">  858</span>&#160;      }();</div>
-<div class="line"><a name="l00859"></a><span class="lineno">  859</span>&#160; </div>
-<div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160;      <span class="keyword">const</span> TileAccessHelper helper(b, nrefls, dist_hh, dist_e_rt, ij_el);</div>
-<div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160;      <span class="keyword">const</span> DistIndexing indexing_helper(helper, dist_hh, b, ij_g, i_b);</div>
-<div class="line"><a name="l00862"></a><span class="lineno">  862</span>&#160; </div>
-<div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;      <span class="keywordflow">if</span> (!indexing_helper.isInvolved())</div>
-<div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160;        <span class="keywordflow">continue</span>;</div>
-<div class="line"><a name="l00865"></a><span class="lineno">  865</span>&#160; </div>
-<div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;      <span class="keywordflow">if</span> (nrefls &lt; b) {</div>
-<div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160;        mat_t.setWidth(nrefls);</div>
-<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;        mat_v.setWidth(nrefls);</div>
-<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;        mat_w.setWidth(nrefls);</div>
-<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;        mat_w2.setHeight(nrefls);</div>
-<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;        mat_w2tmp.setHeight(nrefls);</div>
-<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;      }</div>
-<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160; </div>
-<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;      <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;      <span class="comment">// From HH it is possible to extract V that is needed for computing W and W2, both required</span></div>
-<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;      <span class="comment">// for updating E.</span></div>
-<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160; </div>
-<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;      <span class="comment">// Send HH to all involved ranks: broadcast on row + send p2p on col</span></div>
-<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_hh_panel = indexing_helper.wsIndexHH();</div>
-<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160; </div>
-<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;      <span class="comment">// Broadcast on ROW</span></div>
-<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;      <span class="keywordflow">if</span> (grid.size().cols() &gt; 1 &amp;&amp; rank.row() == rankHH.row()) {</div>
-<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;        <span class="keywordflow">if</span> (rank.col() == rankHH.col()) {</div>
-<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;          ex::start_detached(comm::scheduleSendBcast(</div>
-<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;              mpi_chain_row(), <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij_g), helper.specHHCompact())));</div>
-<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;        }</div>
-<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;        <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;          ex::start_detached(comm::scheduleRecvBcast(mpi_chain_row(), rankHH.col(),</div>
-<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;                                                     <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(panel_hh.readwrite(ij_hh_panel),</div>
-<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;                                                               helper.specHHCompact(<span class="keyword">true</span>))));</div>
-<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;        }</div>
-<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;      }</div>
-<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160; </div>
-<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;      <span class="comment">// Jump to the next loop iteration if the local part of E is not affected by the update.</span></div>
-<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;      <span class="keyword">const</span> SizeType ncols_local = dist_e_rt.localNrTiles().cols();</div>
-<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;      <span class="keywordflow">if</span> (ncols_local == 0)</div>
-<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160;        <span class="keywordflow">continue</span>;</div>
-<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160; </div>
-<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;      <span class="comment">// Send P2P on col</span></div>
-<div class="line"><a name="l00900"></a><span class="lineno">  900</span>&#160;      <span class="keywordflow">if</span> (helper.affectsMultipleRanks()) {</div>
-<div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160;        <span class="keyword">const</span> comm::IndexT_MPI rank_src = rankHH.row();</div>
-<div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160;        <span class="keyword">const</span> comm::IndexT_MPI rank_dst = indexing_helper.rankRowPartner();</div>
-<div class="line"><a name="l00903"></a><span class="lineno">  903</span>&#160; </div>
-<div class="line"><a name="l00904"></a><span class="lineno">  904</span>&#160;        <span class="keywordflow">if</span> (rank.row() == rank_src) {</div>
-<div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;          <span class="keyword">auto</span> tile_hh = rank.col() == rankHH.col()</div>
-<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;                             ? <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij_g), helper.specHHCompact())</div>
-<div class="line"><a name="l00907"></a><span class="lineno">  907</span>&#160;                             : <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(panel_hh.read(ij_hh_panel), helper.specHHCompact(true));</div>
-<div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;          ex::start_detached(comm::scheduleSend(mpi_chain_col(), rank_dst, 0, std::move(tile_hh)));</div>
-<div class="line"><a name="l00909"></a><span class="lineno">  909</span>&#160;        }</div>
-<div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160;        <span class="keywordflow">else</span> <span class="keywordflow">if</span> (rank.row() == rank_dst) {</div>
-<div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160;          ex::start_detached(comm::scheduleRecv(mpi_chain_col(), rank_src, 0,</div>
-<div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;                                                panel_hh.readwrite(ij_hh_panel)));</div>
-<div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;        }</div>
-<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;      }</div>
-<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160; </div>
-<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;      <span class="comment">// Batched application increases the communication messages and volume,</span></div>
-<div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;      <span class="comment">// therefore we use it only for local applications.</span></div>
-<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160;      <span class="keyword">const</span> SizeType current_group_size = helper.affectsMultipleRanks() ? b : group_size;</div>
-<div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160; </div>
-<div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;      <span class="comment">// COMPUTE V and W from HH and T</span></div>
-<div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;      <span class="keyword">auto</span> tile_hh = (rankHH == rank)</div>
-<div class="line"><a name="l00922"></a><span class="lineno">  922</span>&#160;                         ? <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij_g), helper.specHHCompact())</div>
-<div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;                         : <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(panel_hh.read(ij_hh_panel), helper.specHHCompact(<span class="keyword">true</span>));</div>
-<div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;      <span class="keyword">auto</span> [tile_v_unshared, tile_w_unshared] =</div>
-<div class="line"><a name="l00925"></a><span class="lineno">  925</span>&#160;          helperBackend.computeVW(current_group_size, indexing_helper.wsIndexHH(), helper,</div>
-<div class="line"><a name="l00926"></a><span class="lineno">  926</span>&#160;                                  std::move(tile_hh), mat_v, mat_t, mat_w);</div>
-<div class="line"><a name="l00927"></a><span class="lineno">  927</span>&#160;      <span class="keyword">auto</span> tile_v = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_v_unshared)));</div>
-<div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160;      <span class="keyword">auto</span> tile_w = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_w_unshared)));</div>
-<div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160; </div>
-<div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160;      <span class="comment">// UPDATE E</span></div>
-<div class="line"><a name="l00931"></a><span class="lineno">  931</span>&#160;      <span class="keywordflow">for</span> (SizeType j_e = 0; j_e &lt; ncols_local; ++j_e) {</div>
-<div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160;        <span class="keyword">const</span> SizeType j_e_g = dist_e_rt.template globalTileFromLocalTile&lt;Coord::Col&gt;(j_e);</div>
-<div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;        <span class="keyword">const</span> LocalTileIndex idx_w2(indexing_helper.wsIndexHH().row(), j_e);</div>
-<div class="line"><a name="l00934"></a><span class="lineno">  934</span>&#160; </div>
-<div class="line"><a name="l00935"></a><span class="lineno">  935</span>&#160;        <span class="keyword">const</span> GlobalTileIndex idx_e_top = helper.topIndexE(j_e_g);</div>
-<div class="line"><a name="l00936"></a><span class="lineno">  936</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> nb = mat_e_rt.tileSize(idx_e_top).cols();</div>
-<div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160; </div>
-<div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160;        <span class="comment">// SINGLE ROW UPDATE</span></div>
-<div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160;        <span class="keywordflow">if</span> (!helper.affectsMultipleTiles()) {</div>
-<div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160;          ex::start_detached(ex::when_all(ex::just(current_group_size), tile_v, tile_w,</div>
-<div class="line"><a name="l00941"></a><span class="lineno">  941</span>&#160;                                          <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.readwrite(idx_w2), helper.specW2(nb)),</div>
-<div class="line"><a name="l00942"></a><span class="lineno">  942</span>&#160;                                          mat_e_rt.readwrite(idx_e_top)) |</div>
-<div class="line"><a name="l00943"></a><span class="lineno">  943</span>&#160;                             dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
-<div class="line"><a name="l00944"></a><span class="lineno">  944</span>&#160;                                 <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal),</div>
-<div class="line"><a name="l00945"></a><span class="lineno">  945</span>&#160;                                 ApplyHHToSingleTileRow&lt;B, T&gt;{}));</div>
-<div class="line"><a name="l00946"></a><span class="lineno">  946</span>&#160;        }</div>
-<div class="line"><a name="l00947"></a><span class="lineno">  947</span>&#160;        <span class="comment">// TWO ROWs</span></div>
-<div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160;        <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160;          <span class="keyword">const</span> GlobalTileIndex idx_e_bottom = helper.bottomIndexE(j_e_g);</div>
-<div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160; </div>
-<div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;          <span class="comment">// TWO ROWs (same RANK)</span></div>
-<div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160;          <span class="keywordflow">if</span> (!helper.affectsMultipleRanks()) {</div>
-<div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;            ex::start_detached(</div>
-<div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;                ex::when_all(ex::just(current_group_size), tile_v, tile_w,</div>
-<div class="line"><a name="l00955"></a><span class="lineno">  955</span>&#160;                             <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.readwrite(idx_w2), helper.specW2(nb)),</div>
-<div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;                             mat_e_rt.readwrite(idx_e_top), mat_e_rt.readwrite(idx_e_bottom)) |</div>
-<div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;                dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
-<div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;                    <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal), ApplyHHToDoubleTileRow&lt;B, T&gt;{}));</div>
-<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;          }</div>
-<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;          <span class="comment">// TWO ROWs TWO RANKs UPDATE (MAIN + PARTNER)</span></div>
-<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;          <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">bool</span> is_top_rank = rank.row() == rankHH.row();</div>
-<div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;            <span class="keyword">const</span> comm::IndexT_MPI rank_partner =</div>
-<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;                is_top_rank ? indexing_helper.rankRowPartner() : rankHH.row();</div>
-<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160; </div>
-<div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160;            <span class="keyword">const</span> comm::IndexT_MPI tag = <a class="code" href="types_8h.html#af90e7fd5acadf5987b7199b0bd44deea">to_int</a>(j_e + i_b * ncols_local);</div>
-<div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160; </div>
-<div class="line"><a name="l00968"></a><span class="lineno">  968</span>&#160;            <span class="keyword">const</span> matrix::SubTileSpec spec_vw = helper.specHH(is_top_rank);</div>
-<div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160; </div>
-<div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;            <span class="keyword">const</span> <span class="keyword">auto</span> idx_e = is_top_rank ? idx_e_top : idx_e_bottom;</div>
-<div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;            <span class="keyword">const</span> <span class="keyword">auto</span> sz_e = mat_e_rt.tileSize(idx_e);</div>
-<div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;            <span class="keyword">const</span> matrix::SubTileSpec spec_e{{(is_top_rank ? 1 : 0), 0},</div>
-<div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160;                                             {sz_e.rows() - (is_top_rank ? 1 : 0), sz_e.cols()}};</div>
-<div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160; </div>
-<div class="line"><a name="l00975"></a><span class="lineno">  975</span>&#160;            <span class="keyword">auto</span> subtile_v = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(tile_v, spec_vw);</div>
-<div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;            <span class="keyword">auto</span> subtile_w = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(tile_w, spec_vw);</div>
-<div class="line"><a name="l00977"></a><span class="lineno">  977</span>&#160;            <span class="keyword">auto</span> subtile_e_ro = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_e_rt.read(idx_e), spec_e);</div>
-<div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160; </div>
-<div class="line"><a name="l00979"></a><span class="lineno">  979</span>&#160;            <span class="comment">// W2 = V* . E</span></div>
-<div class="line"><a name="l00980"></a><span class="lineno">  980</span>&#160;            ex::start_detached(</div>
-<div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;                dlaf::internal::whenAllLift(blas::Op::ConjTrans, blas::Op::NoTrans, T(1),</div>
-<div class="line"><a name="l00982"></a><span class="lineno">  982</span>&#160;                                            std::move(subtile_v), std::move(subtile_e_ro), T(0),</div>
-<div class="line"><a name="l00983"></a><span class="lineno">  983</span>&#160;                                            <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2tmp.readwrite(idx_w2), helper.specW2(nb))) |</div>
-<div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;                dlaf::tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal)));</div>
-<div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160; </div>
-<div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160;            <span class="comment">// Compute final W2 by adding the contribution from the partner rank</span></div>
-<div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;            ex::start_detached(  <span class="comment">//</span></div>
-<div class="line"><a name="l00988"></a><span class="lineno">  988</span>&#160;                comm::scheduleAllSumP2P&lt;B&gt;(mpi_col_comm, rank_partner, tag,</div>
-<div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160;                                           <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2tmp.read(idx_w2), helper.specW2(nb)),</div>
-<div class="line"><a name="l00990"></a><span class="lineno">  990</span>&#160;                                           <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.readwrite(idx_w2), helper.specW2(nb))));</div>
-<div class="line"><a name="l00991"></a><span class="lineno">  991</span>&#160; </div>
-<div class="line"><a name="l00992"></a><span class="lineno">  992</span>&#160;            <span class="keyword">auto</span> subtile_e = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_e_rt.readwrite(idx_e), spec_e);</div>
-<div class="line"><a name="l00993"></a><span class="lineno">  993</span>&#160;            <span class="comment">// E -= W . W2</span></div>
-<div class="line"><a name="l00994"></a><span class="lineno">  994</span>&#160;            ex::start_detached(  <span class="comment">//</span></div>
-<div class="line"><a name="l00995"></a><span class="lineno">  995</span>&#160;                dlaf::internal::whenAllLift(blas::Op::NoTrans, blas::Op::NoTrans, T(-1),</div>
-<div class="line"><a name="l00996"></a><span class="lineno">  996</span>&#160;                                            std::move(subtile_w),</div>
-<div class="line"><a name="l00997"></a><span class="lineno">  997</span>&#160;                                            <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.read(idx_w2), helper.specW2(nb)), T(1),</div>
-<div class="line"><a name="l00998"></a><span class="lineno">  998</span>&#160;                                            std::move(subtile_e)) |</div>
-<div class="line"><a name="l00999"></a><span class="lineno">  999</span>&#160;                dlaf::tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal)));</div>
-<div class="line"><a name="l01000"></a><span class="lineno"> 1000</span>&#160;          }</div>
-<div class="line"><a name="l01001"></a><span class="lineno"> 1001</span>&#160;        }</div>
-<div class="line"><a name="l01002"></a><span class="lineno"> 1002</span>&#160;      }</div>
-<div class="line"><a name="l01003"></a><span class="lineno"> 1003</span>&#160; </div>
-<div class="line"><a name="l01004"></a><span class="lineno"> 1004</span>&#160;      mat_t.reset();</div>
-<div class="line"><a name="l01005"></a><span class="lineno"> 1005</span>&#160;      panel_hh.reset();</div>
-<div class="line"><a name="l01006"></a><span class="lineno"> 1006</span>&#160;      mat_v.reset();</div>
-<div class="line"><a name="l01007"></a><span class="lineno"> 1007</span>&#160;      mat_w.reset();</div>
-<div class="line"><a name="l01008"></a><span class="lineno"> 1008</span>&#160;      mat_w2tmp.reset();</div>
-<div class="line"><a name="l01009"></a><span class="lineno"> 1009</span>&#160;      mat_w2.reset();</div>
-<div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160;    }</div>
-<div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;  }</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/policy.h&gt;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/traits.h&gt;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/transform.h&gt;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/when_all_lift.h&gt;</span></div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tune_8h.html">dlaf/tune.h</a>&gt;</span></div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__math_8h.html">dlaf/util_math.h</a>&gt;</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__matrix_8h.html">dlaf/util_matrix.h</a>&gt;</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160; </div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">namespace </span>dlaf::eigensolver::internal {</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160; </div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="keyword">namespace </span>bt_tridiag {</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;matrix::Tile&lt;T, Device::CPU&gt; setupVWellFormed(<span class="keyword">const</span> SizeType b,</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                                              <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_hh,</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                                              matrix::Tile&lt;T, Device::CPU&gt; tile_v) {</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="keyword">using</span> <a class="code" href="util__lapack_8h.html#a2a62e0ec6768b42ae19efff5ea5e4331">lapack::lacpy</a>;</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">using</span> <a class="code" href="util__lapack_8h.html#a653b4d466d700c7d6d3befb51c8ca9d8">lapack::laset</a>;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160; </div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160; </div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">// Note: the size of of tile_hh and tile_v embeds a relevant information about the number of</span></div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="comment">// reflecotrs and their max size. This will be exploited to correctly setup the well formed</span></div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="comment">// tile with reflectors in place as they will be applied.</span></div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> k = tile_v.size().cols();</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160; </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="comment">// copy from compact representation reflector values (the first component set to 1 is not there)</span></div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; k; ++j) {</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> compact_refl_size =</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;        std::min&lt;SizeType&gt;(tile_v.size().rows() - (1 + j), tile_hh.size().rows() - 1);</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160; </div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="comment">// this is needed because of complex last reflector (i.e. just 1 element long)</span></div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordflow">if</span> (compact_refl_size == 0)</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">continue</span>;</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160; </div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    lacpy(blas::Uplo::General, compact_refl_size, 1, tile_hh.ptr({1, j}), tile_hh.ld(),</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;          tile_v.ptr({1 + j, j}), tile_v.ld());</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  }</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160; </div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <span class="comment">// In addition to setting the diagonal to 1 for missing first components, here it zeros out</span></div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="comment">// both the upper and the lower part. Indeed due to the skewed shape, reflectors do not occupy</span></div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="comment">// the full tile height, and V should be fully well-formed because the next triangular</span></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  <span class="comment">// multiplication, i.e. `V . T`, and the gemm `V* . E`, will use V as a general matrix.</span></div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  laset(blas::Uplo::Upper, tile_v.size().rows(), k, T(0), T(1), tile_v.ptr({0, 0}), tile_v.ld());</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160; </div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  <span class="keywordflow">if</span> (tile_v.size().rows() &gt; b)</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    laset(blas::Uplo::Lower, tile_v.size().rows() - b, k - 1, T(0), T(0), tile_v.ptr({b, 0}),</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;          tile_v.ld());</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160; </div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="keywordflow">return</span> tile_v;</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160; </div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keywordtype">void</span> computeTFactor(<span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_taus,</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                    <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_v,</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                    <span class="keyword">const</span> matrix::Tile&lt;T, Device::CPU&gt;&amp; tile_t) {</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <span class="keyword">using namespace </span>lapack;</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160; </div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160; </div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="comment">// taus have to be extracted from the compact form (i.e. first row of the input tile)</span></div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  std::vector&lt;T&gt; taus;</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  taus.resize(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(tile_v.size().cols()));</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <span class="keywordflow">for</span> (SizeType i = 0; i &lt; <a class="code" href="types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9">to_SizeType</a>(taus.size()); ++i)</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    taus[<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(i)] = tile_taus({0, i});</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> n = tile_v.size().rows();</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> k = tile_v.size().cols();</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  larft(Direction::Forward, StoreV::Columnwise, n, k, tile_v.ptr(), tile_v.ld(), taus.data(),</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;        tile_t.ptr(), tile_t.ld());</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;}</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160; </div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;std::tuple&lt;matrix::Tile&lt;T, Device::CPU&gt;, matrix::Tile&lt;T, Device::CPU&gt;&gt; computeVT(</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_hh, <span class="keyword">const</span> SizeType hhr_nb,</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    matrix::Tile&lt;T, Device::CPU&gt; tile_v, matrix::Tile&lt;T, Device::CPU&gt; tile_t) {</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keyword">auto</span> tile_v2 = setupVWellFormed(b, tile_hh, std::move(tile_v));</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile_v2.size().cols(); j += hhr_nb) {</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v2.size().cols() - j);</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="keyword">const</span> SizeType ib = std::min(jb + b - 1, tile_v2.size().rows() - j);</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">auto</span> subtile_t = tile_t.subTileReference({{j, j}, {jb, jb}});</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="keyword">auto</span> subtile_hh = tile_hh.subTileReference({{0, j}, {1, jb}});</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keyword">auto</span> subtile_v = tile_v2.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    computeTFactor(subtile_hh, subtile_v, subtile_t);</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  }</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <span class="keywordflow">return</span> std::make_tuple(std::move(tile_v2), std::move(tile_t));</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160; </div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;std::tuple&lt;matrix::Tile&lt;T, Device::CPU&gt;, matrix::Tile&lt;T, Device::CPU&gt;&gt; computeVW(</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> matrix::Tile&lt;const T, Device::CPU&gt;&amp; tile_hh, <span class="keyword">const</span> SizeType hhr_nb,</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    matrix::Tile&lt;T, Device::CPU&gt; tile_v, matrix::Tile&lt;T, Device::CPU&gt; tile_t,</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    matrix::Tile&lt;T, Device::CPU&gt; tile_w) {</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160; </div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  <span class="keyword">auto</span> [tile_v2, tile_t2] = computeVT(b, tile_hh, hhr_nb, std::move(tile_v), std::move(tile_t));</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160; </div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile_v2.size().cols(); j += hhr_nb) {</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v2.size().cols() - j);</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keyword">const</span> SizeType ib = std::min(jb + b - 1, tile_v2.size().rows() - j);</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keyword">auto</span> subtile_t = tile_t2.subTileReference({{j, j}, {jb, jb}});</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keyword">auto</span> subtile_v = tile_v2.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keyword">auto</span> subtile_w = tile_w.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160; </div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    dlaf::tile::internal::trmm3(Side::Right, Uplo::Upper, Op::NoTrans, Diag::NonUnit, T(1), subtile_t,</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;                                subtile_v, subtile_w);</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  }</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keywordflow">return</span> std::make_tuple(std::move(tile_v2), std::move(tile_w));</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;}</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160; </div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> Tile, <span class="keyword">class</span> CTile&gt;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;std::tuple&lt;CTile, CTile, Tile, Tile&gt; applyHHToSingleTileRowSubtileHelper(  <span class="comment">//</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keyword">const</span> SizeType j, <span class="keyword">const</span> SizeType jb, <span class="keyword">const</span> CTile&amp; tile_v, <span class="keyword">const</span> CTile&amp; tile_w, <span class="keyword">const</span> Tile&amp; tile_w2,</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <span class="keyword">const</span> Tile&amp; tile_e) {</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  DLAF_ASSERT_HEAVY(tile_v.size() == tile_w.size(), tile_v, tile_w);</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  DLAF_ASSERT_HEAVY(tile_e.size().rows() - 1 == tile_v.size().rows(), tile_e, tile_v);</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  DLAF_ASSERT_HEAVY(tile_e.size().cols() == tile_w2.size().cols(), tile_e, tile_w2);</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160; </div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  <span class="keyword">const</span> SizeType ib = tile_v.size().rows() - j;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <span class="keyword">auto</span> subtile_v = tile_v.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <span class="keyword">auto</span> subtile_w = tile_w.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">auto</span> subtile_w2 = tile_w2.subTileReference({{0, 0}, {jb, tile_w2.size().cols()}});</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="keyword">auto</span> subtile_e = tile_e.subTileReference({{j + 1, 0}, tile_e.size() - TileElementSize{j + 1, 0}});</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160; </div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="keywordflow">return</span> {std::move(subtile_v), std::move(subtile_w), std::move(subtile_w2), std::move(subtile_e)};</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;}</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160; </div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">  173</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">ApplyHHToSingleTileRow</a>;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160; </div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html">  176</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">ApplyHHToSingleTileRow</a>&lt;Backend::MC, T&gt; {</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <span class="keywordtype">void</span> operator()(<span class="keyword">const</span> SizeType hhr_nb, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_v,</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_w,</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_w2,</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_e) {</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160; </div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160; </div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;      <span class="keyword">auto</span> [subtile_v, subtile_w, subtile_w2, subtile_e] =</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;          applyHHToSingleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e);</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160; </div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      gemm(Op::ConjTrans, Op::NoTrans, T(1), subtile_v, subtile_e, T(0), subtile_w2);</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;      <span class="comment">// E -= W . W2</span></div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      gemm(Op::NoTrans, Op::NoTrans, T(-1), subtile_w, subtile_w2, T(1), subtile_e);</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    }</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;  }</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;};</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160; </div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html">  201</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">ApplyHHToSingleTileRow</a>&lt;Backend::GPU, T&gt; {</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  <span class="keywordtype">void</span> operator()(cublasHandle_t handle, <span class="keyword">const</span> SizeType hhr_nb,</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_v,</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_w,</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_w2,</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_e) {</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160; </div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160; </div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      <span class="keyword">auto</span> [subtile_v, subtile_w, subtile_w2, subtile_e] =</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;          applyHHToSingleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e);</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160; </div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      gemm(handle, Op::ConjTrans, Op::NoTrans, T(1), subtile_v, subtile_e, T(0), subtile_w2);</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="comment">// E -= W . W2</span></div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      gemm(handle, Op::NoTrans, Op::NoTrans, T(-1), subtile_w, subtile_w2, T(1), subtile_e);</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    }</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  }</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;};</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160; </div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> Tile, <span class="keyword">class</span> CTile&gt;</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;std::tuple&lt;CTile, CTile, CTile, CTile, Tile, Tile, Tile&gt; applyHHToDoubleTileRowSubtileHelper(  <span class="comment">//</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <span class="keyword">const</span> SizeType j, <span class="keyword">const</span> SizeType jb, <span class="keyword">const</span> CTile&amp; tile_v, <span class="keyword">const</span> CTile&amp; tile_w, <span class="keyword">const</span> Tile&amp; tile_w2,</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="keyword">const</span> Tile&amp; tile_e_top, <span class="keyword">const</span> Tile&amp; tile_e_bottom) {</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  DLAF_ASSERT_HEAVY(tile_v.size() == tile_w.size(), tile_v, tile_w);</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;  DLAF_ASSERT_HEAVY(tile_e_top.size().rows() + tile_e_bottom.size().rows() - 1 == tile_v.size().rows(),</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                    tile_e_top, tile_e_bottom, tile_v);</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  DLAF_ASSERT_HEAVY(tile_e_top.size().cols() == tile_w2.size().cols(), tile_e_top, tile_w2);</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  DLAF_ASSERT_HEAVY(tile_e_bottom.size().cols() == tile_w2.size().cols(), tile_e_bottom, tile_w2);</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160; </div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keyword">auto</span> subtile_e_top =</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      tile_e_top.subTileReference({{j + 1, 0}, tile_e_top.size() - <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>{j + 1, 0}});</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;  <span class="keyword">auto</span> subtile_e_bottom = tile_e_bottom.subTileReference(</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      {{0, 0},</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;       TileElementSize{std::min(tile_e_bottom.size().rows(), j + jb), tile_e_bottom.size().cols()}});</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160; </div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  matrix::SubTileSpec spec_top{{j, j}, {subtile_e_top.size().rows(), jb}};</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;  matrix::SubTileSpec spec_bottom{{tile_e_top.size().rows() - 1, j},</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;                                  {subtile_e_bottom.size().rows(), jb}};</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160; </div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  <span class="keyword">auto</span> subtile_v_top = tile_v.subTileReference(spec_top);</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;  <span class="keyword">auto</span> subtile_v_bottom = tile_v.subTileReference(spec_bottom);</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;  <span class="keyword">auto</span> subtile_w_top = tile_w.subTileReference(spec_top);</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <span class="keyword">auto</span> subtile_w_bottom = tile_w.subTileReference(spec_bottom);</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;  <span class="keyword">auto</span> subtile_w2 = tile_w2.subTileReference({{0, 0}, {jb, tile_w2.size().cols()}});</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160; </div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;  <span class="keywordflow">return</span> {std::move(subtile_v_top),    std::move(subtile_v_bottom), std::move(subtile_w_top),</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;          std::move(subtile_w_bottom), std::move(subtile_w2),       std::move(subtile_e_top),</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;          std::move(subtile_e_bottom)};</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;}</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160; </div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00258"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">  258</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">ApplyHHToDoubleTileRow</a>;</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160; </div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00261"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html">  261</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">ApplyHHToDoubleTileRow</a>&lt;Backend::MC, T&gt; {</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  <span class="keywordtype">void</span> operator()(<span class="keyword">const</span> SizeType hhr_nb, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_v,</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_w,</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_w2,</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_e_top,</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::CPU&gt;</a>&amp; tile_e_bottom) {</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160; </div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160; </div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      <span class="keyword">auto</span> [subtile_v_top, subtile_v_bottom, subtile_w_top, subtile_w_bottom, subtile_w2, subtile_e_top,</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;            subtile_e_bottom] =</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;          applyHHToDoubleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e_top, tile_e_bottom);</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160; </div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;      gemm(Op::ConjTrans, Op::NoTrans, T(1), subtile_v_top, subtile_e_top, T(0), subtile_w2);</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      gemm(Op::ConjTrans, Op::NoTrans, T(1), subtile_v_bottom, subtile_e_bottom, T(1), subtile_w2);</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      <span class="comment">// E -= W . W2</span></div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      gemm(Op::NoTrans, Op::NoTrans, T(-1), subtile_w_top, subtile_w2, T(1), subtile_e_top);</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      gemm(Op::NoTrans, Op::NoTrans, T(-1), subtile_w_bottom, subtile_w2, T(1), subtile_e_bottom);</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;    }</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;  }</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;};</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160; </div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html">  290</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">ApplyHHToDoubleTileRow</a>&lt;Backend::GPU, T&gt; {</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;  <span class="keywordtype">void</span> operator()(cublasHandle_t handle, <span class="keyword">const</span> SizeType hhr_nb,</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_v,</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::GPU&gt;</a>&amp; tile_w,</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_w2,</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_e_top,</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_e_bottom) {</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;    <span class="keyword">using</span> tile::internal::gemm;</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160; </div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html">common::internal::SingleThreadedBlasScope</a> single;</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160; </div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;    <span class="keywordflow">for</span> (SizeType j = (util::ceilDiv(tile_v.size().cols(), hhr_nb) - 1) * hhr_nb; j &gt;= 0; j -= hhr_nb) {</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v.size().cols() - j);</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      <span class="keyword">auto</span> [subtile_v_top, subtile_v_bottom, subtile_w_top, subtile_w_bottom, subtile_w2, subtile_e_top,</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;            subtile_e_bottom] =</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;          applyHHToDoubleTileRowSubtileHelper(j, jb, tile_v, tile_w, tile_w2, tile_e_top, tile_e_bottom);</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160; </div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      <span class="comment">// W2 = V* . E</span></div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;      gemm(handle, Op::ConjTrans, Op::NoTrans, T(1), subtile_v_top, subtile_e_top, T(0), subtile_w2);</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      gemm(handle, Op::ConjTrans, Op::NoTrans, T(1), subtile_v_bottom, subtile_e_bottom, T(1),</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;           subtile_w2);</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      <span class="comment">// E -= W . W2</span></div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      gemm(handle, Op::NoTrans, Op::NoTrans, T(-1), subtile_w_top, subtile_w2, T(1), subtile_e_top);</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      gemm(handle, Op::NoTrans, Op::NoTrans, T(-1), subtile_w_bottom, subtile_w2, T(1),</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;           subtile_e_bottom);</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    }</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;  }</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;};</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160; </div>
+<div class="line"><a name="l00321"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">  321</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a> {</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>(<span class="keyword">const</span> SizeType b, <span class="keyword">const</span> SizeType nrefls, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>&amp; dist_hh,</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                   <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>&amp; dist_e, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a> offset)</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      : nrefls_(nrefls), input_spec_{dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a71ad776a93750b9c6d1ebfa2d36e28db">tileElementIndex</a>(offset),</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;                                     {std::min(b, dist_hh.size().rows() - offset.row()),</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;                                      std::min(b, dist_hh.size().cols() - offset.col())}},</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;        index_e_(dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d">globalTileFromGlobalElement</a>&lt;Coord::Row&gt;(offset.row())) {</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;    <span class="comment">// Next logic is about detecting the available application space for reflectors, which once</span></div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <span class="comment">// extracted they expands to a matrix with 2 * b - 1 height.</span></div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    <span class="comment">// There are two main scenarios:</span></div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <span class="comment">// - reflectors involves rows of a single tile;</span></div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;    <span class="comment">// - reflectors involves rows across two different tiles.</span></div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160; </div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    rows_v_ = std::min(2 * b, dist_e.size().rows() - offset.row()) - 1;</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    rows_v_top_ = std::min(rows_v_, b - 1);</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160; </div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    <span class="comment">// In general, keep in mind that the first row of the top tile_e should not be touched.</span></div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="comment">// The structs ApplyHHTo... take care of it.</span></div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="comment">// e.g. b = 4</span></div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <span class="comment">// reflectors   matrix</span></div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    <span class="comment">//              X X X X</span></div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="comment">// 1 0 0 0      X X X X</span></div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="comment">// a 1 0 0      X X X X</span></div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="comment">// a b 1 0      X X X X</span></div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    <span class="comment">//              -------</span></div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;    <span class="comment">// a b c 1      Y Y Y Y</span></div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    <span class="comment">// 0 b c d      Y Y Y Y</span></div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;    <span class="comment">// 0 0 c d      Y Y Y Y</span></div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    <span class="comment">// 0 0 0 d      Y Y Y Y</span></div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    <span class="comment">// From the drawing above, it is possible to see the dashed tile separation between X and Y,</span></div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    <span class="comment">// and how the reflectors on the left are going to be applied. In particular, the first row of</span></div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    <span class="comment">// the upper tile is not affected.</span></div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160; </div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    <span class="comment">// A single tile is involved only if it is the last row tile, so by construction reflectors will be</span></div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    <span class="comment">// applied to a single tile;</span></div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;    across_tiles_ = !(index_e_ == dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516">nrTiles</a>().rows() - 1);</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160; </div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    across_ranks_ = across_tiles_ &amp;&amp; (dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">rankGlobalTile</a>&lt;Coord::Row&gt;(index_e_) !=</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;                                      dist_e.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">rankGlobalTile</a>&lt;Coord::Row&gt;(index_e_ + 1));</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;  }</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160; </div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;  <span class="comment">// Return true if the application of Householder reflectors involves multiple tiles</span></div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;  <span class="keywordtype">bool</span> affectsMultipleTiles() <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;    <span class="keywordflow">return</span> across_tiles_;</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;  }</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160; </div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;  <span class="comment">// Return true if the application of Householder reflectors involves multiple ranks</span></div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;  <span class="keywordtype">bool</span> affectsMultipleRanks() <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;    <span class="keywordflow">return</span> across_ranks_;</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;  }</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160; </div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing Householder reflectors in compact form</span></div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;  <span class="comment">// SubTileSpec returned points to the sub-block in the full tile containing the HH data in compact</span></div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  <span class="comment">// form. If @p reset_origin is true, then the origin component of the SubTileSpec is resetted and</span></div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;  <span class="comment">// it will just describe the size of the sub-block containing the Householder reflectors (useful</span></div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;  <span class="comment">// for panel access which might not have full-tiles).</span></div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specHHCompact(<span class="keyword">const</span> <span class="keywordtype">bool</span> reset_origin = <span class="keyword">false</span>) <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;    <span class="keywordflow">if</span> (reset_origin)</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;      <span class="keywordflow">return</span> {{0, 0}, input_spec_.size};</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;    <span class="keywordflow">return</span> input_spec_;</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;  }</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160; </div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing Householder reflectors in well formed form</span></div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specHH() <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;    <span class="keywordflow">return</span> {{0, 0}, {rows_v_, nrefls_}};</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;  }</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160; </div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing Householder reflectors in well formed form</span></div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;  <span class="comment">// for the distributed case.</span></div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specHH(<span class="keywordtype">bool</span> is_top_rank) <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;    <span class="keywordflow">if</span> (is_top_rank)</div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;      <span class="keywordflow">return</span> {{0, 0}, {rows_v_top_, nrefls_}};</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;    DLAF_ASSERT_MODERATE(affectsMultipleTiles(), affectsMultipleTiles());</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    <span class="keywordflow">return</span> {{rows_v_top_, 0}, {rows_v_ - rows_v_top_, nrefls_}};</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;  }</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160; </div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;  <span class="comment">// Return SubTileSpec to use for accessing T factor</span></div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specT() <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;    <span class="keywordflow">return</span> {{0, 0}, {nrefls_, nrefls_}};</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;  }</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160; </div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> specW2(<span class="keyword">const</span> SizeType cols) <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    <span class="keywordflow">return</span> {{0, 0}, {nrefls_, cols}};</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;  }</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160; </div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> topIndexE(<span class="keyword">const</span> SizeType j) <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;    <span class="keywordflow">return</span> {index_e_, j};</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;  }</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160; </div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> bottomIndexE(<span class="keyword">const</span> SizeType j) <span class="keyword">const</span> noexcept {</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;    DLAF_ASSERT_MODERATE(affectsMultipleTiles(), affectsMultipleTiles());</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;    <span class="keywordflow">return</span> {index_e_ + 1, j};</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;  }</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160; </div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;  SizeType nrefls_;</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;  <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> input_spec_;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;  SizeType index_e_;</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;  SizeType rows_v_;</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;  SizeType rows_v_top_;</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160; </div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;  <span class="keywordtype">bool</span> across_tiles_;</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;  <span class="keywordtype">bool</span> across_ranks_;</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;};</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160; </div>
+<div class="line"><a name="l00445"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">  445</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">DistIndexing</a> {</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">DistIndexing</a>(<span class="keyword">const</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>&amp; helper, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>&amp; dist_hh, <span class="keyword">const</span> SizeType b,</div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;               <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; ij, <span class="keyword">const</span> SizeType&amp; ij_b_row)</div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;      : dist_hh(dist_hh), b(b), mb(dist_hh.blockSize().rows()), helper(helper), ij(ij),</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;        ij_b_row(ij_b_row) {</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;    rank = dist_hh.rankIndex();</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;    rankHH = dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">rankGlobalTile</a>(ij);</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;    n_ws_per_block = <a class="code" href="types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9">to_SizeType</a>(<span class="keyword">static_cast&lt;</span><span class="keywordtype">size_t</span><span class="keyword">&gt;</span>(std::ceil(mb / b / 2.0f)) + 1);</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;  }</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160; </div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;  <a class="code" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rankRowPartner()<span class="keyword"> const </span>{</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;    <span class="keywordflow">return</span> (rankHH.row() + 1) % dist_hh.commGridSize().rows();</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;  }</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160; </div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;  <span class="keywordtype">bool</span> isInvolved()<span class="keyword"> const </span>{</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isSameRow = rank.row() == rankHH.row();</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isPartnerRow = rank.row() == rankRowPartner();</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;    <span class="keywordflow">return</span> isSameRow || (isPartnerRow &amp;&amp; helper.affectsMultipleRanks());</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;  }</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160; </div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> wsIndexHH()<span class="keyword"> const </span>{</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;    <span class="keyword">const</span> SizeType row = [&amp;]() -&gt; SizeType {</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;      <span class="keywordflow">if</span> (rank.row() == rankHH.row()) {</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;        <span class="comment">// Note: index starts at 1 (0 is the extra workspace), moreover max half blocks will run in parallel</span></div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;        <span class="keyword">const</span> SizeType intra_idx = 1 + (ij_b_row % (mb / b)) / 2;</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;        DLAF_ASSERT_HEAVY(intra_idx &lt; n_ws_per_block, intra_idx, n_ws_per_block);</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        <span class="keywordflow">return</span> dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811">localTileFromGlobalTile</a>&lt;Coord::Row&gt;(ij.row()) * n_ws_per_block + intra_idx;</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;      }</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;        DLAF_ASSERT_HEAVY(helper.affectsMultipleRanks() &amp;&amp; (rank.row() == rankRowPartner()),</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                          helper.affectsMultipleRanks(), rank.row(), rankRowPartner());</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;        <span class="keywordflow">return</span> dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>().<a class="code" href="classdlaf_1_1common_1_1_size2_d.html#afe5870841ddc785db5d4c81cc22aeb93">isEmpty</a>()</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;                   ? 0</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;                   : dist_hh.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811">localTileFromGlobalTile</a>&lt;Coord::Row&gt;(ij.row() + 1) * n_ws_per_block;</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;      }</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;    }();</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;    <span class="keywordflow">return</span> {row, 0};</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;  }</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160; </div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;<span class="keyword">protected</span>:</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_hh;</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;  SizeType b;</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;  SizeType mb;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;  SizeType n_ws_per_block;</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160; </div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a> helper;</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160; </div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a> rank;</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a> rankHH;</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160; </div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> ij;</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;  SizeType ij_b_row;</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;};</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160; </div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00500"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">  500</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>;</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160; </div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00503"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html">  503</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>&lt;Backend::MC, Device::CPU, T&gt; {</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;  <span class="keyword">static</span> constexpr Backend B = Backend::MC;</div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;  <span class="keyword">static</span> constexpr Device D = Device::CPU;</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160; </div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>(<span class="keyword">const</span> SizeType b, <span class="keyword">const</span> std::size_t, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>) : b(b) {}</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160; </div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">class</span> SenderHH&gt;</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;  <span class="keyword">auto</span> computeVW(<span class="keyword">const</span> SizeType nb_apply, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> ij, <span class="keyword">const</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>&amp; helper,</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;                 SenderHH&amp;&amp; tile_hh, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_v,</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;                 <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_t, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_w) {</div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160; </div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;    <span class="keywordflow">return</span> dlaf::internal::whenAllLift(b, std::forward&lt;SenderHH&gt;(tile_hh), nb_apply,</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;                                       splitTile(mat_v.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH()),</div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;                                       splitTile(mat_t.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specT()),</div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;                                       splitTile(mat_w.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH())) |</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;           dlaf::internal::transform(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), bt_tridiag::computeVW&lt;T&gt;) |</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;           ex::split_tuple();</div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;  }</div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160; </div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;<span class="keyword">protected</span>:</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;  <span class="keyword">const</span> SizeType b;</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;};</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160; </div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00529"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html">  529</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>&lt;Backend::GPU, Device::GPU, T&gt; {</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;  <span class="keyword">static</span> constexpr Backend B = Backend::GPU;</div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;  <span class="keyword">static</span> constexpr Device D = Device::GPU;</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160; </div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">HHManager</a>(<span class="keyword">const</span> SizeType b, <span class="keyword">const</span> std::size_t n_workspaces, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_t,</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;            <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_w)</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;      : b(b), t_panels_h(n_workspaces, dist_t), w_panels_h(n_workspaces, dist_w) {}</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160; </div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">class</span> SenderHH&gt;</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;  <span class="keyword">auto</span> computeVW(<span class="keyword">const</span> SizeType hhr_nb, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> ij, <span class="keyword">const</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">TileAccessHelper</a>&amp; helper,</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;                 SenderHH&amp;&amp; tile_hh, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_v,</div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;                 <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_t, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, D&gt;</a>&amp; mat_w) {</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160; </div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;    <span class="keyword">auto</span>&amp; mat_v_h = w_panels_h.nextResource();</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;    <span class="keyword">auto</span>&amp; mat_t_h = t_panels_h.nextResource();</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160; </div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;    <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> ij_t = ij;</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;    <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">matrix::SubTileSpec</a> t_spec = helper.specT();</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160; </div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;    <span class="keyword">auto</span> [tile_v_h, tile_t_h] =</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;        dlaf::internal::whenAllLift(b, std::forward&lt;SenderHH&gt;(tile_hh), hhr_nb,</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;                                    splitTile(mat_v_h.readwrite(ij), helper.specHH()),</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;                                    splitTile(mat_t_h.readwrite(ij_t), t_spec)) |</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;        dlaf::internal::transform(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), computeVT&lt;T&gt;) |</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        ex::split_tuple();</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160; </div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    <span class="keyword">auto</span> copyVTandComputeW =</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;        [b = this-&gt;b, hhr_nb](cublasHandle_t handle, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_v_h,</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;                              <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;const T, Device::CPU&gt;</a>&amp; tile_t_h,</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;                              <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_v, <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_t,</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;                              <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">matrix::Tile&lt;T, Device::GPU&gt;</a>&amp; tile_w) {</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;          whip::stream_t stream;</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;          DLAF_GPUBLAS_CHECK_ERROR(cublasGetStream(handle, &amp;stream));</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160; </div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;          matrix::internal::copy(tile_v_h, tile_v, stream);</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;          matrix::internal::copy(tile_t_h, tile_t, stream);</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160; </div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;          <span class="comment">// W = V . T</span></div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;          <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;          <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile_v_h.size().cols(); j += hhr_nb) {</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;            <span class="keyword">const</span> SizeType jb = std::min(hhr_nb, tile_v_h.size().cols() - j);</div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;            <span class="keyword">const</span> SizeType ib = std::min(jb + b - 1, tile_v_h.size().rows() - j);</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;            <span class="keyword">auto</span> subtile_t = tile_t.subTileReference({{j, j}, {jb, jb}});</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;            <span class="keyword">auto</span> subtile_v = tile_v.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;            <span class="keyword">auto</span> subtile_w = tile_w.subTileReference({{j, j}, {ib, jb}});</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160; </div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;            dlaf::tile::internal::trmm3(handle, Side::Right, Uplo::Upper, Op::NoTrans, Diag::NonUnit,</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;                                        T(1), subtile_t, subtile_v, subtile_w);</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;          }</div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160; </div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;          <span class="keywordflow">return</span> std::make_tuple(std::move(tile_v), std::move(tile_w));</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;        };</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160; </div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;    <span class="keywordflow">return</span> ex::when_all(std::move(tile_v_h), std::move(tile_t_h),</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;                        splitTile(mat_v.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH()),</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;                        splitTile(mat_t.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij_t), t_spec),</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;                        splitTile(mat_w.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(ij), helper.specHH())) |</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;           dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;               <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::GPU&gt;</a>(), copyVTandComputeW) |</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;           ex::split_tuple();</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;  }</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160; </div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;<span class="keyword">protected</span>:</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;  <span class="keyword">const</span> SizeType b;</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&gt; t_panels_h;</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&gt; w_panels_h;</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;};</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;}</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160; </div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;<span class="keywordtype">void</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_t2_b.html">BackTransformationT2B&lt;B, D, T&gt;::call</a>(<span class="keyword">const</span> SizeType band_size, Matrix&lt;T, D&gt;&amp; mat_e,</div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;                                          Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160; </div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;  <span class="keyword">using</span> <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin</a>;</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;  <span class="keyword">using</span> <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel</a>;</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;  <span class="keyword">using namespace </span>bt_tridiag;</div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160; </div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;  <span class="keywordflow">if</span> (mat_hh.size().isEmpty() || mat_e.size().isEmpty())</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;    <span class="keywordflow">return</span>;</div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160; </div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;  <span class="comment">// Note: if no householder reflectors are going to be applied (in case of trivial matrix)</span></div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;  <span class="keywordflow">if</span> (mat_hh.size().rows() &lt;= (dlaf::isComplex_v&lt;T&gt; ? 1 : 2))</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;    <span class="keywordflow">return</span>;</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160; </div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;  <span class="keyword">const</span> SizeType b = band_size;</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;  <span class="keyword">const</span> SizeType group_size = getTuneParameters().bt_band_to_tridiag_hh_apply_group_size;</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;  <span class="keyword">const</span> SizeType nsweeps = nrSweeps&lt;T&gt;(mat_hh.size().cols());</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160; </div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> tiles_per_block(mat_e.blockSize().rows() / b, 1);</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;  Matrix&lt;T, D&gt; mat_e_rt = mat_e.retiledSubPipeline(tiles_per_block);</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160; </div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_hh = mat_hh.distribution();</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_e_rt = mat_e_rt.distribution();</div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160; </div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;  <span class="comment">// Note: w_tile_sz can store reflectors as they are actually applied, opposed to how they are</span></div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;  <span class="comment">// stored in compact form.</span></div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;  <span class="comment">// e.g. Given b = 4</span></div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;  <span class="comment">// compact       w_tile_sz</span></div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;  <span class="comment">// 1 1 1 1       1 0 0 0</span></div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;  <span class="comment">// a b c d       a 1 0 0</span></div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;  <span class="comment">// a b c d       a b 1 0</span></div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;  <span class="comment">// a b c d       a b c 1</span></div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;  <span class="comment">//               0 b c d</span></div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;  <span class="comment">//               0 0 c d</span></div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;  <span class="comment">//               0 0 0 d</span></div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a> w_tile_sz(2 * b - 1, b);</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160; </div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;  <span class="keyword">const</span> SizeType dist_w_rows = mat_e_rt.nrTiles().rows() * w_tile_sz.rows();</div>
+<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_w({dist_w_rows, b}, w_tile_sz);</div>
+<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_t({mat_hh.size().rows(), b}, {b, b});</div>
+<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_w2({b, mat_e_rt.size().cols()}, {b, mat_e_rt.blockSize().cols()});</div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160; </div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; t_panels(n_workspaces, dist_t);</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; v_panels(n_workspaces, dist_w);</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; w_panels(n_workspaces, dist_w);</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Row, T, D&gt;&gt; w2_panels(n_workspaces, dist_w2);</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160; </div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;  HHManager&lt;B, D, T&gt; helperBackend(b, n_workspaces, dist_t, dist_w);</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160; </div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;  <span class="comment">// Note: sweep are on diagonals, steps are on verticals</span></div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;  <span class="keyword">const</span> SizeType j_last_sweep = (nsweeps - 1) / b;</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;  <span class="keywordflow">for</span> (SizeType j = j_last_sweep; j &gt;= 0; --j) {</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;    <span class="keyword">auto</span>&amp; mat_t = t_panels.nextResource();</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;    <span class="keyword">auto</span>&amp; mat_v = v_panels.nextResource();</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;    <span class="keyword">auto</span>&amp; mat_w = w_panels.nextResource();</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;    <span class="keyword">auto</span>&amp; mat_w2 = w2_panels.nextResource();</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160; </div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;    <span class="comment">// Note: apply the entire column (steps)</span></div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;    <span class="keyword">const</span> SizeType steps = nrStepsForSweep(j * b, mat_hh.size().cols(), b);</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;    <span class="keywordflow">for</span> (SizeType step = 0; step &lt; steps; ++step) {</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;      <span class="keyword">const</span> SizeType i = j + step;</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160; </div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;      <span class="keyword">const</span> GlobalElementIndex ij_el(i * b, j * b);</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij(dist_hh.localTileIndex(dist_hh.globalTileIndex(ij_el)));</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160; </div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;      <span class="comment">// Note:  reflector with size = 1 must be ignored, except for the last step of the last sweep</span></div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;      <span class="comment">//        with complex type</span></div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;      <span class="keyword">const</span> SizeType nrefls = [&amp;]() {</div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;        <span class="keyword">const</span> <span class="keywordtype">bool</span> allowSize1 = isComplex_v&lt;T&gt; &amp;&amp; j == j_last_sweep &amp;&amp; step == steps - 1;</div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;        <span class="keyword">const</span> GlobalElementSize delta(dist_hh.size().rows() - ij_el.row() - 1,</div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;                                      std::min(b, dist_hh.size().cols() - ij_el.col()));</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;        <span class="keywordflow">return</span> std::min(b, std::min(delta.rows() - (allowSize1 ? 0 : 1), delta.cols()));</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;      }();</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160; </div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;      <span class="keyword">const</span> TileAccessHelper helper(b, nrefls, dist_hh, dist_e_rt, ij_el);</div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160; </div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;      <span class="keywordflow">if</span> (nrefls &lt; b) {</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;        mat_t.setWidth(nrefls);</div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;        mat_v.setWidth(nrefls);</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;        mat_w.setWidth(nrefls);</div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;        mat_w2.setHeight(nrefls);</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;      }</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160; </div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;      <span class="keyword">auto</span> [tile_v_unshared, tile_w_unshared] =</div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;          helperBackend.computeVW(group_size, ij, helper,</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;                                  <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij), helper.specHHCompact()), mat_v, mat_t,</div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;                                  mat_w);</div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;      <span class="keyword">auto</span> tile_v = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_v_unshared)));</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;      <span class="keyword">auto</span> tile_w = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_w_unshared)));</div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160; </div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;      <span class="keywordflow">for</span> (SizeType j_e = 0; j_e &lt; dist_e_rt.nrTiles().cols(); ++j_e) {</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> idx_e = helper.topIndexE(j_e);</div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160; </div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;        <span class="keywordflow">if</span> (!helper.affectsMultipleTiles()) {</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;          ex::start_detached(</div>
+<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;              ex::when_all(ex::just(group_size), tile_v, tile_w,</div>
+<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;                           mat_w2.readwrite(LocalTileIndex(0, j_e)), mat_e_rt.readwrite(idx_e)) |</div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;              dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;                  <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal), ApplyHHToSingleTileRow&lt;B, T&gt;{}));</div>
+<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;        }</div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;        <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;          ex::start_detached(</div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;              ex::when_all(ex::just(group_size), tile_v, tile_w,</div>
+<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;                           mat_w2.readwrite(LocalTileIndex(0, j_e)), mat_e_rt.readwrite(idx_e),</div>
+<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;                           mat_e_rt.readwrite(helper.bottomIndexE(j_e))) |</div>
+<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;              dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
+<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;                  <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal), ApplyHHToDoubleTileRow&lt;B, T&gt;{}));</div>
+<div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;        }</div>
+<div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;      }</div>
+<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160; </div>
+<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;      mat_t.reset();</div>
+<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;      mat_v.reset();</div>
+<div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;      mat_w.reset();</div>
+<div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;      mat_w2.reset();</div>
+<div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;    }</div>
+<div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;  }</div>
+<div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;}</div>
+<div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160; </div>
+<div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;<span class="keywordtype">void</span> BackTransformationT2B&lt;B, D, T&gt;::call(comm::CommunicatorGrid grid, <span class="keyword">const</span> SizeType band_size,</div>
+<div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;                                          Matrix&lt;T, D&gt;&amp; mat_e, Matrix&lt;const T, Device::CPU&gt;&amp; mat_hh) {</div>
+<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160; </div>
+<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;  <span class="keyword">using</span> common::RoundRobin;</div>
+<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;  <span class="keyword">using</span> matrix::Panel;</div>
+<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;  <span class="keyword">using namespace </span>bt_tridiag;</div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160; </div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;  <span class="keywordflow">if</span> (mat_hh.size().isEmpty() || mat_e.size().isEmpty())</div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;    <span class="keywordflow">return</span>;</div>
+<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160; </div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;  <span class="comment">// Note: if no householder reflectors are going to be applied (in case of trivial matrix)</span></div>
+<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;  <span class="keywordflow">if</span> (nrSweeps&lt;T&gt;(mat_hh.size().rows()) == 0)</div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;    <span class="keywordflow">return</span>;</div>
+<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160; </div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;  <span class="keyword">const</span> SizeType b = band_size;</div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;  <span class="keyword">const</span> SizeType mb = mat_hh.blockSize().rows();</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;  <span class="keyword">const</span> SizeType group_size = getTuneParameters().bt_band_to_tridiag_hh_apply_group_size;</div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160; </div>
+<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;  <span class="keyword">const</span> LocalTileSize tiles_per_block(mat_e.blockSize().rows() / b, 1);</div>
+<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;  Matrix&lt;T, D&gt; mat_e_rt = mat_e.retiledSubPipeline(tiles_per_block);</div>
+<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160; </div>
+<div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_hh = mat_hh.distribution();</div>
+<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist_e_rt = mat_e_rt.distribution();</div>
+<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160; </div>
+<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;  <span class="comment">// Note: w_tile_sz can store reflectors as they are actually applied, opposed to how they are</span></div>
+<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;  <span class="comment">// stored in compact form.</span></div>
+<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;  <span class="comment">// e.g. Given b = 4</span></div>
+<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;  <span class="comment">// compact       w_tile_sz</span></div>
+<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;  <span class="comment">// 1 1 1 1       1 0 0 0</span></div>
+<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;  <span class="comment">// a b c d       a 1 0 0</span></div>
+<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;  <span class="comment">// a b c d       a b 1 0</span></div>
+<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;  <span class="comment">// a b c d       a b c 1</span></div>
+<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;  <span class="comment">//               0 b c d</span></div>
+<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;  <span class="comment">//               0 0 c d</span></div>
+<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;  <span class="comment">//               0 0 0 d</span></div>
+<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;  <span class="keyword">const</span> TileElementSize w_tile_sz(2 * b - 1, b);</div>
+<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160; </div>
+<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;  <span class="keyword">const</span> SizeType nlocal_ws =</div>
+<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;      std::max&lt;SizeType&gt;(1, dist_hh.localNrTiles().rows() * (util::ceilDiv&lt;SizeType&gt;(mb / b, 2) + 1));</div>
+<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_ws_hh({nlocal_ws * b, b}, {b, b});</div>
+<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_ws_v({nlocal_ws * w_tile_sz.rows(), w_tile_sz.cols()}, w_tile_sz);</div>
+<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;  <span class="keyword">const</span> matrix::Distribution dist_ws_w2({nlocal_ws * b, mat_e_rt.size().cols()},</div>
+<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;                                        {b, mat_e_rt.blockSize().cols()});</div>
+<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160; </div>
+<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
+<div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160; </div>
+<div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; t_panels(n_workspaces, dist_ws_hh);</div>
+<div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, Device::CPU&gt;&gt; hh_panels(n_workspaces, dist_ws_hh);</div>
+<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160; </div>
+<div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; v_panels(n_workspaces, dist_ws_v);</div>
+<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;&gt; w_panels(n_workspaces, dist_ws_v);</div>
+<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160; </div>
+<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Row, T, D&gt;&gt; w2_panels(n_workspaces, dist_ws_w2);</div>
+<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;  RoundRobin&lt;Panel&lt;Coord::Row, T, D&gt;&gt; w2tmp_panels(n_workspaces, dist_ws_w2);</div>
+<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160; </div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;  HHManager&lt;B, D, T&gt; helperBackend(b, n_workspaces, dist_ws_hh, dist_ws_v);</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160; </div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;  <span class="comment">// Note: This distributed algorithm encompass two communication categories:</span></div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;  <span class="comment">// 1. exchange of HH: broadcast + send p2p</span></div>
+<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;  <span class="comment">// 2. reduction for computing W2: all reduce p2p</span></div>
+<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;  <span class="comment">// P2P communication can happen out of order since they can be matched via tags, but this is not</span></div>
+<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;  <span class="comment">// possible for collective operations such as the broadcast.</span></div>
+<div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;  <span class="comment">// For this reason, communications of the phase 1 will be ordered with a pipeline. Instead, for the</span></div>
+<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;  <span class="comment">// second part, with the aim to not over constrain execution of the update, no order will be</span></div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;  <span class="comment">// enforced by relying solely on tags.</span></div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_chain_row(grid.rowCommunicator().clone());</div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_chain_col(grid.colCommunicator().clone());</div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> mpi_col_comm = ex::just(grid.colCommunicator().clone());</div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160; </div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;  <span class="keyword">const</span> SizeType idx_last_sweep_b = (nrSweeps&lt;T&gt;(mat_hh.size().cols()) - 1) / b;</div>
+<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;  <span class="keyword">const</span> SizeType maxsteps_b = nrStepsForSweep(0, mat_hh.size().rows(), b);</div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160; </div>
+<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;  <span class="comment">// Note: Next two nested `for`s describe a special order loop over the matrix, which allow to</span></div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;  <span class="comment">// better schedule communications considering the structure of the algorithm.</span></div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;  <span class="comment">// Each element depends on:</span></div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;  <span class="comment">// - top</span></div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;  <span class="comment">// - bottom-right</span></div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;  <span class="comment">// - right</span></div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;  <span class="comment">// This basic rule for dependencies can be described collectively as a mechanism where elements are</span></div>
+<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;  <span class="comment">// &quot;unlocked&quot; in different epochs, which forms a pattern like if the matrix get scanned not</span></div>
+<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;  <span class="comment">// perpendicularly to their main axis, but instead it gets scanned by a slightly skewed line that goes</span></div>
+<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;  <span class="comment">// from top right to bottom left.</span></div>
+<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;  <span class="comment">//  5 x x x x</span></div>
+<div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;  <span class="comment">//  6 4 x x x</span></div>
+<div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;  <span class="comment">//  7 5 3 x x</span></div>
+<div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;  <span class="comment">//  8 6 4 2 x</span></div>
+<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;  <span class="comment">//  9 7 5 3 1</span></div>
+<div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;  <span class="comment">// Elements of the same epoch are somehow &quot;independent&quot; and so they can potentially run in parallel,</span></div>
+<div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;  <span class="comment">// given that previous epoch has been completed. Since scheduling happens sequentially, elements</span></div>
+<div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;  <span class="comment">// of the same epoch will be ordered starting from top-most one, resulting in</span></div>
+<div class="line"><a name="l00826"></a><span class="lineno">  826</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160;  <span class="comment">//  7  x x x x</span></div>
+<div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;  <span class="comment">// 10  5 x x x</span></div>
+<div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;  <span class="comment">// 12  8 3 x x</span></div>
+<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;  <span class="comment">// 14 11 6 2 x</span></div>
+<div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;  <span class="comment">// 15 13 9 4 1</span></div>
+<div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;  <span class="keywordflow">for</span> (SizeType k = idx_last_sweep_b; k &gt; -maxsteps_b; --k) {</div>
+<div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;    <span class="keyword">auto</span>&amp; mat_t = t_panels.nextResource();</div>
+<div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;    <span class="keyword">auto</span>&amp; panel_hh = hh_panels.nextResource();</div>
+<div class="line"><a name="l00835"></a><span class="lineno">  835</span>&#160;    <span class="keyword">auto</span>&amp; mat_v = v_panels.nextResource();</div>
+<div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160;    <span class="keyword">auto</span>&amp; mat_w = w_panels.nextResource();</div>
+<div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;    <span class="keyword">auto</span>&amp; mat_w2 = w2_panels.nextResource();</div>
+<div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;    <span class="keyword">auto</span>&amp; mat_w2tmp = w2tmp_panels.nextResource();</div>
+<div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160; </div>
+<div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;    <span class="keywordflow">for</span> (SizeType i_b = std::abs&lt;SizeType&gt;(k), j_b = std::max&lt;SizeType&gt;(0, k);</div>
+<div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;         i_b &lt; j_b + nrStepsForSweep(j_b * b, mat_hh.size().cols(), b); i_b += 2, ++j_b) {</div>
+<div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;      <span class="keyword">const</span> SizeType step_b = i_b - j_b;</div>
+<div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;      <span class="keyword">const</span> GlobalElementIndex ij_el(i_b * b, j_b * b);</div>
+<div class="line"><a name="l00844"></a><span class="lineno">  844</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij_g(dist_hh.globalTileIndex(ij_el));</div>
+<div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160; </div>
+<div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;      <span class="keyword">const</span> comm::Index2D rank = dist_hh.rankIndex();</div>
+<div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160;      <span class="keyword">const</span> comm::Index2D rankHH = dist_hh.rankGlobalTile(ij_g);</div>
+<div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160; </div>
+<div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;      <span class="comment">// Note:  reflector with size = 1 must be ignored, except for the last step of the last sweep</span></div>
+<div class="line"><a name="l00850"></a><span class="lineno">  850</span>&#160;      <span class="comment">//        with complex type</span></div>
+<div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;      <span class="keyword">const</span> SizeType nrefls = [&amp;]() {</div>
+<div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;        <span class="keyword">const</span> <span class="keywordtype">bool</span> allowSize1 = isComplex_v&lt;T&gt; &amp;&amp; j_b == idx_last_sweep_b &amp;&amp;</div>
+<div class="line"><a name="l00853"></a><span class="lineno">  853</span>&#160;                                step_b == nrStepsForSweep(j_b * b, mat_hh.size().cols(), b) - 1;</div>
+<div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;        <span class="keyword">const</span> GlobalElementSize delta(dist_hh.size().rows() - ij_el.row() - 1,</div>
+<div class="line"><a name="l00855"></a><span class="lineno">  855</span>&#160;                                      std::min(b, dist_hh.size().cols() - ij_el.col()));</div>
+<div class="line"><a name="l00856"></a><span class="lineno">  856</span>&#160;        <span class="keywordflow">return</span> std::min(b, std::min(delta.rows() - (allowSize1 ? 0 : 1), delta.cols()));</div>
+<div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;      }();</div>
+<div class="line"><a name="l00858"></a><span class="lineno">  858</span>&#160; </div>
+<div class="line"><a name="l00859"></a><span class="lineno">  859</span>&#160;      <span class="keyword">const</span> TileAccessHelper helper(b, nrefls, dist_hh, dist_e_rt, ij_el);</div>
+<div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160;      <span class="keyword">const</span> DistIndexing indexing_helper(helper, dist_hh, b, ij_g, i_b);</div>
+<div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160; </div>
+<div class="line"><a name="l00862"></a><span class="lineno">  862</span>&#160;      <span class="keywordflow">if</span> (!indexing_helper.isInvolved())</div>
+<div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;        <span class="keywordflow">continue</span>;</div>
+<div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160; </div>
+<div class="line"><a name="l00865"></a><span class="lineno">  865</span>&#160;      <span class="keywordflow">if</span> (nrefls &lt; b) {</div>
+<div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;        mat_t.setWidth(nrefls);</div>
+<div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160;        mat_v.setWidth(nrefls);</div>
+<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;        mat_w.setWidth(nrefls);</div>
+<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;        mat_w2.setHeight(nrefls);</div>
+<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;        mat_w2tmp.setHeight(nrefls);</div>
+<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;      }</div>
+<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160; </div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;      <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;      <span class="comment">// From HH it is possible to extract V that is needed for computing W and W2, both required</span></div>
+<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;      <span class="comment">// for updating E.</span></div>
+<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160; </div>
+<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;      <span class="comment">// Send HH to all involved ranks: broadcast on row + send p2p on col</span></div>
+<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_hh_panel = indexing_helper.wsIndexHH();</div>
+<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160; </div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;      <span class="comment">// Broadcast on ROW</span></div>
+<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;      <span class="keywordflow">if</span> (grid.size().cols() &gt; 1 &amp;&amp; rank.row() == rankHH.row()) {</div>
+<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;        <span class="keywordflow">if</span> (rank.col() == rankHH.col()) {</div>
+<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;          ex::start_detached(comm::scheduleSendBcast(</div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;              mpi_chain_row(), <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij_g), helper.specHHCompact())));</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;        }</div>
+<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;        <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;          ex::start_detached(comm::scheduleRecvBcast(mpi_chain_row(), rankHH.col(),</div>
+<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;                                                     <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(panel_hh.readwrite(ij_hh_panel),</div>
+<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;                                                               helper.specHHCompact(<span class="keyword">true</span>))));</div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;        }</div>
+<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;      }</div>
+<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160; </div>
+<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;      <span class="comment">// Jump to the next loop iteration if the local part of E is not affected by the update.</span></div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;      <span class="keyword">const</span> SizeType ncols_local = dist_e_rt.localNrTiles().cols();</div>
+<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;      <span class="keywordflow">if</span> (ncols_local == 0)</div>
+<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;        <span class="keywordflow">continue</span>;</div>
+<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160; </div>
+<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;      <span class="comment">// Send P2P on col</span></div>
+<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;      <span class="keywordflow">if</span> (helper.affectsMultipleRanks()) {</div>
+<div class="line"><a name="l00900"></a><span class="lineno">  900</span>&#160;        <span class="keyword">const</span> comm::IndexT_MPI rank_src = rankHH.row();</div>
+<div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160;        <span class="keyword">const</span> comm::IndexT_MPI rank_dst = indexing_helper.rankRowPartner();</div>
+<div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160; </div>
+<div class="line"><a name="l00903"></a><span class="lineno">  903</span>&#160;        <span class="keywordflow">if</span> (rank.row() == rank_src) {</div>
+<div class="line"><a name="l00904"></a><span class="lineno">  904</span>&#160;          <span class="keyword">auto</span> tile_hh = rank.col() == rankHH.col()</div>
+<div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;                             ? <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij_g), helper.specHHCompact())</div>
+<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;                             : <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(panel_hh.read(ij_hh_panel), helper.specHHCompact(true));</div>
+<div class="line"><a name="l00907"></a><span class="lineno">  907</span>&#160;          ex::start_detached(comm::scheduleSend(mpi_chain_col(), rank_dst, 0, std::move(tile_hh)));</div>
+<div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;        }</div>
+<div class="line"><a name="l00909"></a><span class="lineno">  909</span>&#160;        <span class="keywordflow">else</span> <span class="keywordflow">if</span> (rank.row() == rank_dst) {</div>
+<div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160;          ex::start_detached(comm::scheduleRecv(mpi_chain_col(), rank_src, 0,</div>
+<div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160;                                                panel_hh.readwrite(ij_hh_panel)));</div>
+<div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;        }</div>
+<div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;      }</div>
+<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160; </div>
+<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160;      <span class="comment">// Batched application increases the communication messages and volume,</span></div>
+<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;      <span class="comment">// therefore we use it only for local applications.</span></div>
+<div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;      <span class="keyword">const</span> SizeType current_group_size = helper.affectsMultipleRanks() ? b : group_size;</div>
+<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160; </div>
+<div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160;      <span class="comment">// COMPUTE V and W from HH and T</span></div>
+<div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;      <span class="keyword">auto</span> tile_hh = (rankHH == rank)</div>
+<div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;                         ? <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_hh.read(ij_g), helper.specHHCompact())</div>
+<div class="line"><a name="l00922"></a><span class="lineno">  922</span>&#160;                         : <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(panel_hh.read(ij_hh_panel), helper.specHHCompact(<span class="keyword">true</span>));</div>
+<div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;      <span class="keyword">auto</span> [tile_v_unshared, tile_w_unshared] =</div>
+<div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;          helperBackend.computeVW(current_group_size, indexing_helper.wsIndexHH(), helper,</div>
+<div class="line"><a name="l00925"></a><span class="lineno">  925</span>&#160;                                  std::move(tile_hh), mat_v, mat_t, mat_w);</div>
+<div class="line"><a name="l00926"></a><span class="lineno">  926</span>&#160;      <span class="keyword">auto</span> tile_v = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_v_unshared)));</div>
+<div class="line"><a name="l00927"></a><span class="lineno">  927</span>&#160;      <span class="keyword">auto</span> tile_w = matrix::shareReadWriteTile(ex::make_unique_any_sender(std::move(tile_w_unshared)));</div>
+<div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160; </div>
+<div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160;      <span class="comment">// UPDATE E</span></div>
+<div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160;      <span class="keywordflow">for</span> (SizeType j_e = 0; j_e &lt; ncols_local; ++j_e) {</div>
+<div class="line"><a name="l00931"></a><span class="lineno">  931</span>&#160;        <span class="keyword">const</span> SizeType j_e_g = dist_e_rt.template globalTileFromLocalTile&lt;Coord::Col&gt;(j_e);</div>
+<div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160;        <span class="keyword">const</span> LocalTileIndex idx_w2(indexing_helper.wsIndexHH().row(), j_e);</div>
+<div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160; </div>
+<div class="line"><a name="l00934"></a><span class="lineno">  934</span>&#160;        <span class="keyword">const</span> GlobalTileIndex idx_e_top = helper.topIndexE(j_e_g);</div>
+<div class="line"><a name="l00935"></a><span class="lineno">  935</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> nb = mat_e_rt.tileSize(idx_e_top).cols();</div>
+<div class="line"><a name="l00936"></a><span class="lineno">  936</span>&#160; </div>
+<div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160;        <span class="comment">// SINGLE ROW UPDATE</span></div>
+<div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160;        <span class="keywordflow">if</span> (!helper.affectsMultipleTiles()) {</div>
+<div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160;          ex::start_detached(ex::when_all(ex::just(current_group_size), tile_v, tile_w,</div>
+<div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160;                                          <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.readwrite(idx_w2), helper.specW2(nb)),</div>
+<div class="line"><a name="l00941"></a><span class="lineno">  941</span>&#160;                                          mat_e_rt.readwrite(idx_e_top)) |</div>
+<div class="line"><a name="l00942"></a><span class="lineno">  942</span>&#160;                             dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
+<div class="line"><a name="l00943"></a><span class="lineno">  943</span>&#160;                                 <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal),</div>
+<div class="line"><a name="l00944"></a><span class="lineno">  944</span>&#160;                                 ApplyHHToSingleTileRow&lt;B, T&gt;{}));</div>
+<div class="line"><a name="l00945"></a><span class="lineno">  945</span>&#160;        }</div>
+<div class="line"><a name="l00946"></a><span class="lineno">  946</span>&#160;        <span class="comment">// TWO ROWs</span></div>
+<div class="line"><a name="l00947"></a><span class="lineno">  947</span>&#160;        <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160;          <span class="keyword">const</span> GlobalTileIndex idx_e_bottom = helper.bottomIndexE(j_e_g);</div>
+<div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160; </div>
+<div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160;          <span class="comment">// TWO ROWs (same RANK)</span></div>
+<div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;          <span class="keywordflow">if</span> (!helper.affectsMultipleRanks()) {</div>
+<div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160;            ex::start_detached(</div>
+<div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;                ex::when_all(ex::just(current_group_size), tile_v, tile_w,</div>
+<div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;                             <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.readwrite(idx_w2), helper.specW2(nb)),</div>
+<div class="line"><a name="l00955"></a><span class="lineno">  955</span>&#160;                             mat_e_rt.readwrite(idx_e_top), mat_e_rt.readwrite(idx_e_bottom)) |</div>
+<div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;                dlaf::internal::transform&lt;dlaf::internal::TransformDispatchType::Blas&gt;(</div>
+<div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;                    <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal), ApplyHHToDoubleTileRow&lt;B, T&gt;{}));</div>
+<div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;          }</div>
+<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;          <span class="comment">// TWO ROWs TWO RANKs UPDATE (MAIN + PARTNER)</span></div>
+<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;          <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">bool</span> is_top_rank = rank.row() == rankHH.row();</div>
+<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;            <span class="keyword">const</span> comm::IndexT_MPI rank_partner =</div>
+<div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;                is_top_rank ? indexing_helper.rankRowPartner() : rankHH.row();</div>
+<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160; </div>
+<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;            <span class="keyword">const</span> comm::IndexT_MPI tag = <a class="code" href="types_8h.html#af90e7fd5acadf5987b7199b0bd44deea">to_int</a>(j_e + i_b * ncols_local);</div>
+<div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160; </div>
+<div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160;            <span class="keyword">const</span> matrix::SubTileSpec spec_vw = helper.specHH(is_top_rank);</div>
+<div class="line"><a name="l00968"></a><span class="lineno">  968</span>&#160; </div>
+<div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160;            <span class="keyword">const</span> <span class="keyword">auto</span> idx_e = is_top_rank ? idx_e_top : idx_e_bottom;</div>
+<div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;            <span class="keyword">const</span> <span class="keyword">auto</span> sz_e = mat_e_rt.tileSize(idx_e);</div>
+<div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;            <span class="keyword">const</span> matrix::SubTileSpec spec_e{{(is_top_rank ? 1 : 0), 0},</div>
+<div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;                                             {sz_e.rows() - (is_top_rank ? 1 : 0), sz_e.cols()}};</div>
+<div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160; </div>
+<div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;            <span class="keyword">auto</span> subtile_v = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(tile_v, spec_vw);</div>
+<div class="line"><a name="l00975"></a><span class="lineno">  975</span>&#160;            <span class="keyword">auto</span> subtile_w = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(tile_w, spec_vw);</div>
+<div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;            <span class="keyword">auto</span> subtile_e_ro = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_e_rt.read(idx_e), spec_e);</div>
+<div class="line"><a name="l00977"></a><span class="lineno">  977</span>&#160; </div>
+<div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;            <span class="comment">// W2 = V* . E</span></div>
+<div class="line"><a name="l00979"></a><span class="lineno">  979</span>&#160;            ex::start_detached(</div>
+<div class="line"><a name="l00980"></a><span class="lineno">  980</span>&#160;                dlaf::internal::whenAllLift(blas::Op::ConjTrans, blas::Op::NoTrans, T(1),</div>
+<div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;                                            std::move(subtile_v), std::move(subtile_e_ro), T(0),</div>
+<div class="line"><a name="l00982"></a><span class="lineno">  982</span>&#160;                                            <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2tmp.readwrite(idx_w2), helper.specW2(nb))) |</div>
+<div class="line"><a name="l00983"></a><span class="lineno">  983</span>&#160;                dlaf::tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal)));</div>
+<div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160; </div>
+<div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160;            <span class="comment">// Compute final W2 by adding the contribution from the partner rank</span></div>
+<div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160;            ex::start_detached(  <span class="comment">//</span></div>
+<div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;                comm::scheduleAllSumP2P&lt;B&gt;(mpi_col_comm, rank_partner, tag,</div>
+<div class="line"><a name="l00988"></a><span class="lineno">  988</span>&#160;                                           <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2tmp.read(idx_w2), helper.specW2(nb)),</div>
+<div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160;                                           <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.readwrite(idx_w2), helper.specW2(nb))));</div>
+<div class="line"><a name="l00990"></a><span class="lineno">  990</span>&#160; </div>
+<div class="line"><a name="l00991"></a><span class="lineno">  991</span>&#160;            <span class="keyword">auto</span> subtile_e = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_e_rt.readwrite(idx_e), spec_e);</div>
+<div class="line"><a name="l00992"></a><span class="lineno">  992</span>&#160;            <span class="comment">// E -= W . W2</span></div>
+<div class="line"><a name="l00993"></a><span class="lineno">  993</span>&#160;            ex::start_detached(  <span class="comment">//</span></div>
+<div class="line"><a name="l00994"></a><span class="lineno">  994</span>&#160;                dlaf::internal::whenAllLift(blas::Op::NoTrans, blas::Op::NoTrans, T(-1),</div>
+<div class="line"><a name="l00995"></a><span class="lineno">  995</span>&#160;                                            std::move(subtile_w),</div>
+<div class="line"><a name="l00996"></a><span class="lineno">  996</span>&#160;                                            <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_w2.read(idx_w2), helper.specW2(nb)), T(1),</div>
+<div class="line"><a name="l00997"></a><span class="lineno">  997</span>&#160;                                            std::move(subtile_e)) |</div>
+<div class="line"><a name="l00998"></a><span class="lineno">  998</span>&#160;                dlaf::tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::normal)));</div>
+<div class="line"><a name="l00999"></a><span class="lineno">  999</span>&#160;          }</div>
+<div class="line"><a name="l01000"></a><span class="lineno"> 1000</span>&#160;        }</div>
+<div class="line"><a name="l01001"></a><span class="lineno"> 1001</span>&#160;      }</div>
+<div class="line"><a name="l01002"></a><span class="lineno"> 1002</span>&#160; </div>
+<div class="line"><a name="l01003"></a><span class="lineno"> 1003</span>&#160;      mat_t.reset();</div>
+<div class="line"><a name="l01004"></a><span class="lineno"> 1004</span>&#160;      panel_hh.reset();</div>
+<div class="line"><a name="l01005"></a><span class="lineno"> 1005</span>&#160;      mat_v.reset();</div>
+<div class="line"><a name="l01006"></a><span class="lineno"> 1006</span>&#160;      mat_w.reset();</div>
+<div class="line"><a name="l01007"></a><span class="lineno"> 1007</span>&#160;      mat_w2tmp.reset();</div>
+<div class="line"><a name="l01008"></a><span class="lineno"> 1008</span>&#160;      mat_w2.reset();</div>
+<div class="line"><a name="l01009"></a><span class="lineno"> 1009</span>&#160;    }</div>
+<div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160;  }</div>
+<div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;}</div>
 <div class="line"><a name="l01012"></a><span class="lineno"> 1012</span>&#160;}</div>
-<div class="line"><a name="l01013"></a><span class="lineno"> 1013</span>&#160;}</div>
 <div class="ttc" id="ablas_2tile_8h_html"><div class="ttname"><a href="blas_2tile_8h.html">tile.h</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_index2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_index2_d.html">dlaf::common::Index2D&lt; SizeType, matrix::GlobalElement_TAG &gt;</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::TileElement_TAG &gt;</a></div></div>
@@ -1083,7 +1082,6 @@
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_acc85a62e6350bcac93a8e442d4603516"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516">dlaf::matrix::Distribution::nrTiles</a></div><div class="ttdeci">const GlobalTileSize &amp; nrTiles() const noexcept</div><div class="ttdoc">Returns the number of tiles of the global matrix (2D size).</div><div class="ttdef"><b>Definition:</b> distribution.h:142</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_ae3f7cda513d213773cb4d8a0ba22b758"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758">dlaf::matrix::Distribution::rankGlobalTile</a></div><div class="ttdeci">comm::Index2D rankGlobalTile(const GlobalTileIndex &amp;global_tile) const noexcept</div><div class="ttdef"><b>Definition:</b> distribution.h:210</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_ae63d662d123b38f1150b553b2cdb259d"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d">dlaf::matrix::Distribution::globalTileFromGlobalElement</a></div><div class="ttdeci">SizeType globalTileFromGlobalElement(SizeType global_element) const noexcept</div><div class="ttdef"><b>Definition:</b> distribution.h:292</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a></div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:36</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile.html">dlaf::matrix::Tile</a></div><div class="ttdef"><b>Definition:</b> tile.h:329</div></div>
 <div class="ttc" id="acommunicator_8h_html"><div class="ttname"><a href="communicator_8h.html">communicator.h</a></div></div>
 <div class="ttc" id="acommunicator_8h_html_a2b48f62607e5e128dff19ceac22093e9"><div class="ttname"><a href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">dlaf::comm::IndexT_MPI</a></div><div class="ttdeci">int IndexT_MPI</div><div class="ttdoc">Type used for indexes in MPI API.</div><div class="ttdef"><b>Definition:</b> communicator.h:23</div></div>
@@ -1101,16 +1099,15 @@
 <div class="ttc" id="apanel_8h_html"><div class="ttname"><a href="panel_8h.html">panel.h</a></div></div>
 <div class="ttc" id="apipeline_8h_html"><div class="ttname"><a href="pipeline_8h.html">pipeline.h</a></div></div>
 <div class="ttc" id="arange2d_8h_html"><div class="ttname"><a href="range2d_8h.html">range2d.h</a></div></div>
-<div class="ttc" id="aretiled__matrix_8h_html"><div class="ttname"><a href="retiled__matrix_8h.html">retiled_matrix.h</a></div></div>
 <div class="ttc" id="around__robin_8h_html"><div class="ttname"><a href="round__robin_8h.html">round_robin.h</a></div></div>
 <div class="ttc" id="asingle__threaded__blas_8h_html"><div class="ttname"><a href="single__threaded__blas_8h.html">single_threaded_blas.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1common_1_1_round_robin_html"><div class="ttname"><a href="structdlaf_1_1common_1_1_round_robin.html">dlaf::common::RoundRobin</a></div><div class="ttdef"><b>Definition:</b> round_robin.h:20</div></div>
 <div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_t2_b_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_t2_b.html">dlaf::eigensolver::internal::BackTransformationT2B</a></div><div class="ttdef"><b>Definition:</b> api.h:20</div></div>
-<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">dlaf::eigensolver::internal::bt_tridiag::ApplyHHToDoubleTileRow</a></div><div class="ttdef"><b>Definition:</b> impl.h:259</div></div>
-<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">dlaf::eigensolver::internal::bt_tridiag::ApplyHHToSingleTileRow</a></div><div class="ttdef"><b>Definition:</b> impl.h:174</div></div>
-<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">dlaf::eigensolver::internal::bt_tridiag::DistIndexing</a></div><div class="ttdef"><b>Definition:</b> impl.h:446</div></div>
-<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">dlaf::eigensolver::internal::bt_tridiag::HHManager</a></div><div class="ttdef"><b>Definition:</b> impl.h:501</div></div>
-<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">dlaf::eigensolver::internal::bt_tridiag::TileAccessHelper</a></div><div class="ttdef"><b>Definition:</b> impl.h:322</div></div>
+<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html">dlaf::eigensolver::internal::bt_tridiag::ApplyHHToDoubleTileRow</a></div><div class="ttdef"><b>Definition:</b> impl.h:258</div></div>
+<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html">dlaf::eigensolver::internal::bt_tridiag::ApplyHHToSingleTileRow</a></div><div class="ttdef"><b>Definition:</b> impl.h:173</div></div>
+<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html">dlaf::eigensolver::internal::bt_tridiag::DistIndexing</a></div><div class="ttdef"><b>Definition:</b> impl.h:445</div></div>
+<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html">dlaf::eigensolver::internal::bt_tridiag::HHManager</a></div><div class="ttdef"><b>Definition:</b> impl.h:500</div></div>
+<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html">dlaf::eigensolver::internal::bt_tridiag::TileAccessHelper</a></div><div class="ttdef"><b>Definition:</b> impl.h:321</div></div>
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_panel_html"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_panel.html">dlaf::matrix::Panel</a></div><div class="ttdef"><b>Definition:</b> panel.h:552</div></div>
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_panel_html_aac41b4dfa833e4a24839fe1d470b835a"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">dlaf::matrix::Panel::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(LocalTileIndex index)</div><div class="ttdef"><b>Definition:</b> panel.h:570</div></div>
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_sub_tile_spec_html"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">dlaf::matrix::SubTileSpec</a></div><div class="ttdoc">Contains the information to create a subtile.</div><div class="ttdef"><b>Definition:</b> tile.h:109</div></div>
diff --git a/master/eigensolver_2eigensolver_8h_source.html b/master/eigensolver_2eigensolver_8h_source.html
index d2d4c70104..e97112b26d 100644
--- a/master/eigensolver_2eigensolver_8h_source.html
+++ b/master/eigensolver_2eigensolver_8h_source.html
@@ -106,54 +106,60 @@
 <div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(square_blocksize(eigenvectors), eigenvectors);</div>
 <div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(eigenvectors.size() == mat.size(), eigenvectors, mat);</div>
 <div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(eigenvectors.blockSize() == mat.blockSize(), eigenvectors, mat);</div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160; </div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html">internal::Eigensolver&lt;B, D, T&gt;::call</a>(uplo, mat, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;}</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  DLAF_ASSERT(single_tile_per_block(mat), mat);</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  DLAF_ASSERT(single_tile_per_block(eigenvalues), eigenvalues);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  DLAF_ASSERT(single_tile_per_block(eigenvectors), eigenvectors);</div>
 <div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160; </div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="eigensolver_2eigensolver_8h.html#a94fb08e9087b48ae5fe19b59c9e28db8">   70</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a>(blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat) {</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">const</span> SizeType size = mat.size().rows();</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat.blockSize().rows(), 1));</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, size), mat.blockSize());</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  eigensolver&lt;B, D, T&gt;(uplo, mat, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;}</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160; </div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="eigensolver_2eigensolver_8h.html#a2b99692c7224f63a547cc6686d732490">   96</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat,</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;                 Matrix&lt;BaseType&lt;T&gt;, D&gt;&amp; eigenvalues, Matrix&lt;T, D&gt;&amp; eigenvectors) {</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat, grid), mat);</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  DLAF_ASSERT(square_size(mat), mat);</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  DLAF_ASSERT(square_blocksize(mat), mat);</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  DLAF_ASSERT(matrix::local_matrix(eigenvalues), eigenvalues);</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  DLAF_ASSERT(eigenvalues.size().rows() == eigenvectors.size().rows(), eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  DLAF_ASSERT(eigenvalues.blockSize().rows() == eigenvectors.blockSize().rows(), eigenvalues,</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;              eigenvectors);</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(eigenvectors, grid), eigenvectors);</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  DLAF_ASSERT(square_size(eigenvectors), eigenvectors);</div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  DLAF_ASSERT(square_blocksize(eigenvectors), eigenvectors);</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(eigenvectors.size() == mat.size(), eigenvectors, mat);</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(eigenvectors.blockSize() == mat.blockSize(), eigenvectors, mat);</div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html">internal::Eigensolver&lt;B, D, T&gt;::call</a>(grid, uplo, mat, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;}</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160; </div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="eigensolver_2eigensolver_8h.html#ad43e9ff356aafef70396fdc6b6d3a1f2">  128</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat) {</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="keyword">const</span> SizeType size = mat.size().rows();</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat.blockSize().rows(), 1));</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>(size, size), mat.blockSize(), grid);</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160; </div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  eigensolver&lt;B, D, T&gt;(grid, uplo, mat, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;}</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;}</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html">internal::Eigensolver&lt;B, D, T&gt;::call</a>(uplo, mat, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;}</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160; </div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="eigensolver_2eigensolver_8h.html#a94fb08e9087b48ae5fe19b59c9e28db8">   73</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a>(blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat) {</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="keyword">const</span> SizeType size = mat.size().rows();</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat.blockSize().rows(), 1));</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, size), mat.blockSize());</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160; </div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  eigensolver&lt;B, D, T&gt;(uplo, mat, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;}</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160; </div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="eigensolver_2eigensolver_8h.html#a2b99692c7224f63a547cc6686d732490">   99</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat,</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                 Matrix&lt;BaseType&lt;T&gt;, D&gt;&amp; eigenvalues, Matrix&lt;T, D&gt;&amp; eigenvectors) {</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat, grid), mat);</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  DLAF_ASSERT(square_size(mat), mat);</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  DLAF_ASSERT(square_blocksize(mat), mat);</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  DLAF_ASSERT(matrix::local_matrix(eigenvalues), eigenvalues);</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(eigenvalues.size().rows() == eigenvectors.size().rows(), eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  DLAF_ASSERT(eigenvalues.blockSize().rows() == eigenvectors.blockSize().rows(), eigenvalues,</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;              eigenvectors);</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(eigenvectors, grid), eigenvectors);</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(square_size(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  DLAF_ASSERT(square_blocksize(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  DLAF_ASSERT(eigenvectors.size() == mat.size(), eigenvectors, mat);</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  DLAF_ASSERT(eigenvectors.blockSize() == mat.blockSize(), eigenvectors, mat);</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  DLAF_ASSERT(single_tile_per_block(mat), mat);</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  DLAF_ASSERT(single_tile_per_block(eigenvalues), eigenvalues);</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  DLAF_ASSERT(single_tile_per_block(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160; </div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html">internal::Eigensolver&lt;B, D, T&gt;::call</a>(grid, uplo, mat, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;}</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160; </div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="eigensolver_2eigensolver_8h.html#ad43e9ff356aafef70396fdc6b6d3a1f2">  134</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat) {</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keyword">const</span> SizeType size = mat.size().rows();</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat.blockSize().rows(), 1));</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>(size, size), mat.blockSize(), grid);</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160; </div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  eigensolver&lt;B, D, T&gt;(grid, uplo, mat, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;}</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;</a></div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="aeigensolver_2eigensolver_8h_html_a7aeed252a1783c24f778eb250d0efd72"><div class="ttname"><a href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">dlaf::eigensolver::eigensolver</a></div><div class="ttdeci">void eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)</div><div class="ttdef"><b>Definition:</b> eigensolver.h:39</div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
diff --git a/master/eigensolver_2reduction__to__band_2impl_8h_source.html b/master/eigensolver_2reduction__to__band_2impl_8h_source.html
index fc82107637..e0d7136b66 100644
--- a/master/eigensolver_2reduction__to__band_2impl_8h_source.html
+++ b/master/eigensolver_2reduction__to__band_2impl_8h_source.html
@@ -113,1361 +113,1359 @@
 <div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="index_8h.html">dlaf/matrix/index.h</a>&gt;</span></div>
 <div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_8h.html">dlaf/matrix/matrix.h</a>&gt;</span></div>
 <div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="panel_8h.html">dlaf/matrix/panel.h</a>&gt;</span></div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="retiled__matrix_8h.html">dlaf/matrix/retiled_matrix.h</a>&gt;</span></div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="views_8h.html">dlaf/matrix/views.h</a>&gt;</span></div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="schedulers_8h.html">dlaf/schedulers.h</a>&gt;</span></div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/traits.h&gt;</span></div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__math_8h.html">dlaf/util_math.h</a>&gt;</span></div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__matrix_8h.html">dlaf/util_matrix.h</a>&gt;</span></div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160; </div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="keyword">namespace </span>dlaf::eigensolver::internal {</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment">// Given a vector of vectors, reduce all vectors in the first one using sum operation</span></div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="keywordtype">void</span> reduceColumnVectors(std::vector&lt;common::internal::vector&lt;T&gt;&gt;&amp; columnVectors) {</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keywordflow">for</span> (std::size_t i = 1; i &lt; columnVectors.size(); ++i) {</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    DLAF_ASSERT_HEAVY(columnVectors[0].size() == columnVectors[i].size(), columnVectors[0].size(),</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;                      columnVectors[i].size());</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    <span class="keywordflow">for</span> (SizeType j = 0; j &lt; columnVectors[0].size(); ++j)</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;      columnVectors[0][j] += columnVectors[i][j];</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  }</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;}</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160; </div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<span class="keyword">namespace </span>red2band {</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="comment">// Extract x0 and compute local cumulative sum of squares of the reflector column</span></div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;std::array&lt;T, 2&gt; computeX0AndSquares(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel,</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                                     SizeType j) {</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  std::array&lt;T, 2&gt; x0_and_squares{0, 0};</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="keyword">auto</span> it_begin = panel.begin();</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <span class="keyword">auto</span> it_end = panel.end();</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160; </div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160; </div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keywordflow">if</span> (has_head) {</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    <span class="keyword">auto</span>&amp; tile_v0 = *it_begin++;</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160; </div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <span class="keyword">const</span> TileElementIndex idx_x0(j, j);</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    x0_and_squares[0] = tile_v0(idx_x0);</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160; </div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    T* reflector_ptr = tile_v0.ptr({idx_x0});</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    x0_and_squares[1] =</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        blas::dot(tile_v0.size().rows() - idx_x0.row(), reflector_ptr, 1, reflector_ptr, 1);</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  }</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160; </div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> it = it_begin; it != it_end; ++it) {</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile = *it;</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160; </div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    T* reflector_ptr = tile.ptr({0, j});</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    x0_and_squares[1] += blas::dot(tile.size().rows(), reflector_ptr, 1, reflector_ptr, 1);</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  }</div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="keywordflow">return</span> x0_and_squares;</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;}</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160; </div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;T computeReflectorAndTau(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel,</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                         <span class="keyword">const</span> SizeType j, std::array&lt;T, 2&gt; x0_and_squares) {</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">const</span> T <a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a> = std::sqrt(x0_and_squares[1]);</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <span class="keyword">const</span> T x0 = x0_and_squares[0];</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="keyword">const</span> T y = std::signbit(std::real(x0_and_squares[0])) ? <a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a> : -<a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a>;</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keyword">const</span> T tau = (y - x0) / y;</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160; </div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="keyword">auto</span> it_begin = panel.begin();</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <span class="keyword">auto</span> it_end = panel.end();</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160; </div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160; </div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="keywordflow">if</span> (has_head) {</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile_v0 = *it_begin++;</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160; </div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keyword">const</span> TileElementIndex idx_x0(j, j);</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    tile_v0(idx_x0) = y;</div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160; </div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <span class="keywordflow">if</span> (j + 1 &lt; tile_v0.size().rows()) {</div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      T* v = tile_v0.ptr({j + 1, j});</div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;      blas::scal(tile_v0.size().rows() - (j + 1), T(1) / (x0 - y), v, 1);</div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    }</div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  }</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160; </div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> it = it_begin; it != it_end; ++it) {</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">auto</span>&amp; tile_v = *it;</div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    T* v = tile_v.ptr({0, j});</div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    blas::scal(tile_v.size().rows(), T(1) / (x0 - y), v, 1);</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  }</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160; </div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <span class="keywordflow">return</span> tau;</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160; </div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keywordtype">void</span> computeWTrailingPanel(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel,</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;                           common::internal::vector&lt;T&gt;&amp; w, SizeType j, <span class="keyword">const</span> SizeType pt_cols,</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;                           <span class="keyword">const</span> std::size_t begin, <span class="keyword">const</span> std::size_t end) {</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="comment">// for each tile in the panel, consider just the trailing panel</span></div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="comment">// i.e. all rows (height = reflector), just columns to the right of the current reflector</span></div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="keywordflow">if</span> (!(pt_cols &gt; 0))</div>
-<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <span class="keywordflow">return</span>;</div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160; </div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <span class="keyword">const</span> TileElementIndex index_el_x0(j, j);</div>
-<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <span class="keywordtype">bool</span> has_first_component = has_head;</div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160; </div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160; </div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <span class="comment">// W = Pt* . V</span></div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> index = begin; index &lt; end; ++index) {</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="keyword">const</span> matrix::Tile&lt;const T, D&gt;&amp; tile_a = panel[index];</div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="keyword">const</span> SizeType first_element = has_first_component ? index_el_x0.row() : 0;</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160; </div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    TileElementIndex pt_start{first_element, index_el_x0.col() + 1};</div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    TileElementSize pt_size{tile_a.size().rows() - pt_start.row(), pt_cols};</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    TileElementIndex v_start{first_element, index_el_x0.col()};</div>
-<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160; </div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="keywordflow">if</span> (has_first_component) {</div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="keyword">const</span> TileElementSize offset{1, 0};</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160; </div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <span class="keyword">const</span> T fake_v = 1;</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      blas::gemv(blas::Layout::ColMajor, blas::Op::ConjTrans, offset.rows(), pt_size.cols(), T(1),</div>
-<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;                 tile_a.ptr(pt_start), tile_a.ld(), &amp;fake_v, 1, T(0), w.data(), 1);</div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160; </div>
-<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      pt_start = pt_start + offset;</div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      v_start = v_start + offset;</div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      pt_size = pt_size - offset;</div>
-<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160; </div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      has_first_component = <span class="keyword">false</span>;</div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    }</div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160; </div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <span class="keywordflow">if</span> (pt_start.isIn(tile_a.size())) {</div>
-<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      <span class="comment">// W += 1 . A* . V</span></div>
-<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;      blas::gemv(blas::Layout::ColMajor, blas::Op::ConjTrans, pt_size.rows(), pt_size.cols(), T(1),</div>
-<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;                 tile_a.ptr(pt_start), tile_a.ld(), tile_a.ptr(v_start), 1, T(1), w.data(), 1);</div>
-<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    }</div>
-<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  }</div>
-<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;}</div>
-<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160; </div>
-<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="keywordtype">void</span> updateTrailingPanel(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel, SizeType j,</div>
-<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                         <span class="keyword">const</span> std::vector&lt;T&gt;&amp; w, <span class="keyword">const</span> T tau, <span class="keyword">const</span> std::size_t begin,</div>
-<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;                         <span class="keyword">const</span> std::size_t end) {</div>
-<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  <span class="keyword">const</span> TileElementIndex index_el_x0(j, j);</div>
-<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160; </div>
-<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  <span class="keywordtype">bool</span> has_first_component = has_head;</div>
-<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160; </div>
-<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
-<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160; </div>
-<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  <span class="comment">// GER Pt = Pt - tau . v . w*</span></div>
-<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> index = begin; index &lt; end; ++index) {</div>
-<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keyword">const</span> matrix::Tile&lt;T, D&gt;&amp; tile_a = panel[index];</div>
-<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="keyword">const</span> SizeType first_element = has_first_component ? index_el_x0.row() : 0;</div>
-<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160; </div>
-<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    TileElementIndex pt_start{first_element, index_el_x0.col() + 1};</div>
-<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    TileElementSize pt_size{tile_a.size().rows() - pt_start.row(),</div>
-<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;                            tile_a.size().cols() - pt_start.col()};</div>
-<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    TileElementIndex v_start{first_element, index_el_x0.col()};</div>
-<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160; </div>
-<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <span class="keywordflow">if</span> (has_first_component) {</div>
-<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <span class="keyword">const</span> TileElementSize offset{1, 0};</div>
-<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160; </div>
-<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      <span class="comment">// Pt = Pt - tau * v[0] * w*</span></div>
-<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      <span class="keyword">const</span> T fake_v = 1;</div>
-<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      blas::ger(blas::Layout::ColMajor, 1, pt_size.cols(), -dlaf::conj(tau), &amp;fake_v, 1, w.data(), 1,</div>
-<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;                tile_a.ptr(pt_start), tile_a.ld());</div>
-<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160; </div>
-<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      pt_start = pt_start + offset;</div>
-<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      v_start = v_start + offset;</div>
-<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      pt_size = pt_size - offset;</div>
-<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160; </div>
-<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      has_first_component = <span class="keyword">false</span>;</div>
-<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    }</div>
-<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160; </div>
-<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">if</span> (pt_start.isIn(tile_a.size())) {</div>
-<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      <span class="comment">// Pt = Pt - tau * v * w*</span></div>
-<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      blas::ger(blas::Layout::ColMajor, pt_size.rows(), pt_size.cols(), -dlaf::conj(tau),</div>
-<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;                tile_a.ptr(v_start), 1, w.data(), 1, tile_a.ptr(pt_start), tile_a.ld());</div>
-<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    }</div>
-<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  }</div>
-<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;}</div>
-<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160; </div>
-<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> ASender, <span class="keyword">typename</span> WSender, <span class="keyword">typename</span> XSender&gt;</div>
-<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;<span class="keywordtype">void</span> hemmDiag(pika::execution::thread_priority priority, ASender&amp;&amp; tile_a, WSender&amp;&amp; tile_w,</div>
-<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;              XSender&amp;&amp; tile_x) {</div>
-<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;ASender&gt;;</div>
-<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;  pika::execution::experimental::start_detached(</div>
-<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      dlaf::internal::whenAllLift(blas::Side::Left, blas::Uplo::Lower, T(1),</div>
-<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;                                  std::forward&lt;ASender&gt;(tile_a), std::forward&lt;WSender&gt;(tile_w), T(1),</div>
-<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;                                  std::forward&lt;XSender&gt;(tile_x)) |</div>
-<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      tile::hemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
-<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;}</div>
-<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160; </div>
-<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;<span class="comment">// X += op(A) * W</span></div>
-<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> ASender, <span class="keyword">typename</span> WSender, <span class="keyword">typename</span> XSender&gt;</div>
-<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;<span class="keywordtype">void</span> hemmOffDiag(pika::execution::thread_priority priority, blas::Op op, ASender&amp;&amp; tile_a,</div>
-<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;                 WSender&amp;&amp; tile_w, XSender&amp;&amp; tile_x) {</div>
-<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;ASender&gt;;</div>
-<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;  pika::execution::experimental::start_detached(</div>
-<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      dlaf::internal::whenAllLift(op, blas::Op::NoTrans, T(1), std::forward&lt;ASender&gt;(tile_a),</div>
-<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;                                  std::forward&lt;WSender&gt;(tile_w), T(1), std::forward&lt;XSender&gt;(tile_x)) |</div>
-<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
-<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;}</div>
-<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160; </div>
-<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> VSender, <span class="keyword">typename</span> XSender, <span class="keyword">typename</span> ASender&gt;</div>
-<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;<span class="keywordtype">void</span> her2kDiag(pika::execution::thread_priority priority, VSender&amp;&amp; tile_v, XSender&amp;&amp; tile_x,</div>
-<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;               ASender&amp;&amp; tile_a) {</div>
-<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;VSender&gt;;</div>
-<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;  pika::execution::experimental::start_detached(</div>
-<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      dlaf::internal::whenAllLift(blas::Uplo::Lower, blas::Op::NoTrans, T(-1),</div>
-<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;                                  std::forward&lt;VSender&gt;(tile_v), std::forward&lt;XSender&gt;(tile_x),</div>
-<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;                                  BaseType&lt;T&gt;(1), std::forward&lt;ASender&gt;(tile_a)) |</div>
-<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      tile::her2k(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
-<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;}</div>
-<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160; </div>
-<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="comment">// C -= A . B*</span></div>
-<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> ASender, <span class="keyword">typename</span> BSender, <span class="keyword">typename</span> CSender&gt;</div>
-<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;<span class="keywordtype">void</span> her2kOffDiag(pika::execution::thread_priority priority, ASender&amp;&amp; tile_a, BSender&amp;&amp; tile_b,</div>
-<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;                  CSender&amp;&amp; tile_c) {</div>
-<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;ASender&gt;;</div>
-<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;  pika::execution::experimental::start_detached(</div>
-<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      dlaf::internal::whenAllLift(blas::Op::NoTrans, blas::Op::ConjTrans, T(-1),</div>
-<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;                                  std::forward&lt;ASender&gt;(tile_a), std::forward&lt;BSender&gt;(tile_b), T(1),</div>
-<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;                                  std::forward&lt;CSender&gt;(tile_c)) |</div>
-<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;      tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
-<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;}</div>
-<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160; </div>
-<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;<span class="keyword">namespace </span>local {</div>
-<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160; </div>
-<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;T computeReflector(<span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel, SizeType j) {</div>
-<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;  constexpr <span class="keywordtype">bool</span> has_head = <span class="keyword">true</span>;</div>
-<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160; </div>
-<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;  std::array&lt;T, 2&gt; x0_and_squares = computeX0AndSquares(has_head, panel, j);</div>
-<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160; </div>
-<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;  <span class="keyword">auto</span> tau = computeReflectorAndTau(has_head, panel, j, std::move(x0_and_squares));</div>
-<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160; </div>
-<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;  <span class="keywordflow">return</span> tau;</div>
-<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;}</div>
-<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160; </div>
-<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLikeA, <span class="keyword">class</span> MatrixLikeTaus&gt;</div>
-<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;<span class="keywordtype">void</span> computePanelReflectors(MatrixLikeA&amp; mat_a, MatrixLikeTaus&amp; mat_taus, <span class="keyword">const</span> SizeType j_sub,</div>
-<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;                            <span class="keyword">const</span> matrix::SubPanelView&amp; panel_view) {</div>
-<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;  <span class="keyword">static</span> Device constexpr D = MatrixLikeA::device;</div>
-<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;  <span class="keyword">using</span> T = <span class="keyword">typename</span> MatrixLikeA::ElementType;</div>
-<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;  <span class="keyword">namespace </span>di = dlaf::internal;</div>
-<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160; </div>
-<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;  std::vector&lt;matrix::ReadWriteTileSender&lt;T, D&gt;&gt; panel_tiles;</div>
-<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;  panel_tiles.reserve(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(std::distance(panel_view.iteratorLocal().begin(),</div>
-<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;                                             panel_view.iteratorLocal().end())));</div>
-<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.iteratorLocal()) {</div>
-<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    <span class="keyword">const</span> matrix::SubTileSpec&amp; spec = panel_view(i);</div>
-<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    panel_tiles.emplace_back(matrix::splitTile(mat_a.readwrite(i), spec));</div>
-<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  }</div>
-<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160; </div>
-<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;  <span class="keyword">const</span> std::size_t nthreads = getReductionToBandPanelNWorkers();</div>
-<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;  <span class="keyword">auto</span> s =</div>
-<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      ex::when_all(ex::just(std::make_unique&lt;pika::barrier&lt;&gt;&gt;(nthreads),</div>
-<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                            std::vector&lt;common::internal::vector&lt;T&gt;&gt;{}),  <span class="comment">// w (internally required)</span></div>
-<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                   mat_taus.readwrite(LocalTileIndex(j_sub, 0)),</div>
-<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;                   ex::when_all_vector(std::move(panel_tiles))) |</div>
-<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      ex::transfer(di::getBackendScheduler&lt;Backend::MC&gt;(pika::execution::thread_priority::high)) |</div>
-<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      ex::bulk(nthreads, [nthreads, cols = panel_view.cols()](<span class="keyword">const</span> std::size_t index, <span class="keyword">auto</span>&amp; barrier_ptr,</div>
-<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;                                                              <span class="keyword">auto</span>&amp; w, <span class="keyword">auto</span>&amp; taus, <span class="keyword">auto</span>&amp; tiles) {</div>
-<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;        const auto barrier_busy_wait = getReductionToBandBarrierBusyWait();</div>
-<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        const std::size_t batch_size = util::ceilDiv(tiles.size(), nthreads);</div>
-<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;        const std::size_t begin = index * batch_size;</div>
-<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        const std::size_t end = std::min(index * batch_size + batch_size, tiles.size());</div>
-<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;        const SizeType nrefls = taus.size().rows();</div>
-<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160; </div>
-<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        if (index == 0) {</div>
-<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;          w.resize(nthreads);</div>
-<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;        }</div>
-<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160; </div>
-<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;        for (SizeType j = 0; j &lt; nrefls; ++j) {</div>
-<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;          <span class="comment">// STEP1: compute tau and reflector (single-thread)</span></div>
-<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;          <span class="keywordflow">if</span> (index == 0) {</div>
-<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;            taus({j, 0}) = computeReflector(tiles, j);</div>
-<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;          }</div>
-<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160; </div>
-<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160; </div>
-<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;          <span class="comment">// STEP2a: compute w (multi-threaded)</span></div>
-<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;          <span class="keyword">const</span> SizeType pt_cols = cols - (j + 1);</div>
-<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;          <span class="keywordflow">if</span> (pt_cols == 0)</div>
-<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;            <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;          <span class="keyword">const</span> <span class="keywordtype">bool</span> has_head = (index == 0);</div>
-<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160; </div>
-<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;          w[index] = common::internal::vector&lt;T&gt;(pt_cols, 0);</div>
-<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;          computeWTrailingPanel(has_head, tiles, w[index], j, pt_cols, begin, end);</div>
-<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160; </div>
-<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;          <span class="comment">// STEP2b: reduce w results (single-threaded)</span></div>
-<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;          <span class="keywordflow">if</span> (index == 0)</div>
-<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;            dlaf::eigensolver::internal::reduceColumnVectors(w);</div>
-<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160; </div>
-<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;          <span class="comment">// STEP3: update trailing panel (multi-threaded)</span></div>
-<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;          updateTrailingPanel(has_head, tiles, j, w[0], taus({j, 0}), begin, end);</div>
-<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        }</div>
-<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;      });</div>
-<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;  ex::start_detached(std::move(s));</div>
-<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;}</div>
-<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160; </div>
-<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="keywordtype">void</span> setupReflectorPanelV(<span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> matrix::SubPanelView&amp; panel_view, <span class="keyword">const</span> SizeType nrefls,</div>
-<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;                          matrix::Panel&lt;Coord::Col, T, D&gt;&amp; v, matrix::Matrix&lt;const T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;                          <span class="keywordtype">bool</span> force_copy = <span class="keyword">false</span>) {</div>
-<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160; </div>
-<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160; </div>
-<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;  <span class="comment">// Reflectors are stored in the lower triangular part of the A matrix leading to sharing memory</span></div>
-<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;  <span class="comment">// between reflectors and results, which are in the upper triangular part. The problem exists only</span></div>
-<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  <span class="comment">// for the first tile (of the V, i.e. band excluded). Since refelectors will be used in next</span></div>
-<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;  <span class="comment">// computations, they should be well-formed, i.e. a unit lower trapezoidal matrix. For this reason,</span></div>
-<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;  <span class="comment">// a support tile is used, where just the reflectors values are copied, the diagonal is set to 1</span></div>
-<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;  <span class="comment">// and the rest is zeroed out.</span></div>
-<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;  <span class="keyword">auto</span> it_begin = panel_view.iteratorLocal().begin();</div>
-<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;  <span class="keyword">auto</span> it_end = panel_view.iteratorLocal().end();</div>
-<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160; </div>
-<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;  <span class="keywordflow">if</span> (has_head) {</div>
-<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    <span class="keyword">const</span> LocalTileIndex i = *it_begin;</div>
-<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    matrix::SubTileSpec spec = panel_view(i);</div>
-<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160; </div>
-<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;    <span class="comment">// If the number of reflectors are limited by height (|reflector| &gt; 1), the panel is narrower than</span></div>
-<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    <span class="comment">// the blocksize, leading to just using a part of A (first full nrefls columns)</span></div>
-<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;    spec.size = {spec.size.rows(), std::min(nrefls, spec.size.cols())};</div>
-<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160; </div>
-<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    <span class="comment">// copy + laset is done in two independent tasks, but it could be theoretically merged to into a</span></div>
-<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    <span class="comment">// single task doing both.</span></div>
-<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> p = <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high);</div>
-<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(<a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_a.read(i), spec), v.readwrite(i)) |</div>
-<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;                       matrix::copy(p));</div>
-<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(blas::Uplo::Upper, T(0), T(1), v.readwrite(i)) |</div>
-<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;                       tile::laset(p));</div>
-<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160; </div>
-<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;    ++it_begin;</div>
-<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;  }</div>
-<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160; </div>
-<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;  <span class="comment">// The rest of the V panel of reflectors can just point to the values in A, since they are</span></div>
-<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;  <span class="comment">// well formed in-place.</span></div>
-<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> it = it_begin; it &lt; it_end; ++it) {</div>
-<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;    <span class="keyword">const</span> LocalTileIndex idx = *it;</div>
-<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    <span class="keyword">const</span> matrix::SubTileSpec&amp; spec = panel_view(idx);</div>
-<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160; </div>
-<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;    <span class="comment">// Note:  This is a workaround for the deadlock problem with sub-tiles.</span></div>
-<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;    <span class="comment">//        Without this copy, during matrix update the same tile would get accessed at the same</span></div>
-<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;    <span class="comment">//        time both in readonly mode (for reflectors) and in readwrite mode (for updating the</span></div>
-<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;    <span class="comment">//        matrix). This would result in a deadlock, so instead of linking the panel to an external</span></div>
-<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;    <span class="comment">//        tile, memory provided internally by the panel is used as support. In this way, the two</span></div>
-<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="comment">//        subtiles used in the operation belong to different tiles.</span></div>
-<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;    <span class="keywordflow">if</span> (force_copy)</div>
-<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      ex::start_detached(ex::when_all(matrix::splitTile(mat_a.read(idx), spec), v.readwrite(idx)) |</div>
-<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                         matrix::copy(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
-<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;    <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;      v.setTile(idx, matrix::splitTile(mat_a.read(idx), spec));</div>
-<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;  }</div>
-<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;}</div>
-<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160; </div>
-<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;<span class="keywordtype">void</span> trmmComputeW(matrix::Panel&lt;Coord::Col, T, D&gt;&amp; w, matrix::Panel&lt;Coord::Col, T, D&gt;&amp; v,</div>
-<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                  matrix::ReadOnlyTileSender&lt;T, D&gt; tile_t) {</div>
-<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160; </div>
-<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160; </div>
-<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;  <span class="keyword">auto</span> it = w.iteratorLocal();</div>
-<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160; </div>
-<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_i : it) {</div>
-<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(Side::Right, Uplo::Upper, Op::NoTrans, Diag::NonUnit,</div>
-<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;                                                   T(1), tile_t, v.read(index_i), w.readwrite(index_i)) |</div>
-<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;                       tile::trmm3(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
-<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;  }</div>
-<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160; </div>
-<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;  <span class="keywordflow">if</span> (it.empty()) {</div>
-<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;    ex::start_detached(std::move(tile_t));</div>
-<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;  }</div>
-<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;}</div>
-<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160; </div>
-<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;<span class="keywordtype">void</span> gemmUpdateX(matrix::Panel&lt;Coord::Col, T, D&gt;&amp; x, matrix::Matrix&lt;const T, D&gt;&amp; w2,</div>
-<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;                 matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; v) {</div>
-<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160; </div>
-<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160; </div>
-<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;  <span class="comment">// GEMM X = X - 0.5 . V . W2</span></div>
-<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_i : v.iteratorLocal())</div>
-<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(Op::NoTrans, Op::NoTrans, T(-0.5), v.read(index_i),</div>
-<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;                                                   w2.read(LocalTileIndex(0, 0)), T(1),</div>
-<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;                                                   x.readwrite(index_i)) |</div>
-<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;                       tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
-<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;}</div>
-<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160; </div>
-<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;<span class="keywordtype">void</span> hemmComputeX(matrix::Panel&lt;Coord::Col, T, D&gt;&amp; x, <span class="keyword">const</span> matrix::SubMatrixView&amp; view,</div>
-<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;                  matrix::Matrix&lt;const T, D&gt;&amp; a, matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; w) {</div>
-<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160; </div>
-<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160; </div>
-<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
-<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160; </div>
-<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;  <span class="comment">// They have to be set to zero, because all tiles are going to be reduced, and some tiles may not get</span></div>
-<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;  <span class="comment">// &quot;initialized&quot; during computation, so they should not contribute with any spurious value to the final</span></div>
-<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;  <span class="comment">// result.</span></div>
-<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;  matrix::util::set0&lt;B&gt;(thread_priority::high, x);</div>
-<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160; </div>
-<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_offset = view.begin();</div>
-<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160; </div>
-<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_offset.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
-<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = i + 1;</div>
-<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;    <span class="keywordflow">for</span> (SizeType j = limit - 1; j &gt;= at_offset.col(); --j) {</div>
-<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij{i, j};</div>
-<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160; </div>
-<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
-<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160; </div>
-<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile_a = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.read(ij), view(ij));</div>
-<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160; </div>
-<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
-<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;        hemmDiag&lt;B&gt;(thread_priority::high, tile_a, w.read(ij), x.readwrite(ij));</div>
-<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;      }</div>
-<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;        <span class="comment">// Because A is hermitian and just the lower part contains the data, for each a(ij) not</span></div>
-<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;        <span class="comment">// on the diagonal, two computations are done:</span></div>
-<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;        <span class="comment">// - using a(ij) in its position;</span></div>
-<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;        <span class="comment">// - using a(ij) in its &quot;transposed&quot; position (applying the ConjTrans to its data)</span></div>
-<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160; </div>
-<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        {</div>
-<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_x(Coord::Row, ij.row());</div>
-<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_w(Coord::Row, ij.col());</div>
-<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;          hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::NoTrans, tile_a, w.read(index_w),</div>
-<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;                         x.readwrite(index_x));</div>
-<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;        }</div>
-<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160; </div>
-<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;        {</div>
-<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_pretended = <a class="code" href="index2d_8h.html#a024753ac73fbefa174548c575327862b">transposed</a>(ij);</div>
-<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_x(Coord::Row, index_pretended.row());</div>
-<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_w(Coord::Row, index_pretended.col());</div>
-<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;          hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::ConjTrans, tile_a, w.read(index_w),</div>
-<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;                         x.readwrite(index_x));</div>
-<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;        }</div>
-<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;      }</div>
-<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;    }</div>
-<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;  }</div>
-<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;}</div>
-<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160; </div>
-<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;<span class="keywordtype">void</span> gemmComputeW2(matrix::Matrix&lt;T, D&gt;&amp; w2, matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; w,</div>
-<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;                   matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; x) {</div>
-<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160; </div>
-<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160; </div>
-<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;  <span class="comment">// Not all ranks in the column always hold at least a tile in the panel Ai, but all ranks in</span></div>
-<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;  <span class="comment">// the column are going to participate to the reduce. For them, it is important to set the</span></div>
-<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;  <span class="comment">// partial result W2 to zero.</span></div>
-<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;  ex::start_detached(w2.readwrite(LocalTileIndex(0, 0)) |</div>
-<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;                     tile::set0(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
-<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160; </div>
-<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;  <span class="comment">// GEMM W2 = W* . X</span></div>
-<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_tile : w.iteratorLocal())</div>
-<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(Op::ConjTrans, Op::NoTrans, T(1), w.read(index_tile),</div>
-<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;                                                   x.read(index_tile), T(1),</div>
-<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;                                                   w2.readwrite(LocalTileIndex(0, 0))) |</div>
-<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;                       tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
-<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;}</div>
-<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160; </div>
-<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;<span class="keywordtype">void</span> her2kUpdateTrailingMatrix(<span class="keyword">const</span> matrix::SubMatrixView&amp; view, matrix::Matrix&lt;T, D&gt;&amp; a,</div>
-<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; x,</div>
-<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; v) {</div>
-<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;  static_assert(std::is_signed_v&lt;BaseType&lt;T&gt;&gt;, <span class="stringliteral">&quot;alpha in computations requires to be -1&quot;</span>);</div>
-<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160; </div>
-<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160; </div>
-<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
-<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160; </div>
-<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_start = view.begin();</div>
-<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160; </div>
-<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_start.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
-<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = dist.template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
-<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;        dist.template globalTileFromLocalTile&lt;Coord::Row&gt;(i) + 1);</div>
-<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <span class="keywordflow">for</span> (SizeType j = at_start.col(); j &lt; limit; ++j) {</div>
-<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_local{i, j};</div>
-<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij = dist.globalTileIndex(ij_local);</div>
-<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160; </div>
-<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
-<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160; </div>
-<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;      <span class="keyword">auto</span> getSubA = [&amp;a, &amp;view, ij_local]() {</div>
-<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.readwrite(ij_local), view(ij_local));</div>
-<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;      };</div>
-<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160; </div>
-<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;      <span class="comment">// The first column of the trailing matrix (except for the very first global tile) has to be</span></div>
-<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;      <span class="comment">// updated first, in order to unlock the next iteration as soon as possible.</span></div>
-<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> priority = (j == at_start.col()) ? thread_priority::high : thread_priority::normal;</div>
-<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160; </div>
-<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
-<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;        her2kDiag&lt;B&gt;(priority, v.read(ij_local), x.read(ij_local), getSubA());</div>
-<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;      }</div>
-<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;        <span class="comment">// A -= X . V*</span></div>
-<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;        her2kOffDiag&lt;B&gt;(priority, x.read(ij_local), v.read(<a class="code" href="index2d_8h.html#a024753ac73fbefa174548c575327862b">transposed</a>(ij_local)), getSubA());</div>
-<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160; </div>
-<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        <span class="comment">// A -= V . X*</span></div>
-<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        her2kOffDiag&lt;B&gt;(priority, v.read(ij_local), x.read(<a class="code" href="index2d_8h.html#a024753ac73fbefa174548c575327862b">transposed</a>(ij_local)), getSubA());</div>
-<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;      }</div>
-<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;    }</div>
-<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;  }</div>
-<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;}</div>
-<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160; </div>
-<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;}</div>
-<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160; </div>
-<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;<span class="keyword">namespace </span>distributed {</div>
-<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;T computeReflector(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, comm::Communicator&amp; communicator,</div>
-<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;                   <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel, SizeType j) {</div>
-<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;  std::array&lt;T, 2&gt; x0_and_squares = computeX0AndSquares(has_head, panel, j);</div>
-<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160; </div>
-<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;  <span class="comment">// This is an optimization for grouping two separate low bandwidth communications, respectively</span></div>
-<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;  <span class="comment">// bcast(x0) and reduce(norm), where the latency was degrading performances.</span></div>
-<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;  <span class="comment">// In particular this allReduce allows to:</span></div>
-<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;  <span class="comment">// - bcast x0, since for all ranks is 0 and just the root rank has the real value;</span></div>
-<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;  <span class="comment">// - allReduce squares for the norm computation.</span></div>
-<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;  <span class="comment">// Moreover, by all-reducing squares and broadcasting x0, all ranks have all the information to</span></div>
-<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;  <span class="comment">// update locally the reflectors (section they have). This is more efficient than computing params</span></div>
-<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;  <span class="comment">// (e.g. norm, y, tau) just on the root rank and then having to broadcast them (i.e. additional</span></div>
-<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;  <span class="comment">// communication).</span></div>
-<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;  comm::sync::allReduceInPlace(communicator, MPI_SUM,</div>
-<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;                               common::make_data(x0_and_squares.data(),</div>
-<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;                                                 <a class="code" href="types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9">to_SizeType</a>(x0_and_squares.size())));</div>
-<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160; </div>
-<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;  <span class="keyword">auto</span> tau = computeReflectorAndTau(has_head, panel, j, std::move(x0_and_squares));</div>
-<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160; </div>
-<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;  <span class="keywordflow">return</span> tau;</div>
-<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;}</div>
-<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160; </div>
-<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLikeA, <span class="keyword">class</span> MatrixLikeTaus, <span class="keyword">class</span> TriggerSender, <span class="keyword">class</span> CommSender&gt;</div>
-<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;<span class="keywordtype">void</span> computePanelReflectors(TriggerSender&amp;&amp; trigger, comm::IndexT_MPI rank_v0,</div>
-<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;                            CommSender&amp;&amp; mpi_col_chain_panel, MatrixLikeA&amp; mat_a,</div>
-<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;                            MatrixLikeTaus&amp; mat_taus, SizeType j_sub,</div>
-<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;                            <span class="keyword">const</span> matrix::SubPanelView&amp; panel_view) {</div>
-<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;  <span class="keyword">static</span> Device constexpr D = MatrixLikeA::device;</div>
-<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;  <span class="keyword">using</span> T = <span class="keyword">typename</span> MatrixLikeA::ElementType;</div>
-<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;  <span class="keyword">namespace </span>di = dlaf::internal;</div>
-<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160; </div>
-<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;  std::vector&lt;matrix::ReadWriteTileSender&lt;T, D&gt;&gt; panel_tiles;</div>
-<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;  panel_tiles.reserve(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(std::distance(panel_view.iteratorLocal().begin(),</div>
-<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;                                             panel_view.iteratorLocal().end())));</div>
-<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.iteratorLocal()) {</div>
-<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;    <span class="keyword">const</span> matrix::SubTileSpec&amp; spec = panel_view(i);</div>
-<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;    panel_tiles.emplace_back(matrix::splitTile(mat_a.readwrite(i), spec));</div>
-<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;  }</div>
-<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160; </div>
-<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;  <span class="keyword">const</span> std::size_t nthreads = getReductionToBandPanelNWorkers();</div>
-<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;  <span class="keyword">auto</span> s =</div>
-<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;      ex::when_all(ex::just(std::make_unique&lt;pika::barrier&lt;&gt;&gt;(nthreads),</div>
-<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;                            std::vector&lt;common::internal::vector&lt;T&gt;&gt;{}),  <span class="comment">// w (internally required)</span></div>
-<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;                   mat_taus.readwrite(GlobalTileIndex(j_sub, 0)),</div>
-<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;                   ex::when_all_vector(std::move(panel_tiles)),</div>
-<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;                   std::forward&lt;CommSender&gt;(mpi_col_chain_panel), std::forward&lt;TriggerSender&gt;(trigger)) |</div>
-<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;      ex::transfer(di::getBackendScheduler&lt;Backend::MC&gt;(pika::execution::thread_priority::high)) |</div>
-<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;      ex::bulk(nthreads, [nthreads, rank_v0,</div>
-<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;                          cols = panel_view.cols()](<span class="keyword">const</span> std::size_t index, <span class="keyword">auto</span>&amp; barrier_ptr, <span class="keyword">auto</span>&amp; w,</div>
-<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;                                                    <span class="keyword">auto</span>&amp; taus, <span class="keyword">auto</span>&amp; tiles, <span class="keyword">auto</span>&amp;&amp; pcomm) {</div>
-<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;        const bool rankHasHead = rank_v0 == pcomm.get().rank();</div>
-<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160; </div>
-<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;        const auto barrier_busy_wait = getReductionToBandBarrierBusyWait();</div>
-<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;        const std::size_t batch_size = util::ceilDiv(tiles.size(), nthreads);</div>
-<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;        const std::size_t begin = index * batch_size;</div>
-<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;        const std::size_t end = std::min(index * batch_size + batch_size, tiles.size());</div>
-<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;        const SizeType nrefls = taus.size().rows();</div>
-<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160; </div>
-<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;        if (index == 0) {</div>
-<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;          w.resize(nthreads);</div>
-<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;        }</div>
-<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160; </div>
-<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;        for (SizeType j = 0; j &lt; nrefls; ++j) {</div>
-<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;          <span class="comment">// STEP1: compute tau and reflector (single-thread)</span></div>
-<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;          <span class="keywordflow">if</span> (index == 0) {</div>
-<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">bool</span> has_head = rankHasHead;</div>
-<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;            taus({j, 0}) = computeReflector(has_head, pcomm.get(), tiles, j);</div>
-<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;          }</div>
-<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160; </div>
-<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;          <span class="comment">// STEP2a: compute w (multi-threaded)</span></div>
-<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;          <span class="keyword">const</span> SizeType pt_cols = cols - (j + 1);</div>
-<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;          <span class="keywordflow">if</span> (pt_cols == 0)</div>
-<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;            <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160; </div>
-<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;          <span class="keyword">const</span> <span class="keywordtype">bool</span> has_head = rankHasHead &amp;&amp; (index == 0);</div>
-<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160; </div>
-<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;          w[index] = common::internal::vector&lt;T&gt;(pt_cols, 0);</div>
-<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;          computeWTrailingPanel(has_head, tiles, w[index], j, pt_cols, begin, end);</div>
-<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160; </div>
-<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;          <span class="comment">// STEP2b: reduce w results (single-threaded)</span></div>
-<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;          <span class="keywordflow">if</span> (index == 0) {</div>
-<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;            dlaf::eigensolver::internal::reduceColumnVectors(w);</div>
-<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;            comm::sync::allReduceInPlace(pcomm.get(), MPI_SUM, common::make_data(w[0].data(), pt_cols));</div>
-<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;          }</div>
-<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160; </div>
-<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;          <span class="comment">// STEP3: update trailing panel (multi-threaded)</span></div>
-<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;          updateTrailingPanel(has_head, tiles, j, w[0], taus({j, 0}), begin, end);</div>
-<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
-<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;        }</div>
-<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;      });</div>
-<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;  ex::start_detached(std::move(s));</div>
-<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;}</div>
-<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160; </div>
-<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;<span class="keywordtype">void</span> hemmComputeX(comm::IndexT_MPI reducer_col, matrix::Panel&lt;Coord::Col, T, D&gt;&amp; x,</div>
-<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;                  matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&amp; xt,</div>
-<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;                  <span class="keyword">const</span> matrix::SubMatrixView&amp; view, matrix::Matrix&lt;const T, D&gt;&amp; a,</div>
-<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;                  matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; w,</div>
-<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;                  matrix::Panel&lt;Coord::Row, const T, D, matrix::StoreTransposed::Yes&gt;&amp; wt,</div>
-<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;                  common::Pipeline&lt;comm::Communicator&gt;&amp; mpi_row_chain,</div>
-<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;                  common::Pipeline&lt;comm::Communicator&gt;&amp; mpi_col_chain) {</div>
-<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160; </div>
-<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160; </div>
-<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
-<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> rank = dist.rankIndex();</div>
-<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160; </div>
-<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;  <span class="comment">// They have to be set to zero, because all tiles are going to be reduced, and some tiles may not get</span></div>
-<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;  <span class="comment">// &quot;initialized&quot; during computation, so they should not contribute with any spurious value to the final</span></div>
-<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;  <span class="comment">// result.</span></div>
-<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;  matrix::util::set0&lt;B&gt;(thread_priority::high, x);</div>
-<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;  matrix::util::set0&lt;B&gt;(thread_priority::high, xt);</div>
-<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160; </div>
-<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_offset = view.begin();</div>
-<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160; </div>
-<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_offset.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
-<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = dist.template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
-<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;        dist.template globalTileFromLocalTile&lt;Coord::Row&gt;(i) + 1);</div>
-<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;    <span class="keywordflow">for</span> (SizeType j = limit - 1; j &gt;= at_offset.col(); --j) {</div>
-<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_local{i, j};</div>
-<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij = dist.globalTileIndex(ij_local);</div>
-<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160; </div>
-<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
-<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160; </div>
-<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;      <span class="keyword">auto</span> tile_a = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.read(ij), view(ij_local));</div>
-<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160; </div>
-<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
-<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;        hemmDiag&lt;B&gt;(thread_priority::high, std::move(tile_a), w.read(ij_local), x.readwrite(ij_local));</div>
-<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;      }</div>
-<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;        <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;        <span class="comment">// Since it is not a diagonal tile, otherwise it would have been managed in the previous</span></div>
-<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;        <span class="comment">// branch, the second operand is not available in W but it is accessible through the</span></div>
-<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;        <span class="comment">// support panel Wt.</span></div>
-<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;        <span class="comment">// However, since we are still computing the &quot;straight&quot; part, the result can be stored</span></div>
-<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;        <span class="comment">// in the &quot;local&quot; panel X.</span></div>
-<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;        hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::NoTrans, tile_a, wt.read(ij_local),</div>
-<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;                       x.readwrite(ij_local));</div>
-<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160; </div>
-<div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;        <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;        <span class="comment">// Here we are considering the hermitian part of A, so coordinates have to be &quot;mirrored&quot;.</span></div>
-<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;        <span class="comment">// So, first step is identifying the mirrored cell coordinate, i.e. swap row/col, together</span></div>
-<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;        <span class="comment">// with realizing if the new coord lays on an owned row or not.</span></div>
-<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;        <span class="comment">// If yes, the result can be stored in the X, otherwise Xt support panel will be used.</span></div>
-<div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;        <span class="comment">// For what concerns the second operand, it can be found for sure in W. In fact, the</span></div>
-<div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;        <span class="comment">// multiplication requires matching col(A) == row(W), but since coordinates are mirrored,</span></div>
-<div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;        <span class="comment">// we are matching row(A) == row(W), so it is local by construction.</span></div>
-<div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> owner = dist.template rankGlobalTile&lt;Coord::Row&gt;(ij.col());</div>
-<div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160; </div>
-<div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;        <span class="keyword">const</span> LocalTileIndex index_x{dist.template localTileFromGlobalTile&lt;Coord::Row&gt;(ij.col()), 0};</div>
-<div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;        <span class="keyword">const</span> LocalTileIndex index_xt{0, ij_local.col()};</div>
-<div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160; </div>
-<div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;        <span class="keyword">auto</span> tile_x = (dist.rankIndex().row() == owner) ? x.readwrite(index_x) : xt.readwrite(index_xt);</div>
-<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160; </div>
-<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;        hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::ConjTrans, std::move(tile_a), w.read(ij_local),</div>
-<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;                       std::move(tile_x));</div>
-<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;      }</div>
-<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;    }</div>
-<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;  }</div>
-<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160; </div>
-<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;  <span class="comment">// At this point, partial results of X and Xt are available in the panels, and they have to be reduced,</span></div>
-<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;  <span class="comment">// both row-wise and col-wise.</span></div>
-<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;  <span class="comment">// The final X result will be available just on Ai panel column.</span></div>
-<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160; </div>
-<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;  <span class="comment">// The first step in reducing partial results distributed over X and Xt, it is to reduce the row</span></div>
-<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;  <span class="comment">// panel Xt col-wise, by collecting all Xt results on the rank which can &quot;mirror&quot; the result on its</span></div>
-<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;  <span class="comment">// rows (i.e. diagonal). So, for each tile of the row panel, select who is the &quot;diagonal&quot; rank that can</span></div>
-<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;  <span class="comment">// mirror and reduce on it.</span></div>
-<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_xt : xt.iteratorLocal()) {</div>
-<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> index_k = dist.template globalTileFromLocalTile&lt;Coord::Col&gt;(index_xt.col());</div>
-<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> rank_owner_row = dist.template rankGlobalTile&lt;Coord::Row&gt;(index_k);</div>
-<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160; </div>
-<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;    <span class="keywordflow">if</span> (rank_owner_row == rank.row()) {</div>
-<div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;      <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;      <span class="comment">// Since it is the owner, it has to perform the &quot;mirroring&quot; of the results from columns to</span></div>
-<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;      <span class="comment">// rows.</span></div>
-<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;      <span class="comment">//</span></div>
-<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;      <span class="comment">// Moreover, it reduces in place because the owner of the diagonal stores the partial result</span></div>
-<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;      <span class="comment">// directly in x (without using xt)</span></div>
-<div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> i = dist.template localTileFromGlobalTile&lt;Coord::Row&gt;(index_k);</div>
-<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;      ex::start_detached(comm::scheduleReduceRecvInPlace(mpi_col_chain(), MPI_SUM, x.readwrite({i, 0})));</div>
-<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    }</div>
-<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;      ex::start_detached(comm::scheduleReduceSend(mpi_col_chain(), rank_owner_row, MPI_SUM,</div>
-<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;                                                  xt.read(index_xt)));</div>
-<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;    }</div>
-<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;  }</div>
-<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160; </div>
-<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;  <span class="comment">// At this point partial results are all collected in X (Xt has been embedded in previous step),</span></div>
-<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;  <span class="comment">// so the last step needed is to reduce these last partial results in the final results.</span></div>
-<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;  <span class="comment">// The result is needed just on the column with reflectors.</span></div>
-<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_x : x.iteratorLocal()) {</div>
-<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;    <span class="keywordflow">if</span> (reducer_col == rank.col())</div>
-<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;      ex::start_detached(comm::scheduleReduceRecvInPlace(mpi_row_chain(), MPI_SUM,</div>
-<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;                                                         x.readwrite(index_x)));</div>
-<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;    <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;      ex::start_detached(comm::scheduleReduceSend(mpi_row_chain(), reducer_col, MPI_SUM,</div>
-<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;                                                  x.read(index_x)));</div>
-<div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;  }</div>
-<div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;}</div>
-<div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160; </div>
-<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;<span class="keywordtype">void</span> her2kUpdateTrailingMatrix(<span class="keyword">const</span> matrix::SubMatrixView&amp; view, Matrix&lt;T, D&gt;&amp; a,</div>
-<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; x,</div>
-<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;                               matrix::Panel&lt;Coord::Row, const T, D, matrix::StoreTransposed::Yes&gt;&amp; vt,</div>
-<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; v,</div>
-<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;                               matrix::Panel&lt;Coord::Row, const T, D, matrix::StoreTransposed::Yes&gt;&amp; xt) {</div>
-<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;  static_assert(std::is_signed_v&lt;BaseType&lt;T&gt;&gt;, <span class="stringliteral">&quot;alpha in computations requires to be -1&quot;</span>);</div>
-<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160; </div>
-<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160; </div>
-<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
-<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160; </div>
-<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_start = view.begin();</div>
-<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160; </div>
-<div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_start.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
-<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = dist.template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
-<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;        dist.template globalTileFromLocalTile&lt;Coord::Row&gt;(i) + 1);</div>
-<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;    <span class="keywordflow">for</span> (SizeType j = at_start.col(); j &lt; limit; ++j) {</div>
-<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_local{i, j};</div>
-<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij = dist.globalTileIndex(ij_local);</div>
-<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160; </div>
-<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
-<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160; </div>
-<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;      <span class="keyword">auto</span> getSubA = [&amp;a, &amp;view, ij_local]() {</div>
-<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.readwrite(ij_local), view(ij_local));</div>
-<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;      };</div>
-<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160; </div>
-<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;      <span class="comment">// The first column of the trailing matrix (except for the very first global tile) has to be</span></div>
-<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;      <span class="comment">// updated first, in order to unlock the next iteration as soon as possible.</span></div>
-<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> priority = (j == at_start.col()) ? thread_priority::high : thread_priority::normal;</div>
-<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160; </div>
-<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
-<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;        her2kDiag&lt;B&gt;(priority, v.read(ij_local), x.read(ij_local), getSubA());</div>
-<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;      }</div>
-<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;        <span class="comment">// A -= X . V*</span></div>
-<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;        her2kOffDiag&lt;B&gt;(priority, x.read(ij_local), vt.read(ij_local), getSubA());</div>
-<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160; </div>
-<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;        <span class="comment">// A -= V . X*</span></div>
-<div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;        her2kOffDiag&lt;B&gt;(priority, v.read(ij_local), xt.read(ij_local), getSubA());</div>
-<div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;      }</div>
-<div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;    }</div>
-<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;  }</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="views_8h.html">dlaf/matrix/views.h</a>&gt;</span></div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="schedulers_8h.html">dlaf/schedulers.h</a>&gt;</span></div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#include &lt;dlaf/sender/traits.h&gt;</span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__math_8h.html">dlaf/util_math.h</a>&gt;</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="util__matrix_8h.html">dlaf/util_matrix.h</a>&gt;</span></div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">namespace </span>dlaf::eigensolver::internal {</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160; </div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">// Given a vector of vectors, reduce all vectors in the first one using sum operation</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keywordtype">void</span> reduceColumnVectors(std::vector&lt;common::internal::vector&lt;T&gt;&gt;&amp; columnVectors) {</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="keywordflow">for</span> (std::size_t i = 1; i &lt; columnVectors.size(); ++i) {</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    DLAF_ASSERT_HEAVY(columnVectors[0].size() == columnVectors[i].size(), columnVectors[0].size(),</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                      columnVectors[i].size());</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keywordflow">for</span> (SizeType j = 0; j &lt; columnVectors[0].size(); ++j)</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      columnVectors[0][j] += columnVectors[i][j];</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  }</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;}</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">namespace </span>red2band {</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160; </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="comment">// Extract x0 and compute local cumulative sum of squares of the reflector column</span></div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;std::array&lt;T, 2&gt; computeX0AndSquares(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel,</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                                     SizeType j) {</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  std::array&lt;T, 2&gt; x0_and_squares{0, 0};</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keyword">auto</span> it_begin = panel.begin();</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="keyword">auto</span> it_end = panel.end();</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160; </div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <span class="keywordflow">if</span> (has_head) {</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="keyword">auto</span>&amp; tile_v0 = *it_begin++;</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160; </div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="keyword">const</span> TileElementIndex idx_x0(j, j);</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    x0_and_squares[0] = tile_v0(idx_x0);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160; </div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    T* reflector_ptr = tile_v0.ptr({idx_x0});</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    x0_and_squares[1] =</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        blas::dot(tile_v0.size().rows() - idx_x0.row(), reflector_ptr, 1, reflector_ptr, 1);</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  }</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160; </div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> it = it_begin; it != it_end; ++it) {</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile = *it;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160; </div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    T* reflector_ptr = tile.ptr({0, j});</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    x0_and_squares[1] += blas::dot(tile.size().rows(), reflector_ptr, 1, reflector_ptr, 1);</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  }</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="keywordflow">return</span> x0_and_squares;</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;}</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160; </div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;T computeReflectorAndTau(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel,</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                         <span class="keyword">const</span> SizeType j, std::array&lt;T, 2&gt; x0_and_squares) {</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <span class="keyword">const</span> T <a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a> = std::sqrt(x0_and_squares[1]);</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">const</span> T x0 = x0_and_squares[0];</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <span class="keyword">const</span> T y = std::signbit(std::real(x0_and_squares[0])) ? <a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a> : -<a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a>;</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="keyword">const</span> T tau = (y - x0) / y;</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160; </div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="keyword">auto</span> it_begin = panel.begin();</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="keyword">auto</span> it_end = panel.end();</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160; </div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <span class="keywordflow">if</span> (has_head) {</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile_v0 = *it_begin++;</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160; </div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keyword">const</span> TileElementIndex idx_x0(j, j);</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    tile_v0(idx_x0) = y;</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160; </div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keywordflow">if</span> (j + 1 &lt; tile_v0.size().rows()) {</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;      T* v = tile_v0.ptr({j + 1, j});</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      blas::scal(tile_v0.size().rows() - (j + 1), T(1) / (x0 - y), v, 1);</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    }</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  }</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160; </div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> it = it_begin; it != it_end; ++it) {</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="keyword">auto</span>&amp; tile_v = *it;</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    T* v = tile_v.ptr({0, j});</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    blas::scal(tile_v.size().rows(), T(1) / (x0 - y), v, 1);</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  }</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160; </div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="keywordflow">return</span> tau;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;}</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160; </div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keywordtype">void</span> computeWTrailingPanel(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel,</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                           common::internal::vector&lt;T&gt;&amp; w, SizeType j, <span class="keyword">const</span> SizeType pt_cols,</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;                           <span class="keyword">const</span> std::size_t begin, <span class="keyword">const</span> std::size_t end) {</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="comment">// for each tile in the panel, consider just the trailing panel</span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="comment">// i.e. all rows (height = reflector), just columns to the right of the current reflector</span></div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="keywordflow">if</span> (!(pt_cols &gt; 0))</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordflow">return</span>;</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160; </div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <span class="keyword">const</span> TileElementIndex index_el_x0(j, j);</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <span class="keywordtype">bool</span> has_first_component = has_head;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160; </div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160; </div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <span class="comment">// W = Pt* . V</span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> index = begin; index &lt; end; ++index) {</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keyword">const</span> matrix::Tile&lt;const T, D&gt;&amp; tile_a = panel[index];</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="keyword">const</span> SizeType first_element = has_first_component ? index_el_x0.row() : 0;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160; </div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    TileElementIndex pt_start{first_element, index_el_x0.col() + 1};</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    TileElementSize pt_size{tile_a.size().rows() - pt_start.row(), pt_cols};</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    TileElementIndex v_start{first_element, index_el_x0.col()};</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160; </div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keywordflow">if</span> (has_first_component) {</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <span class="keyword">const</span> TileElementSize offset{1, 0};</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160; </div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="keyword">const</span> T fake_v = 1;</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      blas::gemv(blas::Layout::ColMajor, blas::Op::ConjTrans, offset.rows(), pt_size.cols(), T(1),</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;                 tile_a.ptr(pt_start), tile_a.ld(), &amp;fake_v, 1, T(0), w.data(), 1);</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160; </div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      pt_start = pt_start + offset;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      v_start = v_start + offset;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      pt_size = pt_size - offset;</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160; </div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      has_first_component = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    }</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160; </div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <span class="keywordflow">if</span> (pt_start.isIn(tile_a.size())) {</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <span class="comment">// W += 1 . A* . V</span></div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      blas::gemv(blas::Layout::ColMajor, blas::Op::ConjTrans, pt_size.rows(), pt_size.cols(), T(1),</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;                 tile_a.ptr(pt_start), tile_a.ld(), tile_a.ptr(v_start), 1, T(1), w.data(), 1);</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    }</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;  }</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;}</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160; </div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="keywordtype">void</span> updateTrailingPanel(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel, SizeType j,</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;                         <span class="keyword">const</span> std::vector&lt;T&gt;&amp; w, <span class="keyword">const</span> T tau, <span class="keyword">const</span> std::size_t begin,</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                         <span class="keyword">const</span> std::size_t end) {</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;  <span class="keyword">const</span> TileElementIndex index_el_x0(j, j);</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160; </div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;  <span class="keywordtype">bool</span> has_first_component = has_head;</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160; </div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  common::internal::SingleThreadedBlasScope single;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160; </div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <span class="comment">// GER Pt = Pt - tau . v . w*</span></div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> index = begin; index &lt; end; ++index) {</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <span class="keyword">const</span> matrix::Tile&lt;T, D&gt;&amp; tile_a = panel[index];</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keyword">const</span> SizeType first_element = has_first_component ? index_el_x0.row() : 0;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160; </div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    TileElementIndex pt_start{first_element, index_el_x0.col() + 1};</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    TileElementSize pt_size{tile_a.size().rows() - pt_start.row(),</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;                            tile_a.size().cols() - pt_start.col()};</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    TileElementIndex v_start{first_element, index_el_x0.col()};</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160; </div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    <span class="keywordflow">if</span> (has_first_component) {</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;      <span class="keyword">const</span> TileElementSize offset{1, 0};</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160; </div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;      <span class="comment">// Pt = Pt - tau * v[0] * w*</span></div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      <span class="keyword">const</span> T fake_v = 1;</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      blas::ger(blas::Layout::ColMajor, 1, pt_size.cols(), -dlaf::conj(tau), &amp;fake_v, 1, w.data(), 1,</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;                tile_a.ptr(pt_start), tile_a.ld());</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160; </div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      pt_start = pt_start + offset;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      v_start = v_start + offset;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      pt_size = pt_size - offset;</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160; </div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      has_first_component = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    }</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160; </div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="keywordflow">if</span> (pt_start.isIn(tile_a.size())) {</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="comment">// Pt = Pt - tau * v * w*</span></div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      blas::ger(blas::Layout::ColMajor, pt_size.rows(), pt_size.cols(), -dlaf::conj(tau),</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;                tile_a.ptr(v_start), 1, w.data(), 1, tile_a.ptr(pt_start), tile_a.ld());</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    }</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  }</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;}</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160; </div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> ASender, <span class="keyword">typename</span> WSender, <span class="keyword">typename</span> XSender&gt;</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;<span class="keywordtype">void</span> hemmDiag(pika::execution::thread_priority priority, ASender&amp;&amp; tile_a, WSender&amp;&amp; tile_w,</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;              XSender&amp;&amp; tile_x) {</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;ASender&gt;;</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;  pika::execution::experimental::start_detached(</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      dlaf::internal::whenAllLift(blas::Side::Left, blas::Uplo::Lower, T(1),</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;                                  std::forward&lt;ASender&gt;(tile_a), std::forward&lt;WSender&gt;(tile_w), T(1),</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;                                  std::forward&lt;XSender&gt;(tile_x)) |</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      tile::hemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;}</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160; </div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="comment">// X += op(A) * W</span></div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> ASender, <span class="keyword">typename</span> WSender, <span class="keyword">typename</span> XSender&gt;</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;<span class="keywordtype">void</span> hemmOffDiag(pika::execution::thread_priority priority, blas::Op op, ASender&amp;&amp; tile_a,</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;                 WSender&amp;&amp; tile_w, XSender&amp;&amp; tile_x) {</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;ASender&gt;;</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  pika::execution::experimental::start_detached(</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      dlaf::internal::whenAllLift(op, blas::Op::NoTrans, T(1), std::forward&lt;ASender&gt;(tile_a),</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;                                  std::forward&lt;WSender&gt;(tile_w), T(1), std::forward&lt;XSender&gt;(tile_x)) |</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;}</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160; </div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> VSender, <span class="keyword">typename</span> XSender, <span class="keyword">typename</span> ASender&gt;</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="keywordtype">void</span> her2kDiag(pika::execution::thread_priority priority, VSender&amp;&amp; tile_v, XSender&amp;&amp; tile_x,</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;               ASender&amp;&amp; tile_a) {</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;VSender&gt;;</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  pika::execution::experimental::start_detached(</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      dlaf::internal::whenAllLift(blas::Uplo::Lower, blas::Op::NoTrans, T(-1),</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;                                  std::forward&lt;VSender&gt;(tile_v), std::forward&lt;XSender&gt;(tile_x),</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;                                  BaseType&lt;T&gt;(1), std::forward&lt;ASender&gt;(tile_a)) |</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      tile::her2k(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;}</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160; </div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;<span class="comment">// C -= A . B*</span></div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="keyword">template</span> &lt;Backend B, <span class="keyword">typename</span> ASender, <span class="keyword">typename</span> BSender, <span class="keyword">typename</span> CSender&gt;</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="keywordtype">void</span> her2kOffDiag(pika::execution::thread_priority priority, ASender&amp;&amp; tile_a, BSender&amp;&amp; tile_b,</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;                  CSender&amp;&amp; tile_c) {</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  <span class="keyword">using</span> T = dlaf::internal::SenderElementType&lt;ASender&gt;;</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;  pika::execution::experimental::start_detached(</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      dlaf::internal::whenAllLift(blas::Op::NoTrans, blas::Op::ConjTrans, T(-1),</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;                                  std::forward&lt;ASender&gt;(tile_a), std::forward&lt;BSender&gt;(tile_b), T(1),</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;                                  std::forward&lt;CSender&gt;(tile_c)) |</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;      tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(priority)));</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;}</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160; </div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;<span class="keyword">namespace </span>local {</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160; </div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;T computeReflector(<span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel, SizeType j) {</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;  constexpr <span class="keywordtype">bool</span> has_head = <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160; </div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;  std::array&lt;T, 2&gt; x0_and_squares = computeX0AndSquares(has_head, panel, j);</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160; </div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;  <span class="keyword">auto</span> tau = computeReflectorAndTau(has_head, panel, j, std::move(x0_and_squares));</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160; </div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;  <span class="keywordflow">return</span> tau;</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;}</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160; </div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLikeA, <span class="keyword">class</span> MatrixLikeTaus&gt;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;<span class="keywordtype">void</span> computePanelReflectors(MatrixLikeA&amp; mat_a, MatrixLikeTaus&amp; mat_taus, <span class="keyword">const</span> SizeType j_sub,</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;                            <span class="keyword">const</span> matrix::SubPanelView&amp; panel_view) {</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;  <span class="keyword">static</span> Device constexpr D = MatrixLikeA::device;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;  <span class="keyword">using</span> T = <span class="keyword">typename</span> MatrixLikeA::ElementType;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <span class="keyword">namespace </span>di = dlaf::internal;</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160; </div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;  std::vector&lt;matrix::ReadWriteTileSender&lt;T, D&gt;&gt; panel_tiles;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;  panel_tiles.reserve(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(std::distance(panel_view.iteratorLocal().begin(),</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;                                             panel_view.iteratorLocal().end())));</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.iteratorLocal()) {</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    <span class="keyword">const</span> matrix::SubTileSpec&amp; spec = panel_view(i);</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    panel_tiles.emplace_back(matrix::splitTile(mat_a.readwrite(i), spec));</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;  }</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160; </div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;  <span class="keyword">const</span> std::size_t nthreads = getReductionToBandPanelNWorkers();</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;  <span class="keyword">auto</span> s =</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      ex::when_all(ex::just(std::make_unique&lt;pika::barrier&lt;&gt;&gt;(nthreads),</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                            std::vector&lt;common::internal::vector&lt;T&gt;&gt;{}),  <span class="comment">// w (internally required)</span></div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                   mat_taus.readwrite(LocalTileIndex(j_sub, 0)),</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                   ex::when_all_vector(std::move(panel_tiles))) |</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      ex::transfer(di::getBackendScheduler&lt;Backend::MC&gt;(pika::execution::thread_priority::high)) |</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      ex::bulk(nthreads, [nthreads, cols = panel_view.cols()](<span class="keyword">const</span> std::size_t index, <span class="keyword">auto</span>&amp; barrier_ptr,</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;                                                              <span class="keyword">auto</span>&amp; w, <span class="keyword">auto</span>&amp; taus, <span class="keyword">auto</span>&amp; tiles) {</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;        const auto barrier_busy_wait = getReductionToBandBarrierBusyWait();</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;        const std::size_t batch_size = util::ceilDiv(tiles.size(), nthreads);</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        const std::size_t begin = index * batch_size;</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;        const std::size_t end = std::min(index * batch_size + batch_size, tiles.size());</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        const SizeType nrefls = taus.size().rows();</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160; </div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        if (index == 0) {</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;          w.resize(nthreads);</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;        }</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160; </div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;        for (SizeType j = 0; j &lt; nrefls; ++j) {</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;          <span class="comment">// STEP1: compute tau and reflector (single-thread)</span></div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;          <span class="keywordflow">if</span> (index == 0) {</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;            taus({j, 0}) = computeReflector(tiles, j);</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;          }</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160; </div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160; </div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;          <span class="comment">// STEP2a: compute w (multi-threaded)</span></div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;          <span class="keyword">const</span> SizeType pt_cols = cols - (j + 1);</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;          <span class="keywordflow">if</span> (pt_cols == 0)</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;            <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;          <span class="keyword">const</span> <span class="keywordtype">bool</span> has_head = (index == 0);</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160; </div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;          w[index] = common::internal::vector&lt;T&gt;(pt_cols, 0);</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;          computeWTrailingPanel(has_head, tiles, w[index], j, pt_cols, begin, end);</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160; </div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;          <span class="comment">// STEP2b: reduce w results (single-threaded)</span></div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;          <span class="keywordflow">if</span> (index == 0)</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;            dlaf::eigensolver::internal::reduceColumnVectors(w);</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160; </div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;          <span class="comment">// STEP3: update trailing panel (multi-threaded)</span></div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;          updateTrailingPanel(has_head, tiles, j, w[0], taus({j, 0}), begin, end);</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        }</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;      });</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;  ex::start_detached(std::move(s));</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;}</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160; </div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="keywordtype">void</span> setupReflectorPanelV(<span class="keywordtype">bool</span> has_head, <span class="keyword">const</span> matrix::SubPanelView&amp; panel_view, <span class="keyword">const</span> SizeType nrefls,</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;                          matrix::Panel&lt;Coord::Col, T, D&gt;&amp; v, matrix::Matrix&lt;const T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;                          <span class="keywordtype">bool</span> force_copy = <span class="keyword">false</span>) {</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160; </div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160; </div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;  <span class="comment">// Reflectors are stored in the lower triangular part of the A matrix leading to sharing memory</span></div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;  <span class="comment">// between reflectors and results, which are in the upper triangular part. The problem exists only</span></div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;  <span class="comment">// for the first tile (of the V, i.e. band excluded). Since refelectors will be used in next</span></div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  <span class="comment">// computations, they should be well-formed, i.e. a unit lower trapezoidal matrix. For this reason,</span></div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;  <span class="comment">// a support tile is used, where just the reflectors values are copied, the diagonal is set to 1</span></div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;  <span class="comment">// and the rest is zeroed out.</span></div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;  <span class="keyword">auto</span> it_begin = panel_view.iteratorLocal().begin();</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;  <span class="keyword">auto</span> it_end = panel_view.iteratorLocal().end();</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160; </div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;  <span class="keywordflow">if</span> (has_head) {</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    <span class="keyword">const</span> LocalTileIndex i = *it_begin;</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    matrix::SubTileSpec spec = panel_view(i);</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160; </div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;    <span class="comment">// If the number of reflectors are limited by height (|reflector| &gt; 1), the panel is narrower than</span></div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;    <span class="comment">// the blocksize, leading to just using a part of A (first full nrefls columns)</span></div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    spec.size = {spec.size.rows(), std::min(nrefls, spec.size.cols())};</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160; </div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    <span class="comment">// copy + laset is done in two independent tasks, but it could be theoretically merged to into a</span></div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    <span class="comment">// single task doing both.</span></div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> p = <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high);</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(<a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(mat_a.read(i), spec), v.readwrite(i)) |</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                       matrix::copy(p));</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(blas::Uplo::Upper, T(0), T(1), v.readwrite(i)) |</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;                       tile::laset(p));</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160; </div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    ++it_begin;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  }</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160; </div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;  <span class="comment">// The rest of the V panel of reflectors can just point to the values in A, since they are</span></div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;  <span class="comment">// well formed in-place.</span></div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> it = it_begin; it &lt; it_end; ++it) {</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;    <span class="keyword">const</span> LocalTileIndex idx = *it;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;    <span class="keyword">const</span> matrix::SubTileSpec&amp; spec = panel_view(idx);</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160; </div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;    <span class="comment">// Note:  This is a workaround for the deadlock problem with sub-tiles.</span></div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;    <span class="comment">//        Without this copy, during matrix update the same tile would get accessed at the same</span></div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;    <span class="comment">//        time both in readonly mode (for reflectors) and in readwrite mode (for updating the</span></div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;    <span class="comment">//        matrix). This would result in a deadlock, so instead of linking the panel to an external</span></div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;    <span class="comment">//        tile, memory provided internally by the panel is used as support. In this way, the two</span></div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;    <span class="comment">//        subtiles used in the operation belong to different tiles.</span></div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="keywordflow">if</span> (force_copy)</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;      ex::start_detached(ex::when_all(matrix::splitTile(mat_a.read(idx), spec), v.readwrite(idx)) |</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;                         matrix::copy(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;    <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;      v.setTile(idx, matrix::splitTile(mat_a.read(idx), spec));</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;  }</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;}</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160; </div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;<span class="keywordtype">void</span> trmmComputeW(matrix::Panel&lt;Coord::Col, T, D&gt;&amp; w, matrix::Panel&lt;Coord::Col, T, D&gt;&amp; v,</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;                  matrix::ReadOnlyTileSender&lt;T, D&gt; tile_t) {</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160; </div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160; </div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;  <span class="keyword">auto</span> it = w.iteratorLocal();</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160; </div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_i : it) {</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(Side::Right, Uplo::Upper, Op::NoTrans, Diag::NonUnit,</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;                                                   T(1), tile_t, v.read(index_i), w.readwrite(index_i)) |</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;                       tile::trmm3(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;  }</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160; </div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;  <span class="keywordflow">if</span> (it.empty()) {</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;    ex::start_detached(std::move(tile_t));</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;  }</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;}</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160; </div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;<span class="keywordtype">void</span> gemmUpdateX(matrix::Panel&lt;Coord::Col, T, D&gt;&amp; x, matrix::Matrix&lt;const T, D&gt;&amp; w2,</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;                 matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; v) {</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160; </div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160; </div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;  <span class="comment">// GEMM X = X - 0.5 . V . W2</span></div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_i : v.iteratorLocal())</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(Op::NoTrans, Op::NoTrans, T(-0.5), v.read(index_i),</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;                                                   w2.read(LocalTileIndex(0, 0)), T(1),</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;                                                   x.readwrite(index_i)) |</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;                       tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;}</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160; </div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;<span class="keywordtype">void</span> hemmComputeX(matrix::Panel&lt;Coord::Col, T, D&gt;&amp; x, <span class="keyword">const</span> matrix::SubMatrixView&amp; view,</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;                  matrix::Matrix&lt;const T, D&gt;&amp; a, matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; w) {</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160; </div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160; </div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160; </div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  <span class="comment">// They have to be set to zero, because all tiles are going to be reduced, and some tiles may not get</span></div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;  <span class="comment">// &quot;initialized&quot; during computation, so they should not contribute with any spurious value to the final</span></div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;  <span class="comment">// result.</span></div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;  matrix::util::set0&lt;B&gt;(thread_priority::high, x);</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160; </div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_offset = view.begin();</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160; </div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_offset.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = i + 1;</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;    <span class="keywordflow">for</span> (SizeType j = limit - 1; j &gt;= at_offset.col(); --j) {</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij{i, j};</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160; </div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160; </div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile_a = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.read(ij), view(ij));</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160; </div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;        hemmDiag&lt;B&gt;(thread_priority::high, tile_a, w.read(ij), x.readwrite(ij));</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;      }</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;        <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        <span class="comment">// Because A is hermitian and just the lower part contains the data, for each a(ij) not</span></div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;        <span class="comment">// on the diagonal, two computations are done:</span></div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;        <span class="comment">// - using a(ij) in its position;</span></div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;        <span class="comment">// - using a(ij) in its &quot;transposed&quot; position (applying the ConjTrans to its data)</span></div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160; </div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;        {</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_x(Coord::Row, ij.row());</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_w(Coord::Row, ij.col());</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;          hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::NoTrans, tile_a, w.read(index_w),</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;                         x.readwrite(index_x));</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;        }</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160; </div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;        {</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_pretended = <a class="code" href="index2d_8h.html#a024753ac73fbefa174548c575327862b">transposed</a>(ij);</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_x(Coord::Row, index_pretended.row());</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;          <span class="keyword">const</span> LocalTileIndex index_w(Coord::Row, index_pretended.col());</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;          hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::ConjTrans, tile_a, w.read(index_w),</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;                         x.readwrite(index_x));</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;        }</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;      }</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;    }</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;  }</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;}</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160; </div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;<span class="keywordtype">void</span> gemmComputeW2(matrix::Matrix&lt;T, D&gt;&amp; w2, matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; w,</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;                   matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; x) {</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160; </div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160; </div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;  <span class="comment">// Not all ranks in the column always hold at least a tile in the panel Ai, but all ranks in</span></div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;  <span class="comment">// the column are going to participate to the reduce. For them, it is important to set the</span></div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;  <span class="comment">// partial result W2 to zero.</span></div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;  ex::start_detached(w2.readwrite(LocalTileIndex(0, 0)) |</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;                     tile::set0(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160; </div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;  <span class="comment">// GEMM W2 = W* . X</span></div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_tile : w.iteratorLocal())</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;    ex::start_detached(dlaf::internal::whenAllLift(Op::ConjTrans, Op::NoTrans, T(1), w.read(index_tile),</div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;                                                   x.read(index_tile), T(1),</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;                                                   w2.readwrite(LocalTileIndex(0, 0))) |</div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;                       tile::gemm(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;B&gt;</a>(thread_priority::high)));</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;}</div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160; </div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;<span class="keywordtype">void</span> her2kUpdateTrailingMatrix(<span class="keyword">const</span> matrix::SubMatrixView&amp; view, matrix::Matrix&lt;T, D&gt;&amp; a,</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; x,</div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; v) {</div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;  static_assert(std::is_signed_v&lt;BaseType&lt;T&gt;&gt;, <span class="stringliteral">&quot;alpha in computations requires to be -1&quot;</span>);</div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160; </div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160; </div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160; </div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_start = view.begin();</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160; </div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_start.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = dist.template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;        dist.template globalTileFromLocalTile&lt;Coord::Row&gt;(i) + 1);</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;    <span class="keywordflow">for</span> (SizeType j = at_start.col(); j &lt; limit; ++j) {</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_local{i, j};</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij = dist.globalTileIndex(ij_local);</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160; </div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160; </div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;      <span class="keyword">auto</span> getSubA = [&amp;a, &amp;view, ij_local]() {</div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.readwrite(ij_local), view(ij_local));</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;      };</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160; </div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;      <span class="comment">// The first column of the trailing matrix (except for the very first global tile) has to be</span></div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;      <span class="comment">// updated first, in order to unlock the next iteration as soon as possible.</span></div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> priority = (j == at_start.col()) ? thread_priority::high : thread_priority::normal;</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160; </div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        her2kDiag&lt;B&gt;(priority, v.read(ij_local), x.read(ij_local), getSubA());</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;      }</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        <span class="comment">// A -= X . V*</span></div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;        her2kOffDiag&lt;B&gt;(priority, x.read(ij_local), v.read(<a class="code" href="index2d_8h.html#a024753ac73fbefa174548c575327862b">transposed</a>(ij_local)), getSubA());</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160; </div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        <span class="comment">// A -= V . X*</span></div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        her2kOffDiag&lt;B&gt;(priority, v.read(ij_local), x.read(<a class="code" href="index2d_8h.html#a024753ac73fbefa174548c575327862b">transposed</a>(ij_local)), getSubA());</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;      }</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;    }</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;  }</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;}</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160; </div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;}</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160; </div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;<span class="keyword">namespace </span>distributed {</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;T computeReflector(<span class="keyword">const</span> <span class="keywordtype">bool</span> has_head, comm::Communicator&amp; communicator,</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;                   <span class="keyword">const</span> std::vector&lt;matrix::Tile&lt;T, D&gt;&gt;&amp; panel, SizeType j) {</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;  std::array&lt;T, 2&gt; x0_and_squares = computeX0AndSquares(has_head, panel, j);</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160; </div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;  <span class="comment">// This is an optimization for grouping two separate low bandwidth communications, respectively</span></div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;  <span class="comment">// bcast(x0) and reduce(norm), where the latency was degrading performances.</span></div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;  <span class="comment">// In particular this allReduce allows to:</span></div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;  <span class="comment">// - bcast x0, since for all ranks is 0 and just the root rank has the real value;</span></div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;  <span class="comment">// - allReduce squares for the norm computation.</span></div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;  <span class="comment">// Moreover, by all-reducing squares and broadcasting x0, all ranks have all the information to</span></div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;  <span class="comment">// update locally the reflectors (section they have). This is more efficient than computing params</span></div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;  <span class="comment">// (e.g. norm, y, tau) just on the root rank and then having to broadcast them (i.e. additional</span></div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;  <span class="comment">// communication).</span></div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;  comm::sync::allReduceInPlace(communicator, MPI_SUM,</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;                               common::make_data(x0_and_squares.data(),</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;                                                 <a class="code" href="types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9">to_SizeType</a>(x0_and_squares.size())));</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160; </div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;  <span class="keyword">auto</span> tau = computeReflectorAndTau(has_head, panel, j, std::move(x0_and_squares));</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160; </div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;  <span class="keywordflow">return</span> tau;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;}</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160; </div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLikeA, <span class="keyword">class</span> MatrixLikeTaus, <span class="keyword">class</span> TriggerSender, <span class="keyword">class</span> CommSender&gt;</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;<span class="keywordtype">void</span> computePanelReflectors(TriggerSender&amp;&amp; trigger, comm::IndexT_MPI rank_v0,</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;                            CommSender&amp;&amp; mpi_col_chain_panel, MatrixLikeA&amp; mat_a,</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;                            MatrixLikeTaus&amp; mat_taus, SizeType j_sub,</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;                            <span class="keyword">const</span> matrix::SubPanelView&amp; panel_view) {</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;  <span class="keyword">static</span> Device constexpr D = MatrixLikeA::device;</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;  <span class="keyword">using</span> T = <span class="keyword">typename</span> MatrixLikeA::ElementType;</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;  <span class="keyword">namespace </span>di = dlaf::internal;</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160; </div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;  std::vector&lt;matrix::ReadWriteTileSender&lt;T, D&gt;&gt; panel_tiles;</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;  panel_tiles.reserve(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(std::distance(panel_view.iteratorLocal().begin(),</div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;                                             panel_view.iteratorLocal().end())));</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.iteratorLocal()) {</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;    <span class="keyword">const</span> matrix::SubTileSpec&amp; spec = panel_view(i);</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;    panel_tiles.emplace_back(matrix::splitTile(mat_a.readwrite(i), spec));</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;  }</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160; </div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;  <span class="keyword">const</span> std::size_t nthreads = getReductionToBandPanelNWorkers();</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;  <span class="keyword">auto</span> s =</div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;      ex::when_all(ex::just(std::make_unique&lt;pika::barrier&lt;&gt;&gt;(nthreads),</div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;                            std::vector&lt;common::internal::vector&lt;T&gt;&gt;{}),  <span class="comment">// w (internally required)</span></div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;                   mat_taus.readwrite(GlobalTileIndex(j_sub, 0)),</div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;                   ex::when_all_vector(std::move(panel_tiles)),</div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;                   std::forward&lt;CommSender&gt;(mpi_col_chain_panel), std::forward&lt;TriggerSender&gt;(trigger)) |</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;      ex::transfer(di::getBackendScheduler&lt;Backend::MC&gt;(pika::execution::thread_priority::high)) |</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;      ex::bulk(nthreads, [nthreads, rank_v0,</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;                          cols = panel_view.cols()](<span class="keyword">const</span> std::size_t index, <span class="keyword">auto</span>&amp; barrier_ptr, <span class="keyword">auto</span>&amp; w,</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;                                                    <span class="keyword">auto</span>&amp; taus, <span class="keyword">auto</span>&amp; tiles, <span class="keyword">auto</span>&amp;&amp; pcomm) {</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;        const bool rankHasHead = rank_v0 == pcomm.get().rank();</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160; </div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;        const auto barrier_busy_wait = getReductionToBandBarrierBusyWait();</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;        const std::size_t batch_size = util::ceilDiv(tiles.size(), nthreads);</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;        const std::size_t begin = index * batch_size;</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;        const std::size_t end = std::min(index * batch_size + batch_size, tiles.size());</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;        const SizeType nrefls = taus.size().rows();</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160; </div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;        if (index == 0) {</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;          w.resize(nthreads);</div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;        }</div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160; </div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;        for (SizeType j = 0; j &lt; nrefls; ++j) {</div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;          <span class="comment">// STEP1: compute tau and reflector (single-thread)</span></div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;          <span class="keywordflow">if</span> (index == 0) {</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">bool</span> has_head = rankHasHead;</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;            taus({j, 0}) = computeReflector(has_head, pcomm.get(), tiles, j);</div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;          }</div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160; </div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;          <span class="comment">// STEP2a: compute w (multi-threaded)</span></div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;          <span class="keyword">const</span> SizeType pt_cols = cols - (j + 1);</div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;          <span class="keywordflow">if</span> (pt_cols == 0)</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;            <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160; </div>
+<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;          <span class="keyword">const</span> <span class="keywordtype">bool</span> has_head = rankHasHead &amp;&amp; (index == 0);</div>
+<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160; </div>
+<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;          w[index] = common::internal::vector&lt;T&gt;(pt_cols, 0);</div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;          computeWTrailingPanel(has_head, tiles, w[index], j, pt_cols, begin, end);</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160; </div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;          <span class="comment">// STEP2b: reduce w results (single-threaded)</span></div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;          <span class="keywordflow">if</span> (index == 0) {</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;            dlaf::eigensolver::internal::reduceColumnVectors(w);</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;            comm::sync::allReduceInPlace(pcomm.get(), MPI_SUM, common::make_data(w[0].data(), pt_cols));</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;          }</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160; </div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;          <span class="comment">// STEP3: update trailing panel (multi-threaded)</span></div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;          updateTrailingPanel(has_head, tiles, j, w[0], taus({j, 0}), begin, end);</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;          barrier_ptr-&gt;arrive_and_wait(barrier_busy_wait);</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;        }</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;      });</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;  ex::start_detached(std::move(s));</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;}</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160; </div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;<span class="keywordtype">void</span> hemmComputeX(comm::IndexT_MPI reducer_col, matrix::Panel&lt;Coord::Col, T, D&gt;&amp; x,</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;                  matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&amp; xt,</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;                  <span class="keyword">const</span> matrix::SubMatrixView&amp; view, matrix::Matrix&lt;const T, D&gt;&amp; a,</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;                  matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; w,</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;                  matrix::Panel&lt;Coord::Row, const T, D, matrix::StoreTransposed::Yes&gt;&amp; wt,</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;                  common::Pipeline&lt;comm::Communicator&gt;&amp; mpi_row_chain,</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;                  common::Pipeline&lt;comm::Communicator&gt;&amp; mpi_col_chain) {</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160; </div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160; </div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> rank = dist.rankIndex();</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160; </div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;  <span class="comment">// They have to be set to zero, because all tiles are going to be reduced, and some tiles may not get</span></div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;  <span class="comment">// &quot;initialized&quot; during computation, so they should not contribute with any spurious value to the final</span></div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;  <span class="comment">// result.</span></div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;  matrix::util::set0&lt;B&gt;(thread_priority::high, x);</div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;  matrix::util::set0&lt;B&gt;(thread_priority::high, xt);</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160; </div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_offset = view.begin();</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160; </div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_offset.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = dist.template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;        dist.template globalTileFromLocalTile&lt;Coord::Row&gt;(i) + 1);</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;    <span class="keywordflow">for</span> (SizeType j = limit - 1; j &gt;= at_offset.col(); --j) {</div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_local{i, j};</div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij = dist.globalTileIndex(ij_local);</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160; </div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160; </div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;      <span class="keyword">auto</span> tile_a = <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.read(ij), view(ij_local));</div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160; </div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;        hemmDiag&lt;B&gt;(thread_priority::high, std::move(tile_a), w.read(ij_local), x.readwrite(ij_local));</div>
+<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;      }</div>
+<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;        <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;        <span class="comment">// Since it is not a diagonal tile, otherwise it would have been managed in the previous</span></div>
+<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;        <span class="comment">// branch, the second operand is not available in W but it is accessible through the</span></div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;        <span class="comment">// support panel Wt.</span></div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;        <span class="comment">// However, since we are still computing the &quot;straight&quot; part, the result can be stored</span></div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;        <span class="comment">// in the &quot;local&quot; panel X.</span></div>
+<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;        hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::NoTrans, tile_a, wt.read(ij_local),</div>
+<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;                       x.readwrite(ij_local));</div>
+<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160; </div>
+<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;        <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;        <span class="comment">// Here we are considering the hermitian part of A, so coordinates have to be &quot;mirrored&quot;.</span></div>
+<div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;        <span class="comment">// So, first step is identifying the mirrored cell coordinate, i.e. swap row/col, together</span></div>
+<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;        <span class="comment">// with realizing if the new coord lays on an owned row or not.</span></div>
+<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;        <span class="comment">// If yes, the result can be stored in the X, otherwise Xt support panel will be used.</span></div>
+<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;        <span class="comment">// For what concerns the second operand, it can be found for sure in W. In fact, the</span></div>
+<div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;        <span class="comment">// multiplication requires matching col(A) == row(W), but since coordinates are mirrored,</span></div>
+<div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;        <span class="comment">// we are matching row(A) == row(W), so it is local by construction.</span></div>
+<div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> owner = dist.template rankGlobalTile&lt;Coord::Row&gt;(ij.col());</div>
+<div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160; </div>
+<div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;        <span class="keyword">const</span> LocalTileIndex index_x{dist.template localTileFromGlobalTile&lt;Coord::Row&gt;(ij.col()), 0};</div>
+<div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;        <span class="keyword">const</span> LocalTileIndex index_xt{0, ij_local.col()};</div>
+<div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160; </div>
+<div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;        <span class="keyword">auto</span> tile_x = (dist.rankIndex().row() == owner) ? x.readwrite(index_x) : xt.readwrite(index_xt);</div>
+<div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160; </div>
+<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;        hemmOffDiag&lt;B&gt;(thread_priority::high, blas::Op::ConjTrans, std::move(tile_a), w.read(ij_local),</div>
+<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;                       std::move(tile_x));</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;      }</div>
+<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;    }</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;  }</div>
+<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160; </div>
+<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;  <span class="comment">// At this point, partial results of X and Xt are available in the panels, and they have to be reduced,</span></div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;  <span class="comment">// both row-wise and col-wise.</span></div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;  <span class="comment">// The final X result will be available just on Ai panel column.</span></div>
+<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160; </div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;  <span class="comment">// The first step in reducing partial results distributed over X and Xt, it is to reduce the row</span></div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;  <span class="comment">// panel Xt col-wise, by collecting all Xt results on the rank which can &quot;mirror&quot; the result on its</span></div>
+<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;  <span class="comment">// rows (i.e. diagonal). So, for each tile of the row panel, select who is the &quot;diagonal&quot; rank that can</span></div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;  <span class="comment">// mirror and reduce on it.</span></div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_xt : xt.iteratorLocal()) {</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> index_k = dist.template globalTileFromLocalTile&lt;Coord::Col&gt;(index_xt.col());</div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> rank_owner_row = dist.template rankGlobalTile&lt;Coord::Row&gt;(index_k);</div>
+<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160; </div>
+<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;    <span class="keywordflow">if</span> (rank_owner_row == rank.row()) {</div>
+<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;      <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;      <span class="comment">// Since it is the owner, it has to perform the &quot;mirroring&quot; of the results from columns to</span></div>
+<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;      <span class="comment">// rows.</span></div>
+<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;      <span class="comment">//</span></div>
+<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;      <span class="comment">// Moreover, it reduces in place because the owner of the diagonal stores the partial result</span></div>
+<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;      <span class="comment">// directly in x (without using xt)</span></div>
+<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> i = dist.template localTileFromGlobalTile&lt;Coord::Row&gt;(index_k);</div>
+<div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;      ex::start_detached(comm::scheduleReduceRecvInPlace(mpi_col_chain(), MPI_SUM, x.readwrite({i, 0})));</div>
+<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;    }</div>
+<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;      ex::start_detached(comm::scheduleReduceSend(mpi_col_chain(), rank_owner_row, MPI_SUM,</div>
+<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;                                                  xt.read(index_xt)));</div>
+<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;    }</div>
+<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;  }</div>
+<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160; </div>
+<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;  <span class="comment">// At this point partial results are all collected in X (Xt has been embedded in previous step),</span></div>
+<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;  <span class="comment">// so the last step needed is to reduce these last partial results in the final results.</span></div>
+<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;  <span class="comment">// The result is needed just on the column with reflectors.</span></div>
+<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; index_x : x.iteratorLocal()) {</div>
+<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;    <span class="keywordflow">if</span> (reducer_col == rank.col())</div>
+<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;      ex::start_detached(comm::scheduleReduceRecvInPlace(mpi_row_chain(), MPI_SUM,</div>
+<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;                                                         x.readwrite(index_x)));</div>
+<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;    <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;      ex::start_detached(comm::scheduleReduceSend(mpi_row_chain(), reducer_col, MPI_SUM,</div>
+<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;                                                  x.read(index_x)));</div>
+<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;  }</div>
+<div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;}</div>
+<div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160; </div>
+<div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;<span class="keywordtype">void</span> her2kUpdateTrailingMatrix(<span class="keyword">const</span> matrix::SubMatrixView&amp; view, Matrix&lt;T, D&gt;&amp; a,</div>
+<div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; x,</div>
+<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;                               matrix::Panel&lt;Coord::Row, const T, D, matrix::StoreTransposed::Yes&gt;&amp; vt,</div>
+<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;                               matrix::Panel&lt;Coord::Col, const T, D&gt;&amp; v,</div>
+<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;                               matrix::Panel&lt;Coord::Row, const T, D, matrix::StoreTransposed::Yes&gt;&amp; xt) {</div>
+<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;  static_assert(std::is_signed_v&lt;BaseType&lt;T&gt;&gt;, <span class="stringliteral">&quot;alpha in computations requires to be -1&quot;</span>);</div>
+<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160; </div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;  <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160; </div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist = a.distribution();</div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160; </div>
+<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;  <span class="keyword">const</span> LocalTileIndex at_start = view.begin();</div>
+<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160; </div>
+<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;  <span class="keywordflow">for</span> (SizeType i = at_start.row(); i &lt; dist.localNrTiles().rows(); ++i) {</div>
+<div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> limit = dist.template nextLocalTileFromGlobalTile&lt;Coord::Col&gt;(</div>
+<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;        dist.template globalTileFromLocalTile&lt;Coord::Row&gt;(i) + 1);</div>
+<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;    <span class="keywordflow">for</span> (SizeType j = at_start.col(); j &lt; limit; ++j) {</div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;      <span class="keyword">const</span> LocalTileIndex ij_local{i, j};</div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;      <span class="keyword">const</span> GlobalTileIndex ij = dist.globalTileIndex(ij_local);</div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160; </div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;      <span class="keyword">const</span> <span class="keywordtype">bool</span> is_diagonal_tile = (ij.row() == ij.col());</div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160; </div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;      <span class="keyword">auto</span> getSubA = [&amp;a, &amp;view, ij_local]() {</div>
+<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">splitTile</a>(a.readwrite(ij_local), view(ij_local));</div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;      };</div>
+<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160; </div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;      <span class="comment">// The first column of the trailing matrix (except for the very first global tile) has to be</span></div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;      <span class="comment">// updated first, in order to unlock the next iteration as soon as possible.</span></div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> priority = (j == at_start.col()) ? thread_priority::high : thread_priority::normal;</div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160; </div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;      <span class="keywordflow">if</span> (is_diagonal_tile) {</div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;        her2kDiag&lt;B&gt;(priority, v.read(ij_local), x.read(ij_local), getSubA());</div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;      }</div>
+<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;        <span class="comment">// A -= X . V*</span></div>
+<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;        her2kOffDiag&lt;B&gt;(priority, x.read(ij_local), vt.read(ij_local), getSubA());</div>
+<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160; </div>
+<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;        <span class="comment">// A -= V . X*</span></div>
+<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;        her2kOffDiag&lt;B&gt;(priority, v.read(ij_local), xt.read(ij_local), getSubA());</div>
+<div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;      }</div>
+<div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;    }</div>
+<div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;  }</div>
+<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;}</div>
 <div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;}</div>
-<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;}</div>
-<div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160; </div>
-<div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00826"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">  826</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>;</div>
-<div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160; </div>
-<div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00829"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">  829</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>&lt;Backend::MC, Device::CPU, T&gt; {</div>
-<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>(<span class="keyword">const</span> std::size_t, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>) {}</div>
-<div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160; </div>
-<div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;  <span class="keywordtype">void</span> call(Matrix&lt;T, Device::CPU&gt;&amp; mat_a, <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix&lt;T, Device::CPU&gt;</a>&amp; mat_taus,</div>
-<div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;            <span class="keyword">const</span> SizeType j_sub, <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
-<div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;    <span class="keyword">using</span> red2band::local::computePanelReflectors;</div>
-<div class="line"><a name="l00835"></a><span class="lineno">  835</span>&#160;    computePanelReflectors(mat_a, mat_taus, j_sub, panel_view);</div>
-<div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160;  }</div>
-<div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160; </div>
-<div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;  <span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> CommSender, <span class="keyword">class</span> TriggerSender&gt;</div>
-<div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160;  <span class="keywordtype">void</span> call(TriggerSender&amp;&amp; trigger, <a class="code" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender&amp;&amp; mpi_col_chain_panel,</div>
-<div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;            Matrix&lt;T, D&gt;&amp; mat_a, <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix&lt;T, Device::CPU&gt;</a>&amp; mat_taus, <span class="keyword">const</span> SizeType j_sub,</div>
-<div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;            <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
-<div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;    <span class="keyword">using</span> red2band::distributed::computePanelReflectors;</div>
-<div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;    computePanelReflectors(std::forward&lt;TriggerSender&gt;(trigger), rank_v0,</div>
-<div class="line"><a name="l00844"></a><span class="lineno">  844</span>&#160;                           std::forward&lt;CommSender&gt;(mpi_col_chain_panel), mat_a, mat_taus, j_sub,</div>
-<div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;                           panel_view);</div>
-<div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;  }</div>
-<div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160;};</div>
-<div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160; </div>
-<div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
-<div class="line"><a name="l00850"></a><span class="lineno">  850</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00851"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">  851</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>&lt;Backend::GPU, Device::GPU, T&gt; {</div>
-<div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>(<span class="keyword">const</span> std::size_t n_workspaces, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_a)</div>
-<div class="line"><a name="l00853"></a><span class="lineno">  853</span>&#160;      : panels_v(n_workspaces, dist_a) {}</div>
-<div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160; </div>
-<div class="line"><a name="l00855"></a><span class="lineno">  855</span>&#160;  <span class="keywordtype">void</span> call(Matrix&lt;T, Device::GPU&gt;&amp; mat_a, <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix&lt;T, Device::CPU&gt;</a>&amp; mat_taus,</div>
-<div class="line"><a name="l00856"></a><span class="lineno">  856</span>&#160;            <span class="keyword">const</span> SizeType j_sub, <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
-<div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;    <span class="keyword">using</span> red2band::local::computePanelReflectors;</div>
-<div class="line"><a name="l00858"></a><span class="lineno">  858</span>&#160; </div>
-<div class="line"><a name="l00859"></a><span class="lineno">  859</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160; </div>
-<div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00862"></a><span class="lineno">  862</span>&#160;    <span class="comment">// - copy panel_view from GPU to CPU</span></div>
-<div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;    <span class="comment">// - computePanelReflectors on CPU (on a matrix like, with just a panel)</span></div>
-<div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160;    <span class="comment">// - copy back matrix &quot;panel&quot; from CPU to GPU</span></div>
-<div class="line"><a name="l00865"></a><span class="lineno">  865</span>&#160; </div>
-<div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;    <span class="keyword">auto</span>&amp; v = panels_v.nextResource();</div>
-<div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160; </div>
-<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;    copyToCPU(panel_view, mat_a, v);</div>
-<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;    computePanelReflectors(v, mat_taus, j_sub, panel_view);</div>
-<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;    copyFromCPU(panel_view, v, mat_a);</div>
-<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;  }</div>
-<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160; </div>
-<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;  <span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> CommSender, <span class="keyword">class</span> TriggerSender&gt;</div>
-<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;  <span class="keywordtype">void</span> call(TriggerSender&amp;&amp; trigger, <a class="code" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender&amp;&amp; mpi_col_chain_panel,</div>
-<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;            Matrix&lt;T, D&gt;&amp; mat_a, <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix&lt;T, Device::CPU&gt;</a>&amp; mat_taus, SizeType j_sub,</div>
-<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;            <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
-<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;    <span class="keyword">auto</span>&amp; v = panels_v.nextResource();</div>
-<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160; </div>
-<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;    <span class="comment">// copy to CPU</span></div>
-<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;    copyToCPU(panel_view, mat_a, v);</div>
-<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160; </div>
-<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;    <span class="comment">// compute on CPU</span></div>
-<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;    <span class="keyword">using</span> dlaf::eigensolver::internal::red2band::distributed::computePanelReflectors;</div>
-<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;    computePanelReflectors(std::forward&lt;TriggerSender&gt;(trigger), rank_v0,</div>
-<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;                           std::forward&lt;CommSender&gt;(mpi_col_chain_panel), v, mat_taus, j_sub,</div>
-<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;                           panel_view);</div>
-<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160; </div>
-<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;    <span class="comment">// copy back to GPU</span></div>
-<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;    copyFromCPU(panel_view, v, mat_a);</div>
-<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;  }</div>
-<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160; </div>
-<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&gt; panels_v;</div>
-<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160; </div>
-<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;  <span class="keywordtype">void</span> copyToCPU(<span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> panel_view, <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, Device::GPU&gt;</a>&amp; mat_a,</div>
-<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;                 <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&amp; v) {</div>
-<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160; </div>
-<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;    <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
-<div class="line"><a name="l00900"></a><span class="lineno">  900</span>&#160;    <span class="keyword">using</span> dlaf::matrix::internal::CopyBackend_v;</div>
-<div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160;    <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160; </div>
-<div class="line"><a name="l00903"></a><span class="lineno">  903</span>&#160;    <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.<a class="code" href="structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad">iteratorLocal</a>()) {</div>
-<div class="line"><a name="l00904"></a><span class="lineno">  904</span>&#160;      <span class="keyword">auto</span> spec = panel_view(i);</div>
-<div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;      <span class="keyword">auto</span> tmp_tile = v.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(i);</div>
-<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;      ex::start_detached(</div>
-<div class="line"><a name="l00907"></a><span class="lineno">  907</span>&#160;          ex::when_all(splitTile(mat_a.read(i), spec), splitTile(std::move(tmp_tile), spec)) |</div>
-<div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;          matrix::copy(Policy&lt;CopyBackend_v&lt;Device::GPU, Device::CPU&gt;&gt;(thread_priority::high)));</div>
-<div class="line"><a name="l00909"></a><span class="lineno">  909</span>&#160;    }</div>
-<div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160;  }</div>
-<div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160; </div>
-<div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;  <span class="keywordtype">void</span> copyFromCPU(<span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> panel_view, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&amp; v,</div>
-<div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;                   <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, Device::GPU&gt;</a>&amp; mat_a) {</div>
-<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160; </div>
-<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;    <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
-<div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;    <span class="keyword">using</span> dlaf::matrix::internal::CopyBackend_v;</div>
-<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160;    <span class="keyword">using</span> pika::execution::thread_priority;</div>
-<div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160; </div>
-<div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;    <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.<a class="code" href="structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad">iteratorLocal</a>()) {</div>
-<div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;      <span class="keyword">auto</span> spec = panel_view(i);</div>
-<div class="line"><a name="l00922"></a><span class="lineno">  922</span>&#160;      <span class="keyword">auto</span> tile_a = mat_a.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(i);</div>
-<div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;      ex::start_detached(</div>
-<div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;          ex::when_all(splitTile(v.read(i), spec), splitTile(std::move(tile_a), spec)) |</div>
-<div class="line"><a name="l00925"></a><span class="lineno">  925</span>&#160;          matrix::copy(Policy&lt;CopyBackend_v&lt;Device::CPU, Device::GPU&gt;&gt;(thread_priority::high)));</div>
-<div class="line"><a name="l00926"></a><span class="lineno">  926</span>&#160;    }</div>
-<div class="line"><a name="l00927"></a><span class="lineno">  927</span>&#160;  }</div>
-<div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160;};</div>
-<div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160; </div>
-<div class="line"><a name="l00931"></a><span class="lineno">  931</span>&#160;}</div>
-<div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160; </div>
-<div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;<span class="comment">// Local implementation of reduction to band</span></div>
-<div class="line"><a name="l00934"></a><span class="lineno">  934</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00935"></a><span class="lineno">  935</span>&#160;Matrix&lt;T, Device::CPU&gt; <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">ReductionToBand&lt;B, D, T&gt;::call</a>(Matrix&lt;T, D&gt;&amp; mat_a, <span class="keyword">const</span> SizeType band_size) {</div>
-<div class="line"><a name="l00936"></a><span class="lineno">  936</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>;</div>
-<div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160;  <span class="keyword">using</span> <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">dlaf::matrix::Panel</a>;</div>
-<div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160; </div>
-<div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160;  <span class="keyword">using namespace </span>red2band::local;</div>
-<div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160; </div>
-<div class="line"><a name="l00941"></a><span class="lineno">  941</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
-<div class="line"><a name="l00942"></a><span class="lineno">  942</span>&#160;  <span class="keyword">using</span> factorization::internal::computeTFactor;</div>
-<div class="line"><a name="l00943"></a><span class="lineno">  943</span>&#160; </div>
-<div class="line"><a name="l00944"></a><span class="lineno">  944</span>&#160;  <span class="keyword">using</span> pika::execution::experimental::any_sender;</div>
-<div class="line"><a name="l00945"></a><span class="lineno">  945</span>&#160; </div>
-<div class="line"><a name="l00946"></a><span class="lineno">  946</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist_a = mat_a.distribution();</div>
-<div class="line"><a name="l00947"></a><span class="lineno">  947</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist({mat_a.size().rows(), band_size},</div>
-<div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160;                                  {dist_a.blockSize().rows(), band_size});</div>
-<div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160; </div>
-<div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;  <span class="comment">// Reflector of size = 1 is not considered whatever T is (i.e. neither real nor complex)</span></div>
-<div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160;  <span class="keyword">const</span> SizeType nrefls = std::max&lt;SizeType&gt;(0, dist_a.size().rows() - band_size - 1);</div>
-<div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160; </div>
-<div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;  <span class="comment">// Row-vector that is distributed over columns, but exists locally on all rows of the grid</span></div>
-<div class="line"><a name="l00955"></a><span class="lineno">  955</span>&#160;  DLAF_ASSERT(mat_a.blockSize().cols() % band_size == 0, mat_a.blockSize().cols(), band_size);</div>
-<div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;  Matrix&lt;T, Device::CPU&gt; mat_taus(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>(nrefls, 1),</div>
-<div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat_a.blockSize().cols(), 1),</div>
-<div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">comm::Size2D</a>(mat_a.commGridSize().cols(), 1),</div>
-<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>(mat_a.rankIndex().col(), 0),</div>
-<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>(mat_a.sourceRankIndex().col(), 0)));</div>
-<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160; </div>
-<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;  <span class="keywordflow">if</span> (nrefls == 0)</div>
-<div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;    <span class="keywordflow">return</span> mat_taus;</div>
-<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160; </div>
-<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix&lt;T, Device::CPU&gt;</a> mat_taus_retiled(</div>
-<div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160;      mat_taus, <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>(mat_a.blockSize().cols() / band_size, 1));</div>
-<div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160; </div>
-<div class="line"><a name="l00968"></a><span class="lineno">  968</span>&#160;  <span class="keyword">const</span> SizeType ntiles = (nrefls - 1) / band_size + 1;</div>
-<div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160;  DLAF_ASSERT(ntiles == mat_taus_retiled.nrTiles().rows(), ntiles, mat_taus_retiled.nrTiles().rows());</div>
-<div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160; </div>
-<div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;  <span class="keyword">const</span> <span class="keywordtype">bool</span> is_full_band = (band_size == dist_a.blockSize().cols());</div>
-<div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160; </div>
-<div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
-<div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;</a>&gt; panels_v(n_workspaces, dist);</div>
-<div class="line"><a name="l00975"></a><span class="lineno">  975</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;</a>&gt; panels_w(n_workspaces, dist);</div>
-<div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;</a>&gt; panels_x(n_workspaces, dist);</div>
-<div class="line"><a name="l00977"></a><span class="lineno">  977</span>&#160; </div>
-<div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00979"></a><span class="lineno">  979</span>&#160;  <span class="comment">// Here dist_a is given with full panel size instead of dist with just the part actually needeed,</span></div>
-<div class="line"><a name="l00980"></a><span class="lineno">  980</span>&#160;  <span class="comment">// because the GPU Helper internally exploits Panel data-structure. Indeed, the full size panel is</span></div>
-<div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;  <span class="comment">// needed in order to mimick Matrix with Panel, so it is possible to apply a SubPanelView to it.</span></div>
-<div class="line"><a name="l00982"></a><span class="lineno">  982</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00983"></a><span class="lineno">  983</span>&#160;  <span class="comment">// It is a bit hacky usage, because SubPanelView is not meant to be used with Panel, but just with</span></div>
-<div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;  <span class="comment">// Matrix. This results in a variable waste of memory, depending no the ratio band_size/nb.</span></div>
-<div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160;  red2band::ComputePanelHelper&lt;B, D, T&gt; compute_panel_helper(n_workspaces, dist_a);</div>
-<div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160; </div>
-<div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;  <span class="keywordflow">for</span> (SizeType j_sub = 0; j_sub &lt; ntiles; ++j_sub) {</div>
-<div class="line"><a name="l00988"></a><span class="lineno">  988</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> i_sub = j_sub + 1;</div>
-<div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160; </div>
-<div class="line"><a name="l00990"></a><span class="lineno">  990</span>&#160;    <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a> ij_offset(i_sub * band_size, j_sub * band_size);</div>
-<div class="line"><a name="l00991"></a><span class="lineno">  991</span>&#160; </div>
-<div class="line"><a name="l00992"></a><span class="lineno">  992</span>&#160;    <span class="keyword">const</span> SizeType nrefls_tile = mat_taus_retiled.tileSize(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>(j_sub, 0)).rows();</div>
-<div class="line"><a name="l00993"></a><span class="lineno">  993</span>&#160; </div>
-<div class="line"><a name="l00994"></a><span class="lineno">  994</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isPanelIncomplete = (nrefls_tile != band_size);</div>
-<div class="line"><a name="l00995"></a><span class="lineno">  995</span>&#160; </div>
-<div class="line"><a name="l00996"></a><span class="lineno">  996</span>&#160;    <span class="comment">// Note: if this is running, it must have at least one valid reflector (i.e. with size &gt; 1)</span></div>
-<div class="line"><a name="l00997"></a><span class="lineno">  997</span>&#160;    DLAF_ASSERT_HEAVY(nrefls_tile != 0, nrefls_tile);</div>
-<div class="line"><a name="l00998"></a><span class="lineno">  998</span>&#160; </div>
-<div class="line"><a name="l00999"></a><span class="lineno">  999</span>&#160;    <span class="comment">// Note:  SubPanelView is (at most) band_size wide, but it may contain a smaller number of</span></div>
-<div class="line"><a name="l01000"></a><span class="lineno"> 1000</span>&#160;    <span class="comment">//        reflectors (i.e. at the end when last reflector size is 1)</span></div>
-<div class="line"><a name="l01001"></a><span class="lineno"> 1001</span>&#160;    <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> panel_view(dist_a, ij_offset, band_size);</div>
-<div class="line"><a name="l01002"></a><span class="lineno"> 1002</span>&#160; </div>
-<div class="line"><a name="l01003"></a><span class="lineno"> 1003</span>&#160;    Panel&lt;Coord::Col, T, D&gt;&amp; v = panels_v.nextResource();</div>
-<div class="line"><a name="l01004"></a><span class="lineno"> 1004</span>&#160;    v.setRangeStart(ij_offset);</div>
-<div class="line"><a name="l01005"></a><span class="lineno"> 1005</span>&#160;    <span class="keywordflow">if</span> (isPanelIncomplete)</div>
-<div class="line"><a name="l01006"></a><span class="lineno"> 1006</span>&#160;      v.setWidth(nrefls_tile);</div>
-<div class="line"><a name="l01007"></a><span class="lineno"> 1007</span>&#160; </div>
-<div class="line"><a name="l01008"></a><span class="lineno"> 1008</span>&#160;    <span class="comment">// PANEL</span></div>
-<div class="line"><a name="l01009"></a><span class="lineno"> 1009</span>&#160;    compute_panel_helper.call(mat_a, mat_taus_retiled, j_sub, panel_view);</div>
-<div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160; </div>
-<div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01012"></a><span class="lineno"> 1012</span>&#160;    <span class="comment">// - has_reflector_head tells if this rank owns the first tile of the panel (being local, always true)</span></div>
-<div class="line"><a name="l01013"></a><span class="lineno"> 1013</span>&#160;    <span class="comment">// - if !is_full_band it has to force copy as a workaround, otherwise in update matrix it would deadlock</span></div>
-<div class="line"><a name="l01014"></a><span class="lineno"> 1014</span>&#160;    <span class="comment">// due to tile shared between panel and trailing matrix</span></div>
-<div class="line"><a name="l01015"></a><span class="lineno"> 1015</span>&#160;    constexpr <span class="keywordtype">bool</span> has_reflector_head = <span class="keyword">true</span>;</div>
-<div class="line"><a name="l01016"></a><span class="lineno"> 1016</span>&#160;    setupReflectorPanelV&lt;B, D, T&gt;(has_reflector_head, panel_view, nrefls_tile, v, mat_a, !is_full_band);</div>
-<div class="line"><a name="l01017"></a><span class="lineno"> 1017</span>&#160; </div>
-<div class="line"><a name="l01018"></a><span class="lineno"> 1018</span>&#160;    <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> t_idx(0, 0);</div>
-<div class="line"><a name="l01019"></a><span class="lineno"> 1019</span>&#160;    <span class="comment">// TODO used just by the column, maybe we can re-use a panel tile?</span></div>
-<div class="line"><a name="l01020"></a><span class="lineno"> 1020</span>&#160;    <span class="comment">// TODO probably the first one in any panel is ok?</span></div>
-<div class="line"><a name="l01021"></a><span class="lineno"> 1021</span>&#160;    Matrix&lt;T, D&gt; t({nrefls_tile, nrefls_tile}, dist.blockSize());</div>
-<div class="line"><a name="l01022"></a><span class="lineno"> 1022</span>&#160; </div>
-<div class="line"><a name="l01023"></a><span class="lineno"> 1023</span>&#160;    computeTFactor&lt;B&gt;(v, mat_taus_retiled.read(GlobalTileIndex(j_sub, 0)), t.readwrite(t_idx));</div>
-<div class="line"><a name="l01024"></a><span class="lineno"> 1024</span>&#160; </div>
-<div class="line"><a name="l01025"></a><span class="lineno"> 1025</span>&#160;    <span class="comment">// PREPARATION FOR TRAILING MATRIX UPDATE</span></div>
-<div class="line"><a name="l01026"></a><span class="lineno"> 1026</span>&#160;    <span class="keyword">const</span> GlobalElementIndex at_offset(ij_offset + GlobalElementSize(0, band_size));</div>
-<div class="line"><a name="l01027"></a><span class="lineno"> 1027</span>&#160; </div>
-<div class="line"><a name="l01028"></a><span class="lineno"> 1028</span>&#160;    <span class="comment">// Note: if there is no trailing matrix, algorithm has finised</span></div>
-<div class="line"><a name="l01029"></a><span class="lineno"> 1029</span>&#160;    <span class="keywordflow">if</span> (!at_offset.isIn(mat_a.size()))</div>
-<div class="line"><a name="l01030"></a><span class="lineno"> 1030</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l01031"></a><span class="lineno"> 1031</span>&#160; </div>
-<div class="line"><a name="l01032"></a><span class="lineno"> 1032</span>&#160;    <span class="keyword">const</span> matrix::SubMatrixView trailing_matrix_view(dist_a, at_offset);</div>
-<div class="line"><a name="l01033"></a><span class="lineno"> 1033</span>&#160; </div>
-<div class="line"><a name="l01034"></a><span class="lineno"> 1034</span>&#160;    <span class="comment">// W = V . T</span></div>
-<div class="line"><a name="l01035"></a><span class="lineno"> 1035</span>&#160;    Panel&lt;Coord::Col, T, D&gt;&amp; w = panels_w.nextResource();</div>
-<div class="line"><a name="l01036"></a><span class="lineno"> 1036</span>&#160;    w.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01037"></a><span class="lineno"> 1037</span>&#160;    <span class="keywordflow">if</span> (isPanelIncomplete)</div>
-<div class="line"><a name="l01038"></a><span class="lineno"> 1038</span>&#160;      w.setWidth(nrefls_tile);</div>
-<div class="line"><a name="l01039"></a><span class="lineno"> 1039</span>&#160; </div>
-<div class="line"><a name="l01040"></a><span class="lineno"> 1040</span>&#160;    trmmComputeW&lt;B&gt;(w, v, t.read(t_idx));</div>
-<div class="line"><a name="l01041"></a><span class="lineno"> 1041</span>&#160; </div>
-<div class="line"><a name="l01042"></a><span class="lineno"> 1042</span>&#160;    <span class="comment">// X = At . W</span></div>
-<div class="line"><a name="l01043"></a><span class="lineno"> 1043</span>&#160;    Panel&lt;Coord::Col, T, D&gt;&amp; x = panels_x.nextResource();</div>
-<div class="line"><a name="l01044"></a><span class="lineno"> 1044</span>&#160;    x.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01045"></a><span class="lineno"> 1045</span>&#160;    <span class="keywordflow">if</span> (isPanelIncomplete)</div>
-<div class="line"><a name="l01046"></a><span class="lineno"> 1046</span>&#160;      x.setWidth(nrefls_tile);</div>
-<div class="line"><a name="l01047"></a><span class="lineno"> 1047</span>&#160; </div>
-<div class="line"><a name="l01048"></a><span class="lineno"> 1048</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01049"></a><span class="lineno"> 1049</span>&#160;    <span class="comment">// Since At is hermitian, just the lower part is referenced.</span></div>
-<div class="line"><a name="l01050"></a><span class="lineno"> 1050</span>&#160;    <span class="comment">// When the tile is not part of the main diagonal, the same tile has to be used for two computations</span></div>
-<div class="line"><a name="l01051"></a><span class="lineno"> 1051</span>&#160;    <span class="comment">// that will contribute to two different rows of X: the ones indexed with row and col.</span></div>
-<div class="line"><a name="l01052"></a><span class="lineno"> 1052</span>&#160;    hemmComputeX&lt;B&gt;(x, trailing_matrix_view, mat_a, w);</div>
-<div class="line"><a name="l01053"></a><span class="lineno"> 1053</span>&#160; </div>
-<div class="line"><a name="l01054"></a><span class="lineno"> 1054</span>&#160;    <span class="comment">// In the next section the next two operations are performed</span></div>
-<div class="line"><a name="l01055"></a><span class="lineno"> 1055</span>&#160;    <span class="comment">// A) W2 = W* . X</span></div>
-<div class="line"><a name="l01056"></a><span class="lineno"> 1056</span>&#160;    <span class="comment">// B) X -= 1/2 . V . W2</span></div>
-<div class="line"><a name="l01057"></a><span class="lineno"> 1057</span>&#160; </div>
-<div class="line"><a name="l01058"></a><span class="lineno"> 1058</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01059"></a><span class="lineno"> 1059</span>&#160;    <span class="comment">// T can be re-used because it is not needed anymore in this step and it has the same shape</span></div>
-<div class="line"><a name="l01060"></a><span class="lineno"> 1060</span>&#160;    Matrix&lt;T, D&gt; w2 = std::move(t);</div>
-<div class="line"><a name="l01061"></a><span class="lineno"> 1061</span>&#160; </div>
-<div class="line"><a name="l01062"></a><span class="lineno"> 1062</span>&#160;    gemmComputeW2&lt;B&gt;(w2, w, x);</div>
-<div class="line"><a name="l01063"></a><span class="lineno"> 1063</span>&#160;    gemmUpdateX&lt;B&gt;(x, w2, v);</div>
-<div class="line"><a name="l01064"></a><span class="lineno"> 1064</span>&#160; </div>
-<div class="line"><a name="l01065"></a><span class="lineno"> 1065</span>&#160;    <span class="comment">// TRAILING MATRIX UPDATE</span></div>
-<div class="line"><a name="l01066"></a><span class="lineno"> 1066</span>&#160; </div>
-<div class="line"><a name="l01067"></a><span class="lineno"> 1067</span>&#160;    <span class="comment">// At -= X . V* + V . X*</span></div>
-<div class="line"><a name="l01068"></a><span class="lineno"> 1068</span>&#160;    her2kUpdateTrailingMatrix&lt;B&gt;(trailing_matrix_view, mat_a, x, v);</div>
-<div class="line"><a name="l01069"></a><span class="lineno"> 1069</span>&#160; </div>
-<div class="line"><a name="l01070"></a><span class="lineno"> 1070</span>&#160;    x.reset();</div>
-<div class="line"><a name="l01071"></a><span class="lineno"> 1071</span>&#160;    w.reset();</div>
-<div class="line"><a name="l01072"></a><span class="lineno"> 1072</span>&#160;    v.reset();</div>
-<div class="line"><a name="l01073"></a><span class="lineno"> 1073</span>&#160;  }</div>
-<div class="line"><a name="l01074"></a><span class="lineno"> 1074</span>&#160; </div>
-<div class="line"><a name="l01075"></a><span class="lineno"> 1075</span>&#160;  <span class="keywordflow">return</span> mat_taus;</div>
-<div class="line"><a name="l01076"></a><span class="lineno"> 1076</span>&#160;}</div>
-<div class="line"><a name="l01077"></a><span class="lineno"> 1077</span>&#160; </div>
-<div class="line"><a name="l01078"></a><span class="lineno"> 1078</span>&#160;<span class="comment">// Distributed implementation of reduction to band</span></div>
-<div class="line"><a name="l01079"></a><span class="lineno"> 1079</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l01080"></a><span class="lineno"> 1080</span>&#160;Matrix&lt;T, Device::CPU&gt; ReductionToBand&lt;B, D, T&gt;::call(comm::CommunicatorGrid grid, Matrix&lt;T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l01081"></a><span class="lineno"> 1081</span>&#160;                                                      <span class="keyword">const</span> SizeType band_size) {</div>
-<div class="line"><a name="l01082"></a><span class="lineno"> 1082</span>&#160;  <span class="keyword">using namespace </span>red2band::distributed;</div>
-<div class="line"><a name="l01083"></a><span class="lineno"> 1083</span>&#160; </div>
-<div class="line"><a name="l01084"></a><span class="lineno"> 1084</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
-<div class="line"><a name="l01085"></a><span class="lineno"> 1085</span>&#160;  <span class="keyword">using</span> factorization::internal::computeTFactor;</div>
-<div class="line"><a name="l01086"></a><span class="lineno"> 1086</span>&#160; </div>
-<div class="line"><a name="l01087"></a><span class="lineno"> 1087</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l01088"></a><span class="lineno"> 1088</span>&#160; </div>
-<div class="line"><a name="l01089"></a><span class="lineno"> 1089</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01090"></a><span class="lineno"> 1090</span>&#160;  <span class="comment">// This is a temporary workaround.</span></div>
-<div class="line"><a name="l01091"></a><span class="lineno"> 1091</span>&#160;  <span class="comment">// See issue https://github.com/eth-cscs/DLA-Future/issues/729</span></div>
-<div class="line"><a name="l01092"></a><span class="lineno"> 1092</span>&#160;  pika::threads::get_thread_manager().wait();</div>
-<div class="line"><a name="l01093"></a><span class="lineno"> 1093</span>&#160; </div>
-<div class="line"><a name="l01094"></a><span class="lineno"> 1094</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_col_chain_panel(grid.colCommunicator().clone());</div>
-<div class="line"><a name="l01095"></a><span class="lineno"> 1095</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_row_chain(grid.rowCommunicator().clone());</div>
-<div class="line"><a name="l01096"></a><span class="lineno"> 1096</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_col_chain(grid.colCommunicator().clone());</div>
-<div class="line"><a name="l01097"></a><span class="lineno"> 1097</span>&#160; </div>
-<div class="line"><a name="l01098"></a><span class="lineno"> 1098</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist = mat_a.distribution();</div>
-<div class="line"><a name="l01099"></a><span class="lineno"> 1099</span>&#160;  <span class="keyword">const</span> comm::Index2D rank = dist.rankIndex();</div>
-<div class="line"><a name="l01100"></a><span class="lineno"> 1100</span>&#160; </div>
-<div class="line"><a name="l01101"></a><span class="lineno"> 1101</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01102"></a><span class="lineno"> 1102</span>&#160;  <span class="comment">// Reflector of size = 1 is not considered whatever T is (i.e. neither real nor complex)</span></div>
-<div class="line"><a name="l01103"></a><span class="lineno"> 1103</span>&#160;  <span class="keyword">const</span> SizeType nrefls = std::max&lt;SizeType&gt;(0, dist.size().rows() - band_size - 1);</div>
-<div class="line"><a name="l01104"></a><span class="lineno"> 1104</span>&#160; </div>
-<div class="line"><a name="l01105"></a><span class="lineno"> 1105</span>&#160;  <span class="comment">// Row-vector that is distributed over columns, but exists locally on all rows of the grid</span></div>
-<div class="line"><a name="l01106"></a><span class="lineno"> 1106</span>&#160;  DLAF_ASSERT(mat_a.blockSize().cols() % band_size == 0, mat_a.blockSize().cols(), band_size);</div>
-<div class="line"><a name="l01107"></a><span class="lineno"> 1107</span>&#160;  Matrix&lt;T, Device::CPU&gt; mat_taus(matrix::Distribution(GlobalElementSize(nrefls, 1),</div>
-<div class="line"><a name="l01108"></a><span class="lineno"> 1108</span>&#160;                                                       TileElementSize(mat_a.blockSize().cols(), 1),</div>
-<div class="line"><a name="l01109"></a><span class="lineno"> 1109</span>&#160;                                                       comm::Size2D(mat_a.commGridSize().cols(), 1),</div>
-<div class="line"><a name="l01110"></a><span class="lineno"> 1110</span>&#160;                                                       comm::Index2D(mat_a.rankIndex().col(), 0),</div>
-<div class="line"><a name="l01111"></a><span class="lineno"> 1111</span>&#160;                                                       comm::Index2D(mat_a.sourceRankIndex().col(), 0)));</div>
-<div class="line"><a name="l01112"></a><span class="lineno"> 1112</span>&#160; </div>
-<div class="line"><a name="l01113"></a><span class="lineno"> 1113</span>&#160;  <span class="keywordflow">if</span> (nrefls == 0)</div>
-<div class="line"><a name="l01114"></a><span class="lineno"> 1114</span>&#160;    <span class="keywordflow">return</span> mat_taus;</div>
-<div class="line"><a name="l01115"></a><span class="lineno"> 1115</span>&#160; </div>
-<div class="line"><a name="l01116"></a><span class="lineno"> 1116</span>&#160;  matrix::RetiledMatrix&lt;T, Device::CPU&gt; mat_taus_retiled(</div>
-<div class="line"><a name="l01117"></a><span class="lineno"> 1117</span>&#160;      mat_taus, LocalTileSize(mat_a.blockSize().cols() / band_size, 1));</div>
-<div class="line"><a name="l01118"></a><span class="lineno"> 1118</span>&#160; </div>
-<div class="line"><a name="l01119"></a><span class="lineno"> 1119</span>&#160;  <span class="keyword">const</span> SizeType ntiles = (nrefls - 1) / band_size + 1;</div>
-<div class="line"><a name="l01120"></a><span class="lineno"> 1120</span>&#160;  DLAF_ASSERT(ntiles == mat_taus_retiled.nrTiles().rows(), ntiles, mat_taus_retiled.nrTiles().rows());</div>
-<div class="line"><a name="l01121"></a><span class="lineno"> 1121</span>&#160; </div>
-<div class="line"><a name="l01122"></a><span class="lineno"> 1122</span>&#160;  <span class="keyword">const</span> <span class="keywordtype">bool</span> is_full_band = (band_size == dist.blockSize().cols());</div>
-<div class="line"><a name="l01123"></a><span class="lineno"> 1123</span>&#160; </div>
-<div class="line"><a name="l01124"></a><span class="lineno"> 1124</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
-<div class="line"><a name="l01125"></a><span class="lineno"> 1125</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, D&gt;&gt; panels_v(n_workspaces, dist);</div>
-<div class="line"><a name="l01126"></a><span class="lineno"> 1126</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&gt; panels_vt(</div>
-<div class="line"><a name="l01127"></a><span class="lineno"> 1127</span>&#160;      n_workspaces, dist);</div>
-<div class="line"><a name="l01128"></a><span class="lineno"> 1128</span>&#160; </div>
-<div class="line"><a name="l01129"></a><span class="lineno"> 1129</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, D&gt;&gt; panels_w(n_workspaces, dist);</div>
-<div class="line"><a name="l01130"></a><span class="lineno"> 1130</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&gt; panels_wt(</div>
-<div class="line"><a name="l01131"></a><span class="lineno"> 1131</span>&#160;      n_workspaces, dist);</div>
-<div class="line"><a name="l01132"></a><span class="lineno"> 1132</span>&#160; </div>
-<div class="line"><a name="l01133"></a><span class="lineno"> 1133</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, D&gt;&gt; panels_x(n_workspaces, dist);</div>
-<div class="line"><a name="l01134"></a><span class="lineno"> 1134</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&gt; panels_xt(</div>
-<div class="line"><a name="l01135"></a><span class="lineno"> 1135</span>&#160;      n_workspaces, dist);</div>
-<div class="line"><a name="l01136"></a><span class="lineno"> 1136</span>&#160; </div>
-<div class="line"><a name="l01137"></a><span class="lineno"> 1137</span>&#160;  red2band::ComputePanelHelper&lt;B, D, T&gt; compute_panel_helper(n_workspaces, dist);</div>
-<div class="line"><a name="l01138"></a><span class="lineno"> 1138</span>&#160; </div>
-<div class="line"><a name="l01139"></a><span class="lineno"> 1139</span>&#160;  ex::unique_any_sender&lt;&gt; trigger_panel{ex::just()};</div>
-<div class="line"><a name="l01140"></a><span class="lineno"> 1140</span>&#160;  <span class="keywordflow">for</span> (SizeType j_sub = 0; j_sub &lt; ntiles; ++j_sub) {</div>
-<div class="line"><a name="l01141"></a><span class="lineno"> 1141</span>&#160;    <span class="keyword">const</span> SizeType i_sub = j_sub + 1;</div>
-<div class="line"><a name="l01142"></a><span class="lineno"> 1142</span>&#160; </div>
-<div class="line"><a name="l01143"></a><span class="lineno"> 1143</span>&#160;    <span class="keyword">const</span> GlobalElementIndex ij_offset(i_sub * band_size, j_sub * band_size);</div>
-<div class="line"><a name="l01144"></a><span class="lineno"> 1144</span>&#160;    <span class="keyword">const</span> GlobalElementIndex at_offset(i_sub * band_size, (j_sub + 1) * band_size);</div>
-<div class="line"><a name="l01145"></a><span class="lineno"> 1145</span>&#160; </div>
-<div class="line"><a name="l01146"></a><span class="lineno"> 1146</span>&#160;    <span class="keyword">const</span> comm::Index2D rank_v0{</div>
-<div class="line"><a name="l01147"></a><span class="lineno"> 1147</span>&#160;        dist.template rankGlobalElement&lt;Coord::Row&gt;(ij_offset.row()),</div>
-<div class="line"><a name="l01148"></a><span class="lineno"> 1148</span>&#160;        dist.template rankGlobalElement&lt;Coord::Col&gt;(ij_offset.col()),</div>
-<div class="line"><a name="l01149"></a><span class="lineno"> 1149</span>&#160;    };</div>
-<div class="line"><a name="l01150"></a><span class="lineno"> 1150</span>&#160; </div>
-<div class="line"><a name="l01151"></a><span class="lineno"> 1151</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> is_panel_rank_col = rank_v0.col() == rank.col();</div>
-<div class="line"><a name="l01152"></a><span class="lineno"> 1152</span>&#160; </div>
-<div class="line"><a name="l01153"></a><span class="lineno"> 1153</span>&#160;    <span class="keyword">const</span> SizeType nrefls_tile = mat_taus_retiled.tileSize(GlobalTileIndex(j_sub, 0)).rows();</div>
-<div class="line"><a name="l01154"></a><span class="lineno"> 1154</span>&#160; </div>
-<div class="line"><a name="l01155"></a><span class="lineno"> 1155</span>&#160;    <span class="keywordflow">if</span> (nrefls_tile == 0)</div>
-<div class="line"><a name="l01156"></a><span class="lineno"> 1156</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l01157"></a><span class="lineno"> 1157</span>&#160; </div>
-<div class="line"><a name="l01158"></a><span class="lineno"> 1158</span>&#160;    <span class="keyword">auto</span>&amp; v = panels_v.nextResource();</div>
-<div class="line"><a name="l01159"></a><span class="lineno"> 1159</span>&#160;    <span class="keyword">auto</span>&amp; vt = panels_vt.nextResource();</div>
-<div class="line"><a name="l01160"></a><span class="lineno"> 1160</span>&#160; </div>
-<div class="line"><a name="l01161"></a><span class="lineno"> 1161</span>&#160;    v.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01162"></a><span class="lineno"> 1162</span>&#160;    vt.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01163"></a><span class="lineno"> 1163</span>&#160; </div>
-<div class="line"><a name="l01164"></a><span class="lineno"> 1164</span>&#160;    v.setWidth(nrefls_tile);</div>
-<div class="line"><a name="l01165"></a><span class="lineno"> 1165</span>&#160;    vt.setHeight(nrefls_tile);</div>
-<div class="line"><a name="l01166"></a><span class="lineno"> 1166</span>&#160; </div>
-<div class="line"><a name="l01167"></a><span class="lineno"> 1167</span>&#160;    <span class="keyword">const</span> LocalTileIndex t_idx(0, 0);</div>
-<div class="line"><a name="l01168"></a><span class="lineno"> 1168</span>&#160;    <span class="comment">// TODO used just by the column, maybe we can re-use a panel tile?</span></div>
-<div class="line"><a name="l01169"></a><span class="lineno"> 1169</span>&#160;    <span class="comment">// TODO or we can keep just the sh_future and allocate just inside if (is_panel_rank_col)</span></div>
-<div class="line"><a name="l01170"></a><span class="lineno"> 1170</span>&#160;    matrix::Matrix&lt;T, D&gt; t({nrefls_tile, nrefls_tile}, dist.blockSize());</div>
-<div class="line"><a name="l01171"></a><span class="lineno"> 1171</span>&#160; </div>
-<div class="line"><a name="l01172"></a><span class="lineno"> 1172</span>&#160;    <span class="comment">// PANEL</span></div>
-<div class="line"><a name="l01173"></a><span class="lineno"> 1173</span>&#160;    <span class="keyword">const</span> matrix::SubPanelView panel_view(dist, ij_offset, band_size);</div>
-<div class="line"><a name="l01174"></a><span class="lineno"> 1174</span>&#160; </div>
-<div class="line"><a name="l01175"></a><span class="lineno"> 1175</span>&#160;    <span class="keywordflow">if</span> (is_panel_rank_col) {</div>
-<div class="line"><a name="l01176"></a><span class="lineno"> 1176</span>&#160;      compute_panel_helper.call(std::move(trigger_panel), rank_v0.row(), mpi_col_chain_panel(), mat_a,</div>
-<div class="line"><a name="l01177"></a><span class="lineno"> 1177</span>&#160;                                mat_taus_retiled, j_sub, panel_view);</div>
-<div class="line"><a name="l01178"></a><span class="lineno"> 1178</span>&#160; </div>
-<div class="line"><a name="l01179"></a><span class="lineno"> 1179</span>&#160;      <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01180"></a><span class="lineno"> 1180</span>&#160;      <span class="comment">// - has_reflector_head tells if this rank owns the first tile of the panel</span></div>
-<div class="line"><a name="l01181"></a><span class="lineno"> 1181</span>&#160;      <span class="comment">// - if !is_full_band it has to force copy as a workaround, otherwise in update matrix it would</span></div>
-<div class="line"><a name="l01182"></a><span class="lineno"> 1182</span>&#160;      <span class="comment">// deadlock due to tile shared between panel and trailing matrix</span></div>
-<div class="line"><a name="l01183"></a><span class="lineno"> 1183</span>&#160;      red2band::local::setupReflectorPanelV&lt;B, D, T&gt;(rank.row() == rank_v0.row(), panel_view,</div>
-<div class="line"><a name="l01184"></a><span class="lineno"> 1184</span>&#160;                                                     nrefls_tile, v, mat_a, !is_full_band);</div>
-<div class="line"><a name="l01185"></a><span class="lineno"> 1185</span>&#160;      computeTFactor&lt;B&gt;(v, mat_taus_retiled.read(GlobalTileIndex(j_sub, 0)), t.readwrite(t_idx),</div>
-<div class="line"><a name="l01186"></a><span class="lineno"> 1186</span>&#160;                        mpi_col_chain);</div>
-<div class="line"><a name="l01187"></a><span class="lineno"> 1187</span>&#160;    }</div>
-<div class="line"><a name="l01188"></a><span class="lineno"> 1188</span>&#160; </div>
-<div class="line"><a name="l01189"></a><span class="lineno"> 1189</span>&#160;    <span class="comment">// PREPARATION FOR TRAILING MATRIX UPDATE</span></div>
-<div class="line"><a name="l01190"></a><span class="lineno"> 1190</span>&#160; </div>
-<div class="line"><a name="l01191"></a><span class="lineno"> 1191</span>&#160;    <span class="comment">// Note: if there is no trailing matrix, algorithm has finised</span></div>
-<div class="line"><a name="l01192"></a><span class="lineno"> 1192</span>&#160;    <span class="keywordflow">if</span> (!at_offset.isIn(mat_a.size()))</div>
-<div class="line"><a name="l01193"></a><span class="lineno"> 1193</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l01194"></a><span class="lineno"> 1194</span>&#160; </div>
-<div class="line"><a name="l01195"></a><span class="lineno"> 1195</span>&#160;    <span class="keyword">const</span> matrix::SubMatrixView trailing_matrix_view(dist, at_offset);</div>
-<div class="line"><a name="l01196"></a><span class="lineno"> 1196</span>&#160; </div>
-<div class="line"><a name="l01197"></a><span class="lineno"> 1197</span>&#160;    comm::broadcast(rank_v0.col(), v, vt, mpi_row_chain, mpi_col_chain);</div>
-<div class="line"><a name="l01198"></a><span class="lineno"> 1198</span>&#160; </div>
-<div class="line"><a name="l01199"></a><span class="lineno"> 1199</span>&#160;    <span class="comment">// W = V . T</span></div>
-<div class="line"><a name="l01200"></a><span class="lineno"> 1200</span>&#160;    <span class="keyword">auto</span>&amp; w = panels_w.nextResource();</div>
-<div class="line"><a name="l01201"></a><span class="lineno"> 1201</span>&#160;    <span class="keyword">auto</span>&amp; wt = panels_wt.nextResource();</div>
-<div class="line"><a name="l01202"></a><span class="lineno"> 1202</span>&#160; </div>
-<div class="line"><a name="l01203"></a><span class="lineno"> 1203</span>&#160;    w.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01204"></a><span class="lineno"> 1204</span>&#160;    wt.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01205"></a><span class="lineno"> 1205</span>&#160; </div>
-<div class="line"><a name="l01206"></a><span class="lineno"> 1206</span>&#160;    w.setWidth(nrefls_tile);</div>
-<div class="line"><a name="l01207"></a><span class="lineno"> 1207</span>&#160;    wt.setHeight(nrefls_tile);</div>
-<div class="line"><a name="l01208"></a><span class="lineno"> 1208</span>&#160; </div>
-<div class="line"><a name="l01209"></a><span class="lineno"> 1209</span>&#160;    <span class="keywordflow">if</span> (is_panel_rank_col)</div>
-<div class="line"><a name="l01210"></a><span class="lineno"> 1210</span>&#160;      red2band::local::trmmComputeW&lt;B, D&gt;(w, v, t.read(t_idx));</div>
-<div class="line"><a name="l01211"></a><span class="lineno"> 1211</span>&#160; </div>
-<div class="line"><a name="l01212"></a><span class="lineno"> 1212</span>&#160;    comm::broadcast(rank_v0.col(), w, wt, mpi_row_chain, mpi_col_chain);</div>
-<div class="line"><a name="l01213"></a><span class="lineno"> 1213</span>&#160; </div>
-<div class="line"><a name="l01214"></a><span class="lineno"> 1214</span>&#160;    <span class="comment">// X = At . W</span></div>
-<div class="line"><a name="l01215"></a><span class="lineno"> 1215</span>&#160;    <span class="keyword">auto</span>&amp; x = panels_x.nextResource();</div>
-<div class="line"><a name="l01216"></a><span class="lineno"> 1216</span>&#160;    <span class="keyword">auto</span>&amp; xt = panels_xt.nextResource();</div>
-<div class="line"><a name="l01217"></a><span class="lineno"> 1217</span>&#160; </div>
-<div class="line"><a name="l01218"></a><span class="lineno"> 1218</span>&#160;    x.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01219"></a><span class="lineno"> 1219</span>&#160;    xt.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01220"></a><span class="lineno"> 1220</span>&#160; </div>
-<div class="line"><a name="l01221"></a><span class="lineno"> 1221</span>&#160;    x.setWidth(nrefls_tile);</div>
-<div class="line"><a name="l01222"></a><span class="lineno"> 1222</span>&#160;    xt.setHeight(nrefls_tile);</div>
-<div class="line"><a name="l01223"></a><span class="lineno"> 1223</span>&#160; </div>
-<div class="line"><a name="l01224"></a><span class="lineno"> 1224</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01225"></a><span class="lineno"> 1225</span>&#160;    <span class="comment">// Since At is hermitian, just the lower part is referenced.</span></div>
-<div class="line"><a name="l01226"></a><span class="lineno"> 1226</span>&#160;    <span class="comment">// When the tile is not part of the main diagonal, the same tile has to be used for two computations</span></div>
-<div class="line"><a name="l01227"></a><span class="lineno"> 1227</span>&#160;    <span class="comment">// that will contribute to two different rows of X: the ones indexed with row and col.</span></div>
-<div class="line"><a name="l01228"></a><span class="lineno"> 1228</span>&#160;    <span class="comment">// This is achieved by storing the two results in two different workspaces: X and X_conj respectively.</span></div>
-<div class="line"><a name="l01229"></a><span class="lineno"> 1229</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01230"></a><span class="lineno"> 1230</span>&#160;    <span class="comment">// On exit, x will contain a valid result just on ranks belonging to the column panel.</span></div>
-<div class="line"><a name="l01231"></a><span class="lineno"> 1231</span>&#160;    <span class="comment">// For what concerns xt, it is just used as support and it contains junk data on all ranks.</span></div>
-<div class="line"><a name="l01232"></a><span class="lineno"> 1232</span>&#160;    hemmComputeX&lt;B, D&gt;(rank_v0.col(), x, xt, trailing_matrix_view, mat_a, w, wt, mpi_row_chain,</div>
-<div class="line"><a name="l01233"></a><span class="lineno"> 1233</span>&#160;                       mpi_col_chain);</div>
-<div class="line"><a name="l01234"></a><span class="lineno"> 1234</span>&#160; </div>
-<div class="line"><a name="l01235"></a><span class="lineno"> 1235</span>&#160;    <span class="comment">// In the next section the next two operations are performed</span></div>
-<div class="line"><a name="l01236"></a><span class="lineno"> 1236</span>&#160;    <span class="comment">// A) W2 = W* . X</span></div>
-<div class="line"><a name="l01237"></a><span class="lineno"> 1237</span>&#160;    <span class="comment">// B) X -= 1/2 . V . W2</span></div>
-<div class="line"><a name="l01238"></a><span class="lineno"> 1238</span>&#160; </div>
-<div class="line"><a name="l01239"></a><span class="lineno"> 1239</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01240"></a><span class="lineno"> 1240</span>&#160;    <span class="comment">// Now the intermediate result for X is available on the panel column ranks,</span></div>
-<div class="line"><a name="l01241"></a><span class="lineno"> 1241</span>&#160;    <span class="comment">// which have locally all the needed stuff for updating X and finalize the result</span></div>
-<div class="line"><a name="l01242"></a><span class="lineno"> 1242</span>&#160;    <span class="keywordflow">if</span> (is_panel_rank_col) {</div>
-<div class="line"><a name="l01243"></a><span class="lineno"> 1243</span>&#160;      <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01244"></a><span class="lineno"> 1244</span>&#160;      <span class="comment">// T can be re-used because it is not needed anymore in this step and it has the same shape</span></div>
-<div class="line"><a name="l01245"></a><span class="lineno"> 1245</span>&#160;      matrix::Matrix&lt;T, D&gt; w2 = std::move(t);</div>
-<div class="line"><a name="l01246"></a><span class="lineno"> 1246</span>&#160; </div>
-<div class="line"><a name="l01247"></a><span class="lineno"> 1247</span>&#160;      red2band::local::gemmComputeW2&lt;B, D&gt;(w2, w, x);</div>
-<div class="line"><a name="l01248"></a><span class="lineno"> 1248</span>&#160;      ex::start_detached(comm::scheduleAllReduceInPlace(mpi_col_chain(), MPI_SUM,</div>
-<div class="line"><a name="l01249"></a><span class="lineno"> 1249</span>&#160;                                                        w2.readwrite(LocalTileIndex(0, 0))));</div>
-<div class="line"><a name="l01250"></a><span class="lineno"> 1250</span>&#160; </div>
-<div class="line"><a name="l01251"></a><span class="lineno"> 1251</span>&#160;      red2band::local::gemmUpdateX&lt;B, D&gt;(x, w2, v);</div>
-<div class="line"><a name="l01252"></a><span class="lineno"> 1252</span>&#160;    }</div>
-<div class="line"><a name="l01253"></a><span class="lineno"> 1253</span>&#160; </div>
-<div class="line"><a name="l01254"></a><span class="lineno"> 1254</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01255"></a><span class="lineno"> 1255</span>&#160;    <span class="comment">// xt has been used previously as workspace for hemmComputeX, so it has to be reset, because now it</span></div>
-<div class="line"><a name="l01256"></a><span class="lineno"> 1256</span>&#160;    <span class="comment">// will be used for accessing the broadcasted version of x</span></div>
-<div class="line"><a name="l01257"></a><span class="lineno"> 1257</span>&#160;    xt.reset();</div>
-<div class="line"><a name="l01258"></a><span class="lineno"> 1258</span>&#160;    xt.setRangeStart(at_offset);</div>
-<div class="line"><a name="l01259"></a><span class="lineno"> 1259</span>&#160;    xt.setHeight(nrefls_tile);</div>
-<div class="line"><a name="l01260"></a><span class="lineno"> 1260</span>&#160; </div>
-<div class="line"><a name="l01261"></a><span class="lineno"> 1261</span>&#160;    comm::broadcast(rank_v0.col(), x, xt, mpi_row_chain, mpi_col_chain);</div>
-<div class="line"><a name="l01262"></a><span class="lineno"> 1262</span>&#160; </div>
-<div class="line"><a name="l01263"></a><span class="lineno"> 1263</span>&#160;    <span class="comment">// TRAILING MATRIX UPDATE</span></div>
-<div class="line"><a name="l01264"></a><span class="lineno"> 1264</span>&#160; </div>
-<div class="line"><a name="l01265"></a><span class="lineno"> 1265</span>&#160;    <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01266"></a><span class="lineno"> 1266</span>&#160;    <span class="comment">// This trigger mechanism allows to control when the next iteration of compute panel will start.</span></div>
-<div class="line"><a name="l01267"></a><span class="lineno"> 1267</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01268"></a><span class="lineno"> 1268</span>&#160;    <span class="comment">// * What?</span></div>
-<div class="line"><a name="l01269"></a><span class="lineno"> 1269</span>&#160;    <span class="comment">// Compute panel uses MPI blocking communication that might block the only computing thread</span></div>
-<div class="line"><a name="l01270"></a><span class="lineno"> 1270</span>&#160;    <span class="comment">// available (since blocking communication are scheduled on normal queues and not on the MPI</span></div>
-<div class="line"><a name="l01271"></a><span class="lineno"> 1271</span>&#160;    <span class="comment">// dedicated one).</span></div>
-<div class="line"><a name="l01272"></a><span class="lineno"> 1272</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01273"></a><span class="lineno"> 1273</span>&#160;    <span class="comment">// * How?</span></div>
-<div class="line"><a name="l01274"></a><span class="lineno"> 1274</span>&#160;    <span class="comment">// If pika runtime has only 2 threads, one is dedicated to MPI and there is just one for</span></div>
-<div class="line"><a name="l01275"></a><span class="lineno"> 1275</span>&#160;    <span class="comment">// computation, that might get blocked by blocking MPI communication, without the chance to do</span></div>
-<div class="line"><a name="l01276"></a><span class="lineno"> 1276</span>&#160;    <span class="comment">// anything else. (TODO this might happen even with more reductions happening in parallel)</span></div>
-<div class="line"><a name="l01277"></a><span class="lineno"> 1277</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01278"></a><span class="lineno"> 1278</span>&#160;    <span class="comment">// * Why?</span></div>
-<div class="line"><a name="l01279"></a><span class="lineno"> 1279</span>&#160;    <span class="comment">// Panel computation at step i is done on the first column of the trailing matrix computed</span></div>
-<div class="line"><a name="l01280"></a><span class="lineno"> 1280</span>&#160;    <span class="comment">// at step i-1.</span></div>
-<div class="line"><a name="l01281"></a><span class="lineno"> 1281</span>&#160;    <span class="comment">// The rank owning the top-left tile of the trailing matrix, can update it as soon as it</span></div>
-<div class="line"><a name="l01282"></a><span class="lineno"> 1282</span>&#160;    <span class="comment">// receives X[0], which due to the pivot position is also the Xt[0]. Once it can go to the next</span></div>
-<div class="line"><a name="l01283"></a><span class="lineno"> 1283</span>&#160;    <span class="comment">// iteration, it ends up stucked in an MPI blocking communication, waiting for the others joining</span></div>
-<div class="line"><a name="l01284"></a><span class="lineno"> 1284</span>&#160;    <span class="comment">// before being able to advance.</span></div>
-<div class="line"><a name="l01285"></a><span class="lineno"> 1285</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01286"></a><span class="lineno"> 1286</span>&#160;    <span class="comment">// But at the same time, other ranks in the same column (needed for the next panel update), cannot</span></div>
-<div class="line"><a name="l01287"></a><span class="lineno"> 1287</span>&#160;    <span class="comment">// complete the trailing matrix update. Indeed, they are waiting for the pivot rank to communicate</span></div>
-<div class="line"><a name="l01288"></a><span class="lineno"> 1288</span>&#160;    <span class="comment">// column-wise Xt[0] (during x -&gt; xt panel transpose broadcast), but he is not going to schedule</span></div>
-<div class="line"><a name="l01289"></a><span class="lineno"> 1289</span>&#160;    <span class="comment">// anything because the only normal thread which can do that is stuck in an MPI blocking</span></div>
-<div class="line"><a name="l01290"></a><span class="lineno"> 1290</span>&#160;    <span class="comment">// communication that is not going to advance... and so it&#39;s a DEADLOCK!</span></div>
-<div class="line"><a name="l01291"></a><span class="lineno"> 1291</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01292"></a><span class="lineno"> 1292</span>&#160;    <span class="comment">// * Solution:</span></div>
-<div class="line"><a name="l01293"></a><span class="lineno"> 1293</span>&#160;    <span class="comment">// The idea is to make the next panel depending not only on tiles stored locally, but also to</span></div>
-<div class="line"><a name="l01294"></a><span class="lineno"> 1294</span>&#160;    <span class="comment">// ensure that others have received Xt[0], which is needed to advance the computation and let</span></div>
-<div class="line"><a name="l01295"></a><span class="lineno"> 1295</span>&#160;    <span class="comment">// others arrive at the next iteration where the pivot will wait for them to complete the MPI</span></div>
-<div class="line"><a name="l01296"></a><span class="lineno"> 1296</span>&#160;    <span class="comment">// blocking communication.</span></div>
-<div class="line"><a name="l01297"></a><span class="lineno"> 1297</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01298"></a><span class="lineno"> 1298</span>&#160;    <span class="comment">// * Why is it different between MC and GPU?</span></div>
-<div class="line"><a name="l01299"></a><span class="lineno"> 1299</span>&#160;    <span class="comment">// As said above, the problem is related to the communication. But the communication is not said</span></div>
-<div class="line"><a name="l01300"></a><span class="lineno"> 1300</span>&#160;    <span class="comment">// to be an atomic operation happening in a single task. It might have to create a copy to</span></div>
-<div class="line"><a name="l01301"></a><span class="lineno"> 1301</span>&#160;    <span class="comment">// a buffer more suitable for the communication (e.g. GPU -&gt; CPU if RDMA is not available).</span></div>
-<div class="line"><a name="l01302"></a><span class="lineno"> 1302</span>&#160;    <span class="comment">//</span></div>
-<div class="line"><a name="l01303"></a><span class="lineno"> 1303</span>&#160;    <span class="comment">// And in order to not be blocked, it must be ensured that the actual communication task has</span></div>
-<div class="line"><a name="l01304"></a><span class="lineno"> 1304</span>&#160;    <span class="comment">// been scheduled.</span></div>
-<div class="line"><a name="l01305"></a><span class="lineno"> 1305</span>&#160;    <span class="keyword">const</span> SizeType j_tile_current = ij_offset.col() / dist.blockSize().cols();</div>
-<div class="line"><a name="l01306"></a><span class="lineno"> 1306</span>&#160;    <span class="keyword">const</span> SizeType j_tile_next = at_offset.col() / dist.blockSize().cols();</div>
-<div class="line"><a name="l01307"></a><span class="lineno"> 1307</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isNextColumnOnSameRank = (j_tile_current == j_tile_next);</div>
-<div class="line"><a name="l01308"></a><span class="lineno"> 1308</span>&#160;    <span class="keyword">const</span> comm::IndexT_MPI rank_next_col =</div>
-<div class="line"><a name="l01309"></a><span class="lineno"> 1309</span>&#160;        isNextColumnOnSameRank ? rank_v0.col() : (rank_v0.col() + 1) % dist.commGridSize().cols();</div>
-<div class="line"><a name="l01310"></a><span class="lineno"> 1310</span>&#160; </div>
-<div class="line"><a name="l01311"></a><span class="lineno"> 1311</span>&#160;    <span class="keywordflow">if</span> (rank.col() == rank_next_col) {</div>
-<div class="line"><a name="l01312"></a><span class="lineno"> 1312</span>&#160;      <span class="keyword">const</span> LocalTileIndex at{</div>
-<div class="line"><a name="l01313"></a><span class="lineno"> 1313</span>&#160;          dist.template nextLocalTileFromGlobalElement&lt;Coord::Row&gt;(at_offset.row()),</div>
-<div class="line"><a name="l01314"></a><span class="lineno"> 1314</span>&#160;          dist.template nextLocalTileFromGlobalElement&lt;Coord::Col&gt;(at_offset.col()),</div>
-<div class="line"><a name="l01315"></a><span class="lineno"> 1315</span>&#160;      };</div>
-<div class="line"><a name="l01316"></a><span class="lineno"> 1316</span>&#160; </div>
-<div class="line"><a name="l01317"></a><span class="lineno"> 1317</span>&#160;      <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01318"></a><span class="lineno"> 1318</span>&#160;      <span class="comment">// This additional communication of the last tile is a workaround for supporting following trigger</span></div>
-<div class="line"><a name="l01319"></a><span class="lineno"> 1319</span>&#160;      <span class="comment">// when b &lt; mb.</span></div>
-<div class="line"><a name="l01320"></a><span class="lineno"> 1320</span>&#160;      <span class="comment">// Indeed, if b &lt; mb the last column have (at least) a panel to compute, but differently from</span></div>
-<div class="line"><a name="l01321"></a><span class="lineno"> 1321</span>&#160;      <span class="comment">// other columns, broadcast transposed doesn&#39;t communicate the last tile, which is an assumption</span></div>
-<div class="line"><a name="l01322"></a><span class="lineno"> 1322</span>&#160;      <span class="comment">// needed to make the following trigger work correctly.</span></div>
-<div class="line"><a name="l01323"></a><span class="lineno"> 1323</span>&#160;      <span class="keyword">const</span> SizeType at_tile_col =</div>
-<div class="line"><a name="l01324"></a><span class="lineno"> 1324</span>&#160;          dist.template globalTileFromGlobalElement&lt;Coord::Col&gt;(at_offset.col());</div>
-<div class="line"><a name="l01325"></a><span class="lineno"> 1325</span>&#160; </div>
-<div class="line"><a name="l01326"></a><span class="lineno"> 1326</span>&#160;      <span class="keywordflow">if</span> (at_tile_col == dist.nrTiles().cols() - 1) {</div>
-<div class="line"><a name="l01327"></a><span class="lineno"> 1327</span>&#160;        <span class="keyword">const</span> comm::IndexT_MPI owner = rank_v0.row();</div>
-<div class="line"><a name="l01328"></a><span class="lineno"> 1328</span>&#160;        <span class="keywordflow">if</span> (rank.row() == owner) {</div>
-<div class="line"><a name="l01329"></a><span class="lineno"> 1329</span>&#160;          xt.setTile(at, x.read(at));</div>
-<div class="line"><a name="l01330"></a><span class="lineno"> 1330</span>&#160; </div>
-<div class="line"><a name="l01331"></a><span class="lineno"> 1331</span>&#160;          <span class="keywordflow">if</span> (dist.commGridSize().rows() &gt; 1)</div>
-<div class="line"><a name="l01332"></a><span class="lineno"> 1332</span>&#160;            ex::start_detached(comm::scheduleSendBcast(mpi_col_chain(), xt.read(at)));</div>
-<div class="line"><a name="l01333"></a><span class="lineno"> 1333</span>&#160;        }</div>
-<div class="line"><a name="l01334"></a><span class="lineno"> 1334</span>&#160;        <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l01335"></a><span class="lineno"> 1335</span>&#160;          <span class="keywordflow">if</span> (dist.commGridSize().rows() &gt; 1)</div>
-<div class="line"><a name="l01336"></a><span class="lineno"> 1336</span>&#160;            ex::start_detached(comm::scheduleRecvBcast(mpi_col_chain(), owner, xt.readwrite(at)));</div>
-<div class="line"><a name="l01337"></a><span class="lineno"> 1337</span>&#160;        }</div>
-<div class="line"><a name="l01338"></a><span class="lineno"> 1338</span>&#160;      }</div>
-<div class="line"><a name="l01339"></a><span class="lineno"> 1339</span>&#160; </div>
-<div class="line"><a name="l01340"></a><span class="lineno"> 1340</span>&#160;      <span class="keywordflow">if</span> constexpr (dlaf::comm::CommunicationDevice_v&lt;D&gt; == D) {</div>
-<div class="line"><a name="l01341"></a><span class="lineno"> 1341</span>&#160;        <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01342"></a><span class="lineno"> 1342</span>&#160;        <span class="comment">// if there is no need for additional buffers, we can just wait that xt[0] is ready for</span></div>
-<div class="line"><a name="l01343"></a><span class="lineno"> 1343</span>&#160;        <span class="comment">// reading.</span></div>
-<div class="line"><a name="l01344"></a><span class="lineno"> 1344</span>&#160;        <span class="keywordflow">if</span> (rank.row() == rank_v0.row()) {</div>
-<div class="line"><a name="l01345"></a><span class="lineno"> 1345</span>&#160;          trigger_panel = xt.read(at) | ex::drop_value() | ex::ensure_started();</div>
-<div class="line"><a name="l01346"></a><span class="lineno"> 1346</span>&#160;        }</div>
-<div class="line"><a name="l01347"></a><span class="lineno"> 1347</span>&#160;        <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l01348"></a><span class="lineno"> 1348</span>&#160;          <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01349"></a><span class="lineno"> 1349</span>&#160;          <span class="comment">// Conservatively ensure that xt[0] needed for updating the first column has been</span></div>
-<div class="line"><a name="l01350"></a><span class="lineno"> 1350</span>&#160;          <span class="comment">// received. Just wait for xt because communication of x happens over rows, while the</span></div>
-<div class="line"><a name="l01351"></a><span class="lineno"> 1351</span>&#160;          <span class="comment">// pivot rank can just block rank in the same column.</span></div>
-<div class="line"><a name="l01352"></a><span class="lineno"> 1352</span>&#160;          trigger_panel = xt.read(at) | ex::drop_value() | ex::ensure_started();</div>
-<div class="line"><a name="l01353"></a><span class="lineno"> 1353</span>&#160;        }</div>
-<div class="line"><a name="l01354"></a><span class="lineno"> 1354</span>&#160;      }</div>
-<div class="line"><a name="l01355"></a><span class="lineno"> 1355</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l01356"></a><span class="lineno"> 1356</span>&#160;        <span class="keywordflow">if</span> (rank.row() == rank_v0.row()) {</div>
-<div class="line"><a name="l01357"></a><span class="lineno"> 1357</span>&#160;          <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01358"></a><span class="lineno"> 1358</span>&#160;          <span class="comment">// on the pivot rank, i.e. the one that would quickly go to the next panel and block, from</span></div>
-<div class="line"><a name="l01359"></a><span class="lineno"> 1359</span>&#160;          <span class="comment">// implementation we know that xt[0] is set as an external tile pointing to x[0].</span></div>
-<div class="line"><a name="l01360"></a><span class="lineno"> 1360</span>&#160;          <span class="comment">// We cannot wait on xt readwrite (because it is an external tile in a panel, that constraints</span></div>
-<div class="line"><a name="l01361"></a><span class="lineno"> 1361</span>&#160;          <span class="comment">// it to be just readable), but we can wait on its source x[0]. This has a subtle implication,</span></div>
-<div class="line"><a name="l01362"></a><span class="lineno"> 1362</span>&#160;          <span class="comment">// since we will wait not just for the communication to be complete (which is already more</span></div>
-<div class="line"><a name="l01363"></a><span class="lineno"> 1363</span>&#160;          <span class="comment">// than what needed), but we will also wait till xt[0] will be released, so after all local</span></div>
-<div class="line"><a name="l01364"></a><span class="lineno"> 1364</span>&#160;          <span class="comment">// communication and computation on the first column of the trailing matrix will be completed.</span></div>
-<div class="line"><a name="l01365"></a><span class="lineno"> 1365</span>&#160;          trigger_panel = x.readwrite(at) | ex::drop_value() | ex::ensure_started();</div>
-<div class="line"><a name="l01366"></a><span class="lineno"> 1366</span>&#160;        }</div>
-<div class="line"><a name="l01367"></a><span class="lineno"> 1367</span>&#160;        <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l01368"></a><span class="lineno"> 1368</span>&#160;          <span class="comment">// Note:</span></div>
-<div class="line"><a name="l01369"></a><span class="lineno"> 1369</span>&#160;          <span class="comment">// Conservatively ensure that xt[0] needed for updating the first column has been</span></div>
-<div class="line"><a name="l01370"></a><span class="lineno"> 1370</span>&#160;          <span class="comment">// received. Just wait for xt because communication of x happens over rows, while the</span></div>
-<div class="line"><a name="l01371"></a><span class="lineno"> 1371</span>&#160;          <span class="comment">// pivot rank can just block rank in the same column.</span></div>
-<div class="line"><a name="l01372"></a><span class="lineno"> 1372</span>&#160;          trigger_panel = xt.read(at) | ex::drop_value() | ex::ensure_started();</div>
-<div class="line"><a name="l01373"></a><span class="lineno"> 1373</span>&#160;        }</div>
-<div class="line"><a name="l01374"></a><span class="lineno"> 1374</span>&#160;      }</div>
-<div class="line"><a name="l01375"></a><span class="lineno"> 1375</span>&#160;    }</div>
-<div class="line"><a name="l01376"></a><span class="lineno"> 1376</span>&#160; </div>
-<div class="line"><a name="l01377"></a><span class="lineno"> 1377</span>&#160;    <span class="comment">// At -= X . V* + V . X*</span></div>
-<div class="line"><a name="l01378"></a><span class="lineno"> 1378</span>&#160;    her2kUpdateTrailingMatrix&lt;B&gt;(trailing_matrix_view, mat_a, x, vt, v, xt);</div>
-<div class="line"><a name="l01379"></a><span class="lineno"> 1379</span>&#160; </div>
-<div class="line"><a name="l01380"></a><span class="lineno"> 1380</span>&#160;    xt.reset();</div>
-<div class="line"><a name="l01381"></a><span class="lineno"> 1381</span>&#160;    x.reset();</div>
-<div class="line"><a name="l01382"></a><span class="lineno"> 1382</span>&#160;    wt.reset();</div>
-<div class="line"><a name="l01383"></a><span class="lineno"> 1383</span>&#160;    w.reset();</div>
-<div class="line"><a name="l01384"></a><span class="lineno"> 1384</span>&#160;    vt.reset();</div>
-<div class="line"><a name="l01385"></a><span class="lineno"> 1385</span>&#160;    v.reset();</div>
-<div class="line"><a name="l01386"></a><span class="lineno"> 1386</span>&#160;  }</div>
-<div class="line"><a name="l01387"></a><span class="lineno"> 1387</span>&#160; </div>
-<div class="line"><a name="l01388"></a><span class="lineno"> 1388</span>&#160;  <span class="keywordflow">return</span> mat_taus;</div>
+<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160; </div>
+<div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00825"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">  825</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>;</div>
+<div class="line"><a name="l00826"></a><span class="lineno">  826</span>&#160; </div>
+<div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00828"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">  828</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>&lt;Backend::MC, Device::CPU, T&gt; {</div>
+<div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>(<span class="keyword">const</span> std::size_t, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>) {}</div>
+<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160; </div>
+<div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;  <span class="keywordtype">void</span> call(Matrix&lt;T, Device::CPU&gt;&amp; mat_a, Matrix&lt;T, Device::CPU&gt;&amp; mat_taus, <span class="keyword">const</span> SizeType j_sub,</div>
+<div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;            <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
+<div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;    <span class="keyword">using</span> red2band::local::computePanelReflectors;</div>
+<div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;    computePanelReflectors(mat_a, mat_taus, j_sub, panel_view);</div>
+<div class="line"><a name="l00835"></a><span class="lineno">  835</span>&#160;  }</div>
+<div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160; </div>
+<div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;  <span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> CommSender, <span class="keyword">class</span> TriggerSender&gt;</div>
+<div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;  <span class="keywordtype">void</span> call(TriggerSender&amp;&amp; trigger, <a class="code" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender&amp;&amp; mpi_col_chain_panel,</div>
+<div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160;            Matrix&lt;T, D&gt;&amp; mat_a, Matrix&lt;T, Device::CPU&gt;&amp; mat_taus, <span class="keyword">const</span> SizeType j_sub,</div>
+<div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;            <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
+<div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;    <span class="keyword">using</span> red2band::distributed::computePanelReflectors;</div>
+<div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;    computePanelReflectors(std::forward&lt;TriggerSender&gt;(trigger), rank_v0,</div>
+<div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;                           std::forward&lt;CommSender&gt;(mpi_col_chain_panel), mat_a, mat_taus, j_sub,</div>
+<div class="line"><a name="l00844"></a><span class="lineno">  844</span>&#160;                           panel_view);</div>
+<div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;  }</div>
+<div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;};</div>
+<div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160; </div>
+<div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160;<span class="preprocessor">#ifdef DLAF_WITH_GPU</span></div>
+<div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00850"></a><span class="lineno"><a class="line" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">  850</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>&lt;Backend::GPU, Device::GPU, T&gt; {</div>
+<div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">ComputePanelHelper</a>(<span class="keyword">const</span> std::size_t n_workspaces, <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_a)</div>
+<div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;      : panels_v(n_workspaces, dist_a) {}</div>
+<div class="line"><a name="l00853"></a><span class="lineno">  853</span>&#160; </div>
+<div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;  <span class="keywordtype">void</span> call(Matrix&lt;T, Device::GPU&gt;&amp; mat_a, Matrix&lt;T, Device::CPU&gt;&amp; mat_taus, <span class="keyword">const</span> SizeType j_sub,</div>
+<div class="line"><a name="l00855"></a><span class="lineno">  855</span>&#160;            <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
+<div class="line"><a name="l00856"></a><span class="lineno">  856</span>&#160;    <span class="keyword">using</span> red2band::local::computePanelReflectors;</div>
+<div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160; </div>
+<div class="line"><a name="l00858"></a><span class="lineno">  858</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00859"></a><span class="lineno">  859</span>&#160; </div>
+<div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160;    <span class="comment">// - copy panel_view from GPU to CPU</span></div>
+<div class="line"><a name="l00862"></a><span class="lineno">  862</span>&#160;    <span class="comment">// - computePanelReflectors on CPU (on a matrix like, with just a panel)</span></div>
+<div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;    <span class="comment">// - copy back matrix &quot;panel&quot; from CPU to GPU</span></div>
+<div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160; </div>
+<div class="line"><a name="l00865"></a><span class="lineno">  865</span>&#160;    <span class="keyword">auto</span>&amp; v = panels_v.nextResource();</div>
+<div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160; </div>
+<div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160;    copyToCPU(panel_view, mat_a, v);</div>
+<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;    computePanelReflectors(v, mat_taus, j_sub, panel_view);</div>
+<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;    copyFromCPU(panel_view, v, mat_a);</div>
+<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;  }</div>
+<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160; </div>
+<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;  <span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> CommSender, <span class="keyword">class</span> TriggerSender&gt;</div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;  <span class="keywordtype">void</span> call(TriggerSender&amp;&amp; trigger, <a class="code" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender&amp;&amp; mpi_col_chain_panel,</div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;            Matrix&lt;T, D&gt;&amp; mat_a, Matrix&lt;T, Device::CPU&gt;&amp; mat_taus, SizeType j_sub,</div>
+<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;            <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a>&amp; panel_view) {</div>
+<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;    <span class="keyword">auto</span>&amp; v = panels_v.nextResource();</div>
+<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160; </div>
+<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;    <span class="comment">// copy to CPU</span></div>
+<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;    copyToCPU(panel_view, mat_a, v);</div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160; </div>
+<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;    <span class="comment">// compute on CPU</span></div>
+<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;    <span class="keyword">using</span> dlaf::eigensolver::internal::red2band::distributed::computePanelReflectors;</div>
+<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;    computePanelReflectors(std::forward&lt;TriggerSender&gt;(trigger), rank_v0,</div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;                           std::forward&lt;CommSender&gt;(mpi_col_chain_panel), v, mat_taus, j_sub,</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;                           panel_view);</div>
+<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160; </div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;    <span class="comment">// copy back to GPU</span></div>
+<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;    copyFromCPU(panel_view, v, mat_a);</div>
+<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;  }</div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160; </div>
+<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;<span class="keyword">protected</span>:</div>
+<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&gt; panels_v;</div>
+<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160; </div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;  <span class="keywordtype">void</span> copyToCPU(<span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> panel_view, <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, Device::GPU&gt;</a>&amp; mat_a,</div>
+<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;                 <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&amp; v) {</div>
+<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160; </div>
+<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;    <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
+<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;    <span class="keyword">using</span> dlaf::matrix::internal::CopyBackend_v;</div>
+<div class="line"><a name="l00900"></a><span class="lineno">  900</span>&#160;    <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160; </div>
+<div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160;    <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.<a class="code" href="structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad">iteratorLocal</a>()) {</div>
+<div class="line"><a name="l00903"></a><span class="lineno">  903</span>&#160;      <span class="keyword">auto</span> spec = panel_view(i);</div>
+<div class="line"><a name="l00904"></a><span class="lineno">  904</span>&#160;      <span class="keyword">auto</span> tmp_tile = v.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(i);</div>
+<div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;      ex::start_detached(</div>
+<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;          ex::when_all(splitTile(mat_a.read(i), spec), splitTile(std::move(tmp_tile), spec)) |</div>
+<div class="line"><a name="l00907"></a><span class="lineno">  907</span>&#160;          matrix::copy(Policy&lt;CopyBackend_v&lt;Device::GPU, Device::CPU&gt;&gt;(thread_priority::high)));</div>
+<div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;    }</div>
+<div class="line"><a name="l00909"></a><span class="lineno">  909</span>&#160;  }</div>
+<div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160; </div>
+<div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160;  <span class="keywordtype">void</span> copyFromCPU(<span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> panel_view, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">matrix::Panel&lt;Coord::Col, T, Device::CPU&gt;</a>&amp; v,</div>
+<div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;                   <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, Device::GPU&gt;</a>&amp; mat_a) {</div>
+<div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160; </div>
+<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160;    <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
+<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;    <span class="keyword">using</span> dlaf::matrix::internal::CopyBackend_v;</div>
+<div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;    <span class="keyword">using</span> pika::execution::thread_priority;</div>
+<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160; </div>
+<div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160;    <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; i : panel_view.<a class="code" href="structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad">iteratorLocal</a>()) {</div>
+<div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;      <span class="keyword">auto</span> spec = panel_view(i);</div>
+<div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;      <span class="keyword">auto</span> tile_a = mat_a.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(i);</div>
+<div class="line"><a name="l00922"></a><span class="lineno">  922</span>&#160;      ex::start_detached(</div>
+<div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;          ex::when_all(splitTile(v.read(i), spec), splitTile(std::move(tile_a), spec)) |</div>
+<div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;          matrix::copy(Policy&lt;CopyBackend_v&lt;Device::CPU, Device::GPU&gt;&gt;(thread_priority::high)));</div>
+<div class="line"><a name="l00925"></a><span class="lineno">  925</span>&#160;    }</div>
+<div class="line"><a name="l00926"></a><span class="lineno">  926</span>&#160;  }</div>
+<div class="line"><a name="l00927"></a><span class="lineno">  927</span>&#160;};</div>
+<div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160; </div>
+<div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160;}</div>
+<div class="line"><a name="l00931"></a><span class="lineno">  931</span>&#160; </div>
+<div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160;<span class="comment">// Local implementation of reduction to band</span></div>
+<div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00934"></a><span class="lineno">  934</span>&#160;Matrix&lt;T, Device::CPU&gt; <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">ReductionToBand&lt;B, D, T&gt;::call</a>(Matrix&lt;T, D&gt;&amp; mat_a, <span class="keyword">const</span> SizeType band_size) {</div>
+<div class="line"><a name="l00935"></a><span class="lineno">  935</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a>;</div>
+<div class="line"><a name="l00936"></a><span class="lineno">  936</span>&#160;  <span class="keyword">using</span> <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">dlaf::matrix::Panel</a>;</div>
+<div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160; </div>
+<div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160;  <span class="keyword">using namespace </span>red2band::local;</div>
+<div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160; </div>
+<div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
+<div class="line"><a name="l00941"></a><span class="lineno">  941</span>&#160;  <span class="keyword">using</span> factorization::internal::computeTFactor;</div>
+<div class="line"><a name="l00942"></a><span class="lineno">  942</span>&#160; </div>
+<div class="line"><a name="l00943"></a><span class="lineno">  943</span>&#160;  <span class="keyword">using</span> pika::execution::experimental::any_sender;</div>
+<div class="line"><a name="l00944"></a><span class="lineno">  944</span>&#160; </div>
+<div class="line"><a name="l00945"></a><span class="lineno">  945</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span> dist_a = mat_a.distribution();</div>
+<div class="line"><a name="l00946"></a><span class="lineno">  946</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist({mat_a.size().rows(), band_size},</div>
+<div class="line"><a name="l00947"></a><span class="lineno">  947</span>&#160;                                  {dist_a.blockSize().rows(), band_size});</div>
+<div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160; </div>
+<div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160;  <span class="comment">// Reflector of size = 1 is not considered whatever T is (i.e. neither real nor complex)</span></div>
+<div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;  <span class="keyword">const</span> SizeType nrefls = std::max&lt;SizeType&gt;(0, dist_a.size().rows() - band_size - 1);</div>
+<div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160; </div>
+<div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;  <span class="comment">// Row-vector that is distributed over columns, but exists locally on all rows of the grid</span></div>
+<div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;  DLAF_ASSERT(mat_a.blockSize().cols() % band_size == 0, mat_a.blockSize().cols(), band_size);</div>
+<div class="line"><a name="l00955"></a><span class="lineno">  955</span>&#160;  Matrix&lt;T, Device::CPU&gt; mat_taus(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>(nrefls, 1),</div>
+<div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat_a.blockSize().cols(), 1),</div>
+<div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">comm::Size2D</a>(mat_a.commGridSize().cols(), 1),</div>
+<div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>(mat_a.rankIndex().col(), 0),</div>
+<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;                                                       <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>(mat_a.sourceRankIndex().col(), 0)));</div>
+<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160; </div>
+<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;  <span class="keywordflow">if</span> (nrefls == 0)</div>
+<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;    <span class="keywordflow">return</span> mat_taus;</div>
+<div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160; </div>
+<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;  Matrix&lt;T, Device::CPU&gt; mat_taus_retiled =</div>
+<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;      mat_taus.retiledSubPipeline(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>(mat_a.blockSize().cols() / band_size, 1));</div>
+<div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160; </div>
+<div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160;  <span class="keyword">const</span> SizeType ntiles = (nrefls - 1) / band_size + 1;</div>
+<div class="line"><a name="l00968"></a><span class="lineno">  968</span>&#160;  DLAF_ASSERT(ntiles == mat_taus_retiled.nrTiles().rows(), ntiles, mat_taus_retiled.nrTiles().rows());</div>
+<div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160; </div>
+<div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;  <span class="keyword">const</span> <span class="keywordtype">bool</span> is_full_band = (band_size == dist_a.blockSize().cols());</div>
+<div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160; </div>
+<div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
+<div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;</a>&gt; panels_v(n_workspaces, dist);</div>
+<div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;</a>&gt; panels_w(n_workspaces, dist);</div>
+<div class="line"><a name="l00975"></a><span class="lineno">  975</span>&#160;  <a class="code" href="structdlaf_1_1common_1_1_round_robin.html">common::RoundRobin&lt;Panel&lt;Coord::Col, T, D&gt;</a>&gt; panels_x(n_workspaces, dist);</div>
+<div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160; </div>
+<div class="line"><a name="l00977"></a><span class="lineno">  977</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;  <span class="comment">// Here dist_a is given with full panel size instead of dist with just the part actually needeed,</span></div>
+<div class="line"><a name="l00979"></a><span class="lineno">  979</span>&#160;  <span class="comment">// because the GPU Helper internally exploits Panel data-structure. Indeed, the full size panel is</span></div>
+<div class="line"><a name="l00980"></a><span class="lineno">  980</span>&#160;  <span class="comment">// needed in order to mimick Matrix with Panel, so it is possible to apply a SubPanelView to it.</span></div>
+<div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00982"></a><span class="lineno">  982</span>&#160;  <span class="comment">// It is a bit hacky usage, because SubPanelView is not meant to be used with Panel, but just with</span></div>
+<div class="line"><a name="l00983"></a><span class="lineno">  983</span>&#160;  <span class="comment">// Matrix. This results in a variable waste of memory, depending no the ratio band_size/nb.</span></div>
+<div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;  red2band::ComputePanelHelper&lt;B, D, T&gt; compute_panel_helper(n_workspaces, dist_a);</div>
+<div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160; </div>
+<div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160;  <span class="keywordflow">for</span> (SizeType j_sub = 0; j_sub &lt; ntiles; ++j_sub) {</div>
+<div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> i_sub = j_sub + 1;</div>
+<div class="line"><a name="l00988"></a><span class="lineno">  988</span>&#160; </div>
+<div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160;    <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a> ij_offset(i_sub * band_size, j_sub * band_size);</div>
+<div class="line"><a name="l00990"></a><span class="lineno">  990</span>&#160; </div>
+<div class="line"><a name="l00991"></a><span class="lineno">  991</span>&#160;    <span class="keyword">const</span> SizeType nrefls_tile = mat_taus_retiled.tileSize(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>(j_sub, 0)).rows();</div>
+<div class="line"><a name="l00992"></a><span class="lineno">  992</span>&#160; </div>
+<div class="line"><a name="l00993"></a><span class="lineno">  993</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isPanelIncomplete = (nrefls_tile != band_size);</div>
+<div class="line"><a name="l00994"></a><span class="lineno">  994</span>&#160; </div>
+<div class="line"><a name="l00995"></a><span class="lineno">  995</span>&#160;    <span class="comment">// Note: if this is running, it must have at least one valid reflector (i.e. with size &gt; 1)</span></div>
+<div class="line"><a name="l00996"></a><span class="lineno">  996</span>&#160;    DLAF_ASSERT_HEAVY(nrefls_tile != 0, nrefls_tile);</div>
+<div class="line"><a name="l00997"></a><span class="lineno">  997</span>&#160; </div>
+<div class="line"><a name="l00998"></a><span class="lineno">  998</span>&#160;    <span class="comment">// Note:  SubPanelView is (at most) band_size wide, but it may contain a smaller number of</span></div>
+<div class="line"><a name="l00999"></a><span class="lineno">  999</span>&#160;    <span class="comment">//        reflectors (i.e. at the end when last reflector size is 1)</span></div>
+<div class="line"><a name="l01000"></a><span class="lineno"> 1000</span>&#160;    <span class="keyword">const</span> <a class="code" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> panel_view(dist_a, ij_offset, band_size);</div>
+<div class="line"><a name="l01001"></a><span class="lineno"> 1001</span>&#160; </div>
+<div class="line"><a name="l01002"></a><span class="lineno"> 1002</span>&#160;    Panel&lt;Coord::Col, T, D&gt;&amp; v = panels_v.nextResource();</div>
+<div class="line"><a name="l01003"></a><span class="lineno"> 1003</span>&#160;    v.setRangeStart(ij_offset);</div>
+<div class="line"><a name="l01004"></a><span class="lineno"> 1004</span>&#160;    <span class="keywordflow">if</span> (isPanelIncomplete)</div>
+<div class="line"><a name="l01005"></a><span class="lineno"> 1005</span>&#160;      v.setWidth(nrefls_tile);</div>
+<div class="line"><a name="l01006"></a><span class="lineno"> 1006</span>&#160; </div>
+<div class="line"><a name="l01007"></a><span class="lineno"> 1007</span>&#160;    <span class="comment">// PANEL</span></div>
+<div class="line"><a name="l01008"></a><span class="lineno"> 1008</span>&#160;    compute_panel_helper.call(mat_a, mat_taus_retiled, j_sub, panel_view);</div>
+<div class="line"><a name="l01009"></a><span class="lineno"> 1009</span>&#160; </div>
+<div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;    <span class="comment">// - has_reflector_head tells if this rank owns the first tile of the panel (being local, always true)</span></div>
+<div class="line"><a name="l01012"></a><span class="lineno"> 1012</span>&#160;    <span class="comment">// - if !is_full_band it has to force copy as a workaround, otherwise in update matrix it would deadlock</span></div>
+<div class="line"><a name="l01013"></a><span class="lineno"> 1013</span>&#160;    <span class="comment">// due to tile shared between panel and trailing matrix</span></div>
+<div class="line"><a name="l01014"></a><span class="lineno"> 1014</span>&#160;    constexpr <span class="keywordtype">bool</span> has_reflector_head = <span class="keyword">true</span>;</div>
+<div class="line"><a name="l01015"></a><span class="lineno"> 1015</span>&#160;    setupReflectorPanelV&lt;B, D, T&gt;(has_reflector_head, panel_view, nrefls_tile, v, mat_a, !is_full_band);</div>
+<div class="line"><a name="l01016"></a><span class="lineno"> 1016</span>&#160; </div>
+<div class="line"><a name="l01017"></a><span class="lineno"> 1017</span>&#160;    <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> t_idx(0, 0);</div>
+<div class="line"><a name="l01018"></a><span class="lineno"> 1018</span>&#160;    <span class="comment">// TODO used just by the column, maybe we can re-use a panel tile?</span></div>
+<div class="line"><a name="l01019"></a><span class="lineno"> 1019</span>&#160;    <span class="comment">// TODO probably the first one in any panel is ok?</span></div>
+<div class="line"><a name="l01020"></a><span class="lineno"> 1020</span>&#160;    Matrix&lt;T, D&gt; t({nrefls_tile, nrefls_tile}, dist.blockSize());</div>
+<div class="line"><a name="l01021"></a><span class="lineno"> 1021</span>&#160; </div>
+<div class="line"><a name="l01022"></a><span class="lineno"> 1022</span>&#160;    computeTFactor&lt;B&gt;(v, mat_taus_retiled.read(GlobalTileIndex(j_sub, 0)), t.readwrite(t_idx));</div>
+<div class="line"><a name="l01023"></a><span class="lineno"> 1023</span>&#160; </div>
+<div class="line"><a name="l01024"></a><span class="lineno"> 1024</span>&#160;    <span class="comment">// PREPARATION FOR TRAILING MATRIX UPDATE</span></div>
+<div class="line"><a name="l01025"></a><span class="lineno"> 1025</span>&#160;    <span class="keyword">const</span> GlobalElementIndex at_offset(ij_offset + GlobalElementSize(0, band_size));</div>
+<div class="line"><a name="l01026"></a><span class="lineno"> 1026</span>&#160; </div>
+<div class="line"><a name="l01027"></a><span class="lineno"> 1027</span>&#160;    <span class="comment">// Note: if there is no trailing matrix, algorithm has finised</span></div>
+<div class="line"><a name="l01028"></a><span class="lineno"> 1028</span>&#160;    <span class="keywordflow">if</span> (!at_offset.isIn(mat_a.size()))</div>
+<div class="line"><a name="l01029"></a><span class="lineno"> 1029</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l01030"></a><span class="lineno"> 1030</span>&#160; </div>
+<div class="line"><a name="l01031"></a><span class="lineno"> 1031</span>&#160;    <span class="keyword">const</span> matrix::SubMatrixView trailing_matrix_view(dist_a, at_offset);</div>
+<div class="line"><a name="l01032"></a><span class="lineno"> 1032</span>&#160; </div>
+<div class="line"><a name="l01033"></a><span class="lineno"> 1033</span>&#160;    <span class="comment">// W = V . T</span></div>
+<div class="line"><a name="l01034"></a><span class="lineno"> 1034</span>&#160;    Panel&lt;Coord::Col, T, D&gt;&amp; w = panels_w.nextResource();</div>
+<div class="line"><a name="l01035"></a><span class="lineno"> 1035</span>&#160;    w.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01036"></a><span class="lineno"> 1036</span>&#160;    <span class="keywordflow">if</span> (isPanelIncomplete)</div>
+<div class="line"><a name="l01037"></a><span class="lineno"> 1037</span>&#160;      w.setWidth(nrefls_tile);</div>
+<div class="line"><a name="l01038"></a><span class="lineno"> 1038</span>&#160; </div>
+<div class="line"><a name="l01039"></a><span class="lineno"> 1039</span>&#160;    trmmComputeW&lt;B&gt;(w, v, t.read(t_idx));</div>
+<div class="line"><a name="l01040"></a><span class="lineno"> 1040</span>&#160; </div>
+<div class="line"><a name="l01041"></a><span class="lineno"> 1041</span>&#160;    <span class="comment">// X = At . W</span></div>
+<div class="line"><a name="l01042"></a><span class="lineno"> 1042</span>&#160;    Panel&lt;Coord::Col, T, D&gt;&amp; x = panels_x.nextResource();</div>
+<div class="line"><a name="l01043"></a><span class="lineno"> 1043</span>&#160;    x.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01044"></a><span class="lineno"> 1044</span>&#160;    <span class="keywordflow">if</span> (isPanelIncomplete)</div>
+<div class="line"><a name="l01045"></a><span class="lineno"> 1045</span>&#160;      x.setWidth(nrefls_tile);</div>
+<div class="line"><a name="l01046"></a><span class="lineno"> 1046</span>&#160; </div>
+<div class="line"><a name="l01047"></a><span class="lineno"> 1047</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01048"></a><span class="lineno"> 1048</span>&#160;    <span class="comment">// Since At is hermitian, just the lower part is referenced.</span></div>
+<div class="line"><a name="l01049"></a><span class="lineno"> 1049</span>&#160;    <span class="comment">// When the tile is not part of the main diagonal, the same tile has to be used for two computations</span></div>
+<div class="line"><a name="l01050"></a><span class="lineno"> 1050</span>&#160;    <span class="comment">// that will contribute to two different rows of X: the ones indexed with row and col.</span></div>
+<div class="line"><a name="l01051"></a><span class="lineno"> 1051</span>&#160;    hemmComputeX&lt;B&gt;(x, trailing_matrix_view, mat_a, w);</div>
+<div class="line"><a name="l01052"></a><span class="lineno"> 1052</span>&#160; </div>
+<div class="line"><a name="l01053"></a><span class="lineno"> 1053</span>&#160;    <span class="comment">// In the next section the next two operations are performed</span></div>
+<div class="line"><a name="l01054"></a><span class="lineno"> 1054</span>&#160;    <span class="comment">// A) W2 = W* . X</span></div>
+<div class="line"><a name="l01055"></a><span class="lineno"> 1055</span>&#160;    <span class="comment">// B) X -= 1/2 . V . W2</span></div>
+<div class="line"><a name="l01056"></a><span class="lineno"> 1056</span>&#160; </div>
+<div class="line"><a name="l01057"></a><span class="lineno"> 1057</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01058"></a><span class="lineno"> 1058</span>&#160;    <span class="comment">// T can be re-used because it is not needed anymore in this step and it has the same shape</span></div>
+<div class="line"><a name="l01059"></a><span class="lineno"> 1059</span>&#160;    Matrix&lt;T, D&gt; w2 = std::move(t);</div>
+<div class="line"><a name="l01060"></a><span class="lineno"> 1060</span>&#160; </div>
+<div class="line"><a name="l01061"></a><span class="lineno"> 1061</span>&#160;    gemmComputeW2&lt;B&gt;(w2, w, x);</div>
+<div class="line"><a name="l01062"></a><span class="lineno"> 1062</span>&#160;    gemmUpdateX&lt;B&gt;(x, w2, v);</div>
+<div class="line"><a name="l01063"></a><span class="lineno"> 1063</span>&#160; </div>
+<div class="line"><a name="l01064"></a><span class="lineno"> 1064</span>&#160;    <span class="comment">// TRAILING MATRIX UPDATE</span></div>
+<div class="line"><a name="l01065"></a><span class="lineno"> 1065</span>&#160; </div>
+<div class="line"><a name="l01066"></a><span class="lineno"> 1066</span>&#160;    <span class="comment">// At -= X . V* + V . X*</span></div>
+<div class="line"><a name="l01067"></a><span class="lineno"> 1067</span>&#160;    her2kUpdateTrailingMatrix&lt;B&gt;(trailing_matrix_view, mat_a, x, v);</div>
+<div class="line"><a name="l01068"></a><span class="lineno"> 1068</span>&#160; </div>
+<div class="line"><a name="l01069"></a><span class="lineno"> 1069</span>&#160;    x.reset();</div>
+<div class="line"><a name="l01070"></a><span class="lineno"> 1070</span>&#160;    w.reset();</div>
+<div class="line"><a name="l01071"></a><span class="lineno"> 1071</span>&#160;    v.reset();</div>
+<div class="line"><a name="l01072"></a><span class="lineno"> 1072</span>&#160;  }</div>
+<div class="line"><a name="l01073"></a><span class="lineno"> 1073</span>&#160; </div>
+<div class="line"><a name="l01074"></a><span class="lineno"> 1074</span>&#160;  <span class="keywordflow">return</span> mat_taus;</div>
+<div class="line"><a name="l01075"></a><span class="lineno"> 1075</span>&#160;}</div>
+<div class="line"><a name="l01076"></a><span class="lineno"> 1076</span>&#160; </div>
+<div class="line"><a name="l01077"></a><span class="lineno"> 1077</span>&#160;<span class="comment">// Distributed implementation of reduction to band</span></div>
+<div class="line"><a name="l01078"></a><span class="lineno"> 1078</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l01079"></a><span class="lineno"> 1079</span>&#160;Matrix&lt;T, Device::CPU&gt; ReductionToBand&lt;B, D, T&gt;::call(comm::CommunicatorGrid grid, Matrix&lt;T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l01080"></a><span class="lineno"> 1080</span>&#160;                                                      <span class="keyword">const</span> SizeType band_size) {</div>
+<div class="line"><a name="l01081"></a><span class="lineno"> 1081</span>&#160;  <span class="keyword">using namespace </span>red2band::distributed;</div>
+<div class="line"><a name="l01082"></a><span class="lineno"> 1082</span>&#160; </div>
+<div class="line"><a name="l01083"></a><span class="lineno"> 1083</span>&#160;  <span class="keyword">using</span> common::iterate_range2d;</div>
+<div class="line"><a name="l01084"></a><span class="lineno"> 1084</span>&#160;  <span class="keyword">using</span> factorization::internal::computeTFactor;</div>
+<div class="line"><a name="l01085"></a><span class="lineno"> 1085</span>&#160; </div>
+<div class="line"><a name="l01086"></a><span class="lineno"> 1086</span>&#160;  <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
+<div class="line"><a name="l01087"></a><span class="lineno"> 1087</span>&#160; </div>
+<div class="line"><a name="l01088"></a><span class="lineno"> 1088</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01089"></a><span class="lineno"> 1089</span>&#160;  <span class="comment">// This is a temporary workaround.</span></div>
+<div class="line"><a name="l01090"></a><span class="lineno"> 1090</span>&#160;  <span class="comment">// See issue https://github.com/eth-cscs/DLA-Future/issues/729</span></div>
+<div class="line"><a name="l01091"></a><span class="lineno"> 1091</span>&#160;  pika::threads::get_thread_manager().wait();</div>
+<div class="line"><a name="l01092"></a><span class="lineno"> 1092</span>&#160; </div>
+<div class="line"><a name="l01093"></a><span class="lineno"> 1093</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_col_chain_panel(grid.colCommunicator().clone());</div>
+<div class="line"><a name="l01094"></a><span class="lineno"> 1094</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_row_chain(grid.rowCommunicator().clone());</div>
+<div class="line"><a name="l01095"></a><span class="lineno"> 1095</span>&#160;  common::Pipeline&lt;comm::Communicator&gt; mpi_col_chain(grid.colCommunicator().clone());</div>
+<div class="line"><a name="l01096"></a><span class="lineno"> 1096</span>&#160; </div>
+<div class="line"><a name="l01097"></a><span class="lineno"> 1097</span>&#160;  <span class="keyword">const</span> <span class="keyword">auto</span>&amp; dist = mat_a.distribution();</div>
+<div class="line"><a name="l01098"></a><span class="lineno"> 1098</span>&#160;  <span class="keyword">const</span> comm::Index2D rank = dist.rankIndex();</div>
+<div class="line"><a name="l01099"></a><span class="lineno"> 1099</span>&#160; </div>
+<div class="line"><a name="l01100"></a><span class="lineno"> 1100</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01101"></a><span class="lineno"> 1101</span>&#160;  <span class="comment">// Reflector of size = 1 is not considered whatever T is (i.e. neither real nor complex)</span></div>
+<div class="line"><a name="l01102"></a><span class="lineno"> 1102</span>&#160;  <span class="keyword">const</span> SizeType nrefls = std::max&lt;SizeType&gt;(0, dist.size().rows() - band_size - 1);</div>
+<div class="line"><a name="l01103"></a><span class="lineno"> 1103</span>&#160; </div>
+<div class="line"><a name="l01104"></a><span class="lineno"> 1104</span>&#160;  <span class="comment">// Row-vector that is distributed over columns, but exists locally on all rows of the grid</span></div>
+<div class="line"><a name="l01105"></a><span class="lineno"> 1105</span>&#160;  DLAF_ASSERT(mat_a.blockSize().cols() % band_size == 0, mat_a.blockSize().cols(), band_size);</div>
+<div class="line"><a name="l01106"></a><span class="lineno"> 1106</span>&#160;  Matrix&lt;T, Device::CPU&gt; mat_taus(matrix::Distribution(GlobalElementSize(nrefls, 1),</div>
+<div class="line"><a name="l01107"></a><span class="lineno"> 1107</span>&#160;                                                       TileElementSize(mat_a.blockSize().cols(), 1),</div>
+<div class="line"><a name="l01108"></a><span class="lineno"> 1108</span>&#160;                                                       comm::Size2D(mat_a.commGridSize().cols(), 1),</div>
+<div class="line"><a name="l01109"></a><span class="lineno"> 1109</span>&#160;                                                       comm::Index2D(mat_a.rankIndex().col(), 0),</div>
+<div class="line"><a name="l01110"></a><span class="lineno"> 1110</span>&#160;                                                       comm::Index2D(mat_a.sourceRankIndex().col(), 0)));</div>
+<div class="line"><a name="l01111"></a><span class="lineno"> 1111</span>&#160; </div>
+<div class="line"><a name="l01112"></a><span class="lineno"> 1112</span>&#160;  <span class="keywordflow">if</span> (nrefls == 0)</div>
+<div class="line"><a name="l01113"></a><span class="lineno"> 1113</span>&#160;    <span class="keywordflow">return</span> mat_taus;</div>
+<div class="line"><a name="l01114"></a><span class="lineno"> 1114</span>&#160; </div>
+<div class="line"><a name="l01115"></a><span class="lineno"> 1115</span>&#160;  Matrix&lt;T, Device::CPU&gt; mat_taus_retiled =</div>
+<div class="line"><a name="l01116"></a><span class="lineno"> 1116</span>&#160;      mat_taus.retiledSubPipeline(LocalTileSize(mat_a.blockSize().cols() / band_size, 1));</div>
+<div class="line"><a name="l01117"></a><span class="lineno"> 1117</span>&#160; </div>
+<div class="line"><a name="l01118"></a><span class="lineno"> 1118</span>&#160;  <span class="keyword">const</span> SizeType ntiles = (nrefls - 1) / band_size + 1;</div>
+<div class="line"><a name="l01119"></a><span class="lineno"> 1119</span>&#160;  DLAF_ASSERT(ntiles == mat_taus_retiled.nrTiles().rows(), ntiles, mat_taus_retiled.nrTiles().rows());</div>
+<div class="line"><a name="l01120"></a><span class="lineno"> 1120</span>&#160; </div>
+<div class="line"><a name="l01121"></a><span class="lineno"> 1121</span>&#160;  <span class="keyword">const</span> <span class="keywordtype">bool</span> is_full_band = (band_size == dist.blockSize().cols());</div>
+<div class="line"><a name="l01122"></a><span class="lineno"> 1122</span>&#160; </div>
+<div class="line"><a name="l01123"></a><span class="lineno"> 1123</span>&#160;  constexpr std::size_t n_workspaces = 2;</div>
+<div class="line"><a name="l01124"></a><span class="lineno"> 1124</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, D&gt;&gt; panels_v(n_workspaces, dist);</div>
+<div class="line"><a name="l01125"></a><span class="lineno"> 1125</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&gt; panels_vt(</div>
+<div class="line"><a name="l01126"></a><span class="lineno"> 1126</span>&#160;      n_workspaces, dist);</div>
+<div class="line"><a name="l01127"></a><span class="lineno"> 1127</span>&#160; </div>
+<div class="line"><a name="l01128"></a><span class="lineno"> 1128</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, D&gt;&gt; panels_w(n_workspaces, dist);</div>
+<div class="line"><a name="l01129"></a><span class="lineno"> 1129</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&gt; panels_wt(</div>
+<div class="line"><a name="l01130"></a><span class="lineno"> 1130</span>&#160;      n_workspaces, dist);</div>
+<div class="line"><a name="l01131"></a><span class="lineno"> 1131</span>&#160; </div>
+<div class="line"><a name="l01132"></a><span class="lineno"> 1132</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Col, T, D&gt;&gt; panels_x(n_workspaces, dist);</div>
+<div class="line"><a name="l01133"></a><span class="lineno"> 1133</span>&#160;  common::RoundRobin&lt;matrix::Panel&lt;Coord::Row, T, D, matrix::StoreTransposed::Yes&gt;&gt; panels_xt(</div>
+<div class="line"><a name="l01134"></a><span class="lineno"> 1134</span>&#160;      n_workspaces, dist);</div>
+<div class="line"><a name="l01135"></a><span class="lineno"> 1135</span>&#160; </div>
+<div class="line"><a name="l01136"></a><span class="lineno"> 1136</span>&#160;  red2band::ComputePanelHelper&lt;B, D, T&gt; compute_panel_helper(n_workspaces, dist);</div>
+<div class="line"><a name="l01137"></a><span class="lineno"> 1137</span>&#160; </div>
+<div class="line"><a name="l01138"></a><span class="lineno"> 1138</span>&#160;  ex::unique_any_sender&lt;&gt; trigger_panel{ex::just()};</div>
+<div class="line"><a name="l01139"></a><span class="lineno"> 1139</span>&#160;  <span class="keywordflow">for</span> (SizeType j_sub = 0; j_sub &lt; ntiles; ++j_sub) {</div>
+<div class="line"><a name="l01140"></a><span class="lineno"> 1140</span>&#160;    <span class="keyword">const</span> SizeType i_sub = j_sub + 1;</div>
+<div class="line"><a name="l01141"></a><span class="lineno"> 1141</span>&#160; </div>
+<div class="line"><a name="l01142"></a><span class="lineno"> 1142</span>&#160;    <span class="keyword">const</span> GlobalElementIndex ij_offset(i_sub * band_size, j_sub * band_size);</div>
+<div class="line"><a name="l01143"></a><span class="lineno"> 1143</span>&#160;    <span class="keyword">const</span> GlobalElementIndex at_offset(i_sub * band_size, (j_sub + 1) * band_size);</div>
+<div class="line"><a name="l01144"></a><span class="lineno"> 1144</span>&#160; </div>
+<div class="line"><a name="l01145"></a><span class="lineno"> 1145</span>&#160;    <span class="keyword">const</span> comm::Index2D rank_v0{</div>
+<div class="line"><a name="l01146"></a><span class="lineno"> 1146</span>&#160;        dist.template rankGlobalElement&lt;Coord::Row&gt;(ij_offset.row()),</div>
+<div class="line"><a name="l01147"></a><span class="lineno"> 1147</span>&#160;        dist.template rankGlobalElement&lt;Coord::Col&gt;(ij_offset.col()),</div>
+<div class="line"><a name="l01148"></a><span class="lineno"> 1148</span>&#160;    };</div>
+<div class="line"><a name="l01149"></a><span class="lineno"> 1149</span>&#160; </div>
+<div class="line"><a name="l01150"></a><span class="lineno"> 1150</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> is_panel_rank_col = rank_v0.col() == rank.col();</div>
+<div class="line"><a name="l01151"></a><span class="lineno"> 1151</span>&#160; </div>
+<div class="line"><a name="l01152"></a><span class="lineno"> 1152</span>&#160;    <span class="keyword">const</span> SizeType nrefls_tile = mat_taus_retiled.tileSize(GlobalTileIndex(j_sub, 0)).rows();</div>
+<div class="line"><a name="l01153"></a><span class="lineno"> 1153</span>&#160; </div>
+<div class="line"><a name="l01154"></a><span class="lineno"> 1154</span>&#160;    <span class="keywordflow">if</span> (nrefls_tile == 0)</div>
+<div class="line"><a name="l01155"></a><span class="lineno"> 1155</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l01156"></a><span class="lineno"> 1156</span>&#160; </div>
+<div class="line"><a name="l01157"></a><span class="lineno"> 1157</span>&#160;    <span class="keyword">auto</span>&amp; v = panels_v.nextResource();</div>
+<div class="line"><a name="l01158"></a><span class="lineno"> 1158</span>&#160;    <span class="keyword">auto</span>&amp; vt = panels_vt.nextResource();</div>
+<div class="line"><a name="l01159"></a><span class="lineno"> 1159</span>&#160; </div>
+<div class="line"><a name="l01160"></a><span class="lineno"> 1160</span>&#160;    v.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01161"></a><span class="lineno"> 1161</span>&#160;    vt.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01162"></a><span class="lineno"> 1162</span>&#160; </div>
+<div class="line"><a name="l01163"></a><span class="lineno"> 1163</span>&#160;    v.setWidth(nrefls_tile);</div>
+<div class="line"><a name="l01164"></a><span class="lineno"> 1164</span>&#160;    vt.setHeight(nrefls_tile);</div>
+<div class="line"><a name="l01165"></a><span class="lineno"> 1165</span>&#160; </div>
+<div class="line"><a name="l01166"></a><span class="lineno"> 1166</span>&#160;    <span class="keyword">const</span> LocalTileIndex t_idx(0, 0);</div>
+<div class="line"><a name="l01167"></a><span class="lineno"> 1167</span>&#160;    <span class="comment">// TODO used just by the column, maybe we can re-use a panel tile?</span></div>
+<div class="line"><a name="l01168"></a><span class="lineno"> 1168</span>&#160;    <span class="comment">// TODO or we can keep just the sh_future and allocate just inside if (is_panel_rank_col)</span></div>
+<div class="line"><a name="l01169"></a><span class="lineno"> 1169</span>&#160;    matrix::Matrix&lt;T, D&gt; t({nrefls_tile, nrefls_tile}, dist.blockSize());</div>
+<div class="line"><a name="l01170"></a><span class="lineno"> 1170</span>&#160; </div>
+<div class="line"><a name="l01171"></a><span class="lineno"> 1171</span>&#160;    <span class="comment">// PANEL</span></div>
+<div class="line"><a name="l01172"></a><span class="lineno"> 1172</span>&#160;    <span class="keyword">const</span> matrix::SubPanelView panel_view(dist, ij_offset, band_size);</div>
+<div class="line"><a name="l01173"></a><span class="lineno"> 1173</span>&#160; </div>
+<div class="line"><a name="l01174"></a><span class="lineno"> 1174</span>&#160;    <span class="keywordflow">if</span> (is_panel_rank_col) {</div>
+<div class="line"><a name="l01175"></a><span class="lineno"> 1175</span>&#160;      compute_panel_helper.call(std::move(trigger_panel), rank_v0.row(), mpi_col_chain_panel(), mat_a,</div>
+<div class="line"><a name="l01176"></a><span class="lineno"> 1176</span>&#160;                                mat_taus_retiled, j_sub, panel_view);</div>
+<div class="line"><a name="l01177"></a><span class="lineno"> 1177</span>&#160; </div>
+<div class="line"><a name="l01178"></a><span class="lineno"> 1178</span>&#160;      <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01179"></a><span class="lineno"> 1179</span>&#160;      <span class="comment">// - has_reflector_head tells if this rank owns the first tile of the panel</span></div>
+<div class="line"><a name="l01180"></a><span class="lineno"> 1180</span>&#160;      <span class="comment">// - if !is_full_band it has to force copy as a workaround, otherwise in update matrix it would</span></div>
+<div class="line"><a name="l01181"></a><span class="lineno"> 1181</span>&#160;      <span class="comment">// deadlock due to tile shared between panel and trailing matrix</span></div>
+<div class="line"><a name="l01182"></a><span class="lineno"> 1182</span>&#160;      red2band::local::setupReflectorPanelV&lt;B, D, T&gt;(rank.row() == rank_v0.row(), panel_view,</div>
+<div class="line"><a name="l01183"></a><span class="lineno"> 1183</span>&#160;                                                     nrefls_tile, v, mat_a, !is_full_band);</div>
+<div class="line"><a name="l01184"></a><span class="lineno"> 1184</span>&#160;      computeTFactor&lt;B&gt;(v, mat_taus_retiled.read(GlobalTileIndex(j_sub, 0)), t.readwrite(t_idx),</div>
+<div class="line"><a name="l01185"></a><span class="lineno"> 1185</span>&#160;                        mpi_col_chain);</div>
+<div class="line"><a name="l01186"></a><span class="lineno"> 1186</span>&#160;    }</div>
+<div class="line"><a name="l01187"></a><span class="lineno"> 1187</span>&#160; </div>
+<div class="line"><a name="l01188"></a><span class="lineno"> 1188</span>&#160;    <span class="comment">// PREPARATION FOR TRAILING MATRIX UPDATE</span></div>
+<div class="line"><a name="l01189"></a><span class="lineno"> 1189</span>&#160; </div>
+<div class="line"><a name="l01190"></a><span class="lineno"> 1190</span>&#160;    <span class="comment">// Note: if there is no trailing matrix, algorithm has finised</span></div>
+<div class="line"><a name="l01191"></a><span class="lineno"> 1191</span>&#160;    <span class="keywordflow">if</span> (!at_offset.isIn(mat_a.size()))</div>
+<div class="line"><a name="l01192"></a><span class="lineno"> 1192</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l01193"></a><span class="lineno"> 1193</span>&#160; </div>
+<div class="line"><a name="l01194"></a><span class="lineno"> 1194</span>&#160;    <span class="keyword">const</span> matrix::SubMatrixView trailing_matrix_view(dist, at_offset);</div>
+<div class="line"><a name="l01195"></a><span class="lineno"> 1195</span>&#160; </div>
+<div class="line"><a name="l01196"></a><span class="lineno"> 1196</span>&#160;    comm::broadcast(rank_v0.col(), v, vt, mpi_row_chain, mpi_col_chain);</div>
+<div class="line"><a name="l01197"></a><span class="lineno"> 1197</span>&#160; </div>
+<div class="line"><a name="l01198"></a><span class="lineno"> 1198</span>&#160;    <span class="comment">// W = V . T</span></div>
+<div class="line"><a name="l01199"></a><span class="lineno"> 1199</span>&#160;    <span class="keyword">auto</span>&amp; w = panels_w.nextResource();</div>
+<div class="line"><a name="l01200"></a><span class="lineno"> 1200</span>&#160;    <span class="keyword">auto</span>&amp; wt = panels_wt.nextResource();</div>
+<div class="line"><a name="l01201"></a><span class="lineno"> 1201</span>&#160; </div>
+<div class="line"><a name="l01202"></a><span class="lineno"> 1202</span>&#160;    w.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01203"></a><span class="lineno"> 1203</span>&#160;    wt.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01204"></a><span class="lineno"> 1204</span>&#160; </div>
+<div class="line"><a name="l01205"></a><span class="lineno"> 1205</span>&#160;    w.setWidth(nrefls_tile);</div>
+<div class="line"><a name="l01206"></a><span class="lineno"> 1206</span>&#160;    wt.setHeight(nrefls_tile);</div>
+<div class="line"><a name="l01207"></a><span class="lineno"> 1207</span>&#160; </div>
+<div class="line"><a name="l01208"></a><span class="lineno"> 1208</span>&#160;    <span class="keywordflow">if</span> (is_panel_rank_col)</div>
+<div class="line"><a name="l01209"></a><span class="lineno"> 1209</span>&#160;      red2band::local::trmmComputeW&lt;B, D&gt;(w, v, t.read(t_idx));</div>
+<div class="line"><a name="l01210"></a><span class="lineno"> 1210</span>&#160; </div>
+<div class="line"><a name="l01211"></a><span class="lineno"> 1211</span>&#160;    comm::broadcast(rank_v0.col(), w, wt, mpi_row_chain, mpi_col_chain);</div>
+<div class="line"><a name="l01212"></a><span class="lineno"> 1212</span>&#160; </div>
+<div class="line"><a name="l01213"></a><span class="lineno"> 1213</span>&#160;    <span class="comment">// X = At . W</span></div>
+<div class="line"><a name="l01214"></a><span class="lineno"> 1214</span>&#160;    <span class="keyword">auto</span>&amp; x = panels_x.nextResource();</div>
+<div class="line"><a name="l01215"></a><span class="lineno"> 1215</span>&#160;    <span class="keyword">auto</span>&amp; xt = panels_xt.nextResource();</div>
+<div class="line"><a name="l01216"></a><span class="lineno"> 1216</span>&#160; </div>
+<div class="line"><a name="l01217"></a><span class="lineno"> 1217</span>&#160;    x.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01218"></a><span class="lineno"> 1218</span>&#160;    xt.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01219"></a><span class="lineno"> 1219</span>&#160; </div>
+<div class="line"><a name="l01220"></a><span class="lineno"> 1220</span>&#160;    x.setWidth(nrefls_tile);</div>
+<div class="line"><a name="l01221"></a><span class="lineno"> 1221</span>&#160;    xt.setHeight(nrefls_tile);</div>
+<div class="line"><a name="l01222"></a><span class="lineno"> 1222</span>&#160; </div>
+<div class="line"><a name="l01223"></a><span class="lineno"> 1223</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01224"></a><span class="lineno"> 1224</span>&#160;    <span class="comment">// Since At is hermitian, just the lower part is referenced.</span></div>
+<div class="line"><a name="l01225"></a><span class="lineno"> 1225</span>&#160;    <span class="comment">// When the tile is not part of the main diagonal, the same tile has to be used for two computations</span></div>
+<div class="line"><a name="l01226"></a><span class="lineno"> 1226</span>&#160;    <span class="comment">// that will contribute to two different rows of X: the ones indexed with row and col.</span></div>
+<div class="line"><a name="l01227"></a><span class="lineno"> 1227</span>&#160;    <span class="comment">// This is achieved by storing the two results in two different workspaces: X and X_conj respectively.</span></div>
+<div class="line"><a name="l01228"></a><span class="lineno"> 1228</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01229"></a><span class="lineno"> 1229</span>&#160;    <span class="comment">// On exit, x will contain a valid result just on ranks belonging to the column panel.</span></div>
+<div class="line"><a name="l01230"></a><span class="lineno"> 1230</span>&#160;    <span class="comment">// For what concerns xt, it is just used as support and it contains junk data on all ranks.</span></div>
+<div class="line"><a name="l01231"></a><span class="lineno"> 1231</span>&#160;    hemmComputeX&lt;B, D&gt;(rank_v0.col(), x, xt, trailing_matrix_view, mat_a, w, wt, mpi_row_chain,</div>
+<div class="line"><a name="l01232"></a><span class="lineno"> 1232</span>&#160;                       mpi_col_chain);</div>
+<div class="line"><a name="l01233"></a><span class="lineno"> 1233</span>&#160; </div>
+<div class="line"><a name="l01234"></a><span class="lineno"> 1234</span>&#160;    <span class="comment">// In the next section the next two operations are performed</span></div>
+<div class="line"><a name="l01235"></a><span class="lineno"> 1235</span>&#160;    <span class="comment">// A) W2 = W* . X</span></div>
+<div class="line"><a name="l01236"></a><span class="lineno"> 1236</span>&#160;    <span class="comment">// B) X -= 1/2 . V . W2</span></div>
+<div class="line"><a name="l01237"></a><span class="lineno"> 1237</span>&#160; </div>
+<div class="line"><a name="l01238"></a><span class="lineno"> 1238</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01239"></a><span class="lineno"> 1239</span>&#160;    <span class="comment">// Now the intermediate result for X is available on the panel column ranks,</span></div>
+<div class="line"><a name="l01240"></a><span class="lineno"> 1240</span>&#160;    <span class="comment">// which have locally all the needed stuff for updating X and finalize the result</span></div>
+<div class="line"><a name="l01241"></a><span class="lineno"> 1241</span>&#160;    <span class="keywordflow">if</span> (is_panel_rank_col) {</div>
+<div class="line"><a name="l01242"></a><span class="lineno"> 1242</span>&#160;      <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01243"></a><span class="lineno"> 1243</span>&#160;      <span class="comment">// T can be re-used because it is not needed anymore in this step and it has the same shape</span></div>
+<div class="line"><a name="l01244"></a><span class="lineno"> 1244</span>&#160;      matrix::Matrix&lt;T, D&gt; w2 = std::move(t);</div>
+<div class="line"><a name="l01245"></a><span class="lineno"> 1245</span>&#160; </div>
+<div class="line"><a name="l01246"></a><span class="lineno"> 1246</span>&#160;      red2band::local::gemmComputeW2&lt;B, D&gt;(w2, w, x);</div>
+<div class="line"><a name="l01247"></a><span class="lineno"> 1247</span>&#160;      ex::start_detached(comm::scheduleAllReduceInPlace(mpi_col_chain(), MPI_SUM,</div>
+<div class="line"><a name="l01248"></a><span class="lineno"> 1248</span>&#160;                                                        w2.readwrite(LocalTileIndex(0, 0))));</div>
+<div class="line"><a name="l01249"></a><span class="lineno"> 1249</span>&#160; </div>
+<div class="line"><a name="l01250"></a><span class="lineno"> 1250</span>&#160;      red2band::local::gemmUpdateX&lt;B, D&gt;(x, w2, v);</div>
+<div class="line"><a name="l01251"></a><span class="lineno"> 1251</span>&#160;    }</div>
+<div class="line"><a name="l01252"></a><span class="lineno"> 1252</span>&#160; </div>
+<div class="line"><a name="l01253"></a><span class="lineno"> 1253</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01254"></a><span class="lineno"> 1254</span>&#160;    <span class="comment">// xt has been used previously as workspace for hemmComputeX, so it has to be reset, because now it</span></div>
+<div class="line"><a name="l01255"></a><span class="lineno"> 1255</span>&#160;    <span class="comment">// will be used for accessing the broadcasted version of x</span></div>
+<div class="line"><a name="l01256"></a><span class="lineno"> 1256</span>&#160;    xt.reset();</div>
+<div class="line"><a name="l01257"></a><span class="lineno"> 1257</span>&#160;    xt.setRangeStart(at_offset);</div>
+<div class="line"><a name="l01258"></a><span class="lineno"> 1258</span>&#160;    xt.setHeight(nrefls_tile);</div>
+<div class="line"><a name="l01259"></a><span class="lineno"> 1259</span>&#160; </div>
+<div class="line"><a name="l01260"></a><span class="lineno"> 1260</span>&#160;    comm::broadcast(rank_v0.col(), x, xt, mpi_row_chain, mpi_col_chain);</div>
+<div class="line"><a name="l01261"></a><span class="lineno"> 1261</span>&#160; </div>
+<div class="line"><a name="l01262"></a><span class="lineno"> 1262</span>&#160;    <span class="comment">// TRAILING MATRIX UPDATE</span></div>
+<div class="line"><a name="l01263"></a><span class="lineno"> 1263</span>&#160; </div>
+<div class="line"><a name="l01264"></a><span class="lineno"> 1264</span>&#160;    <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01265"></a><span class="lineno"> 1265</span>&#160;    <span class="comment">// This trigger mechanism allows to control when the next iteration of compute panel will start.</span></div>
+<div class="line"><a name="l01266"></a><span class="lineno"> 1266</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01267"></a><span class="lineno"> 1267</span>&#160;    <span class="comment">// * What?</span></div>
+<div class="line"><a name="l01268"></a><span class="lineno"> 1268</span>&#160;    <span class="comment">// Compute panel uses MPI blocking communication that might block the only computing thread</span></div>
+<div class="line"><a name="l01269"></a><span class="lineno"> 1269</span>&#160;    <span class="comment">// available (since blocking communication are scheduled on normal queues and not on the MPI</span></div>
+<div class="line"><a name="l01270"></a><span class="lineno"> 1270</span>&#160;    <span class="comment">// dedicated one).</span></div>
+<div class="line"><a name="l01271"></a><span class="lineno"> 1271</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01272"></a><span class="lineno"> 1272</span>&#160;    <span class="comment">// * How?</span></div>
+<div class="line"><a name="l01273"></a><span class="lineno"> 1273</span>&#160;    <span class="comment">// If pika runtime has only 2 threads, one is dedicated to MPI and there is just one for</span></div>
+<div class="line"><a name="l01274"></a><span class="lineno"> 1274</span>&#160;    <span class="comment">// computation, that might get blocked by blocking MPI communication, without the chance to do</span></div>
+<div class="line"><a name="l01275"></a><span class="lineno"> 1275</span>&#160;    <span class="comment">// anything else. (TODO this might happen even with more reductions happening in parallel)</span></div>
+<div class="line"><a name="l01276"></a><span class="lineno"> 1276</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01277"></a><span class="lineno"> 1277</span>&#160;    <span class="comment">// * Why?</span></div>
+<div class="line"><a name="l01278"></a><span class="lineno"> 1278</span>&#160;    <span class="comment">// Panel computation at step i is done on the first column of the trailing matrix computed</span></div>
+<div class="line"><a name="l01279"></a><span class="lineno"> 1279</span>&#160;    <span class="comment">// at step i-1.</span></div>
+<div class="line"><a name="l01280"></a><span class="lineno"> 1280</span>&#160;    <span class="comment">// The rank owning the top-left tile of the trailing matrix, can update it as soon as it</span></div>
+<div class="line"><a name="l01281"></a><span class="lineno"> 1281</span>&#160;    <span class="comment">// receives X[0], which due to the pivot position is also the Xt[0]. Once it can go to the next</span></div>
+<div class="line"><a name="l01282"></a><span class="lineno"> 1282</span>&#160;    <span class="comment">// iteration, it ends up stucked in an MPI blocking communication, waiting for the others joining</span></div>
+<div class="line"><a name="l01283"></a><span class="lineno"> 1283</span>&#160;    <span class="comment">// before being able to advance.</span></div>
+<div class="line"><a name="l01284"></a><span class="lineno"> 1284</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01285"></a><span class="lineno"> 1285</span>&#160;    <span class="comment">// But at the same time, other ranks in the same column (needed for the next panel update), cannot</span></div>
+<div class="line"><a name="l01286"></a><span class="lineno"> 1286</span>&#160;    <span class="comment">// complete the trailing matrix update. Indeed, they are waiting for the pivot rank to communicate</span></div>
+<div class="line"><a name="l01287"></a><span class="lineno"> 1287</span>&#160;    <span class="comment">// column-wise Xt[0] (during x -&gt; xt panel transpose broadcast), but he is not going to schedule</span></div>
+<div class="line"><a name="l01288"></a><span class="lineno"> 1288</span>&#160;    <span class="comment">// anything because the only normal thread which can do that is stuck in an MPI blocking</span></div>
+<div class="line"><a name="l01289"></a><span class="lineno"> 1289</span>&#160;    <span class="comment">// communication that is not going to advance... and so it&#39;s a DEADLOCK!</span></div>
+<div class="line"><a name="l01290"></a><span class="lineno"> 1290</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01291"></a><span class="lineno"> 1291</span>&#160;    <span class="comment">// * Solution:</span></div>
+<div class="line"><a name="l01292"></a><span class="lineno"> 1292</span>&#160;    <span class="comment">// The idea is to make the next panel depending not only on tiles stored locally, but also to</span></div>
+<div class="line"><a name="l01293"></a><span class="lineno"> 1293</span>&#160;    <span class="comment">// ensure that others have received Xt[0], which is needed to advance the computation and let</span></div>
+<div class="line"><a name="l01294"></a><span class="lineno"> 1294</span>&#160;    <span class="comment">// others arrive at the next iteration where the pivot will wait for them to complete the MPI</span></div>
+<div class="line"><a name="l01295"></a><span class="lineno"> 1295</span>&#160;    <span class="comment">// blocking communication.</span></div>
+<div class="line"><a name="l01296"></a><span class="lineno"> 1296</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01297"></a><span class="lineno"> 1297</span>&#160;    <span class="comment">// * Why is it different between MC and GPU?</span></div>
+<div class="line"><a name="l01298"></a><span class="lineno"> 1298</span>&#160;    <span class="comment">// As said above, the problem is related to the communication. But the communication is not said</span></div>
+<div class="line"><a name="l01299"></a><span class="lineno"> 1299</span>&#160;    <span class="comment">// to be an atomic operation happening in a single task. It might have to create a copy to</span></div>
+<div class="line"><a name="l01300"></a><span class="lineno"> 1300</span>&#160;    <span class="comment">// a buffer more suitable for the communication (e.g. GPU -&gt; CPU if RDMA is not available).</span></div>
+<div class="line"><a name="l01301"></a><span class="lineno"> 1301</span>&#160;    <span class="comment">//</span></div>
+<div class="line"><a name="l01302"></a><span class="lineno"> 1302</span>&#160;    <span class="comment">// And in order to not be blocked, it must be ensured that the actual communication task has</span></div>
+<div class="line"><a name="l01303"></a><span class="lineno"> 1303</span>&#160;    <span class="comment">// been scheduled.</span></div>
+<div class="line"><a name="l01304"></a><span class="lineno"> 1304</span>&#160;    <span class="keyword">const</span> SizeType j_tile_current = ij_offset.col() / dist.blockSize().cols();</div>
+<div class="line"><a name="l01305"></a><span class="lineno"> 1305</span>&#160;    <span class="keyword">const</span> SizeType j_tile_next = at_offset.col() / dist.blockSize().cols();</div>
+<div class="line"><a name="l01306"></a><span class="lineno"> 1306</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">bool</span> isNextColumnOnSameRank = (j_tile_current == j_tile_next);</div>
+<div class="line"><a name="l01307"></a><span class="lineno"> 1307</span>&#160;    <span class="keyword">const</span> comm::IndexT_MPI rank_next_col =</div>
+<div class="line"><a name="l01308"></a><span class="lineno"> 1308</span>&#160;        isNextColumnOnSameRank ? rank_v0.col() : (rank_v0.col() + 1) % dist.commGridSize().cols();</div>
+<div class="line"><a name="l01309"></a><span class="lineno"> 1309</span>&#160; </div>
+<div class="line"><a name="l01310"></a><span class="lineno"> 1310</span>&#160;    <span class="keywordflow">if</span> (rank.col() == rank_next_col) {</div>
+<div class="line"><a name="l01311"></a><span class="lineno"> 1311</span>&#160;      <span class="keyword">const</span> LocalTileIndex at{</div>
+<div class="line"><a name="l01312"></a><span class="lineno"> 1312</span>&#160;          dist.template nextLocalTileFromGlobalElement&lt;Coord::Row&gt;(at_offset.row()),</div>
+<div class="line"><a name="l01313"></a><span class="lineno"> 1313</span>&#160;          dist.template nextLocalTileFromGlobalElement&lt;Coord::Col&gt;(at_offset.col()),</div>
+<div class="line"><a name="l01314"></a><span class="lineno"> 1314</span>&#160;      };</div>
+<div class="line"><a name="l01315"></a><span class="lineno"> 1315</span>&#160; </div>
+<div class="line"><a name="l01316"></a><span class="lineno"> 1316</span>&#160;      <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01317"></a><span class="lineno"> 1317</span>&#160;      <span class="comment">// This additional communication of the last tile is a workaround for supporting following trigger</span></div>
+<div class="line"><a name="l01318"></a><span class="lineno"> 1318</span>&#160;      <span class="comment">// when b &lt; mb.</span></div>
+<div class="line"><a name="l01319"></a><span class="lineno"> 1319</span>&#160;      <span class="comment">// Indeed, if b &lt; mb the last column have (at least) a panel to compute, but differently from</span></div>
+<div class="line"><a name="l01320"></a><span class="lineno"> 1320</span>&#160;      <span class="comment">// other columns, broadcast transposed doesn&#39;t communicate the last tile, which is an assumption</span></div>
+<div class="line"><a name="l01321"></a><span class="lineno"> 1321</span>&#160;      <span class="comment">// needed to make the following trigger work correctly.</span></div>
+<div class="line"><a name="l01322"></a><span class="lineno"> 1322</span>&#160;      <span class="keyword">const</span> SizeType at_tile_col =</div>
+<div class="line"><a name="l01323"></a><span class="lineno"> 1323</span>&#160;          dist.template globalTileFromGlobalElement&lt;Coord::Col&gt;(at_offset.col());</div>
+<div class="line"><a name="l01324"></a><span class="lineno"> 1324</span>&#160; </div>
+<div class="line"><a name="l01325"></a><span class="lineno"> 1325</span>&#160;      <span class="keywordflow">if</span> (at_tile_col == dist.nrTiles().cols() - 1) {</div>
+<div class="line"><a name="l01326"></a><span class="lineno"> 1326</span>&#160;        <span class="keyword">const</span> comm::IndexT_MPI owner = rank_v0.row();</div>
+<div class="line"><a name="l01327"></a><span class="lineno"> 1327</span>&#160;        <span class="keywordflow">if</span> (rank.row() == owner) {</div>
+<div class="line"><a name="l01328"></a><span class="lineno"> 1328</span>&#160;          xt.setTile(at, x.read(at));</div>
+<div class="line"><a name="l01329"></a><span class="lineno"> 1329</span>&#160; </div>
+<div class="line"><a name="l01330"></a><span class="lineno"> 1330</span>&#160;          <span class="keywordflow">if</span> (dist.commGridSize().rows() &gt; 1)</div>
+<div class="line"><a name="l01331"></a><span class="lineno"> 1331</span>&#160;            ex::start_detached(comm::scheduleSendBcast(mpi_col_chain(), xt.read(at)));</div>
+<div class="line"><a name="l01332"></a><span class="lineno"> 1332</span>&#160;        }</div>
+<div class="line"><a name="l01333"></a><span class="lineno"> 1333</span>&#160;        <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l01334"></a><span class="lineno"> 1334</span>&#160;          <span class="keywordflow">if</span> (dist.commGridSize().rows() &gt; 1)</div>
+<div class="line"><a name="l01335"></a><span class="lineno"> 1335</span>&#160;            ex::start_detached(comm::scheduleRecvBcast(mpi_col_chain(), owner, xt.readwrite(at)));</div>
+<div class="line"><a name="l01336"></a><span class="lineno"> 1336</span>&#160;        }</div>
+<div class="line"><a name="l01337"></a><span class="lineno"> 1337</span>&#160;      }</div>
+<div class="line"><a name="l01338"></a><span class="lineno"> 1338</span>&#160; </div>
+<div class="line"><a name="l01339"></a><span class="lineno"> 1339</span>&#160;      <span class="keywordflow">if</span> constexpr (dlaf::comm::CommunicationDevice_v&lt;D&gt; == D) {</div>
+<div class="line"><a name="l01340"></a><span class="lineno"> 1340</span>&#160;        <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01341"></a><span class="lineno"> 1341</span>&#160;        <span class="comment">// if there is no need for additional buffers, we can just wait that xt[0] is ready for</span></div>
+<div class="line"><a name="l01342"></a><span class="lineno"> 1342</span>&#160;        <span class="comment">// reading.</span></div>
+<div class="line"><a name="l01343"></a><span class="lineno"> 1343</span>&#160;        <span class="keywordflow">if</span> (rank.row() == rank_v0.row()) {</div>
+<div class="line"><a name="l01344"></a><span class="lineno"> 1344</span>&#160;          trigger_panel = xt.read(at) | ex::drop_value() | ex::ensure_started();</div>
+<div class="line"><a name="l01345"></a><span class="lineno"> 1345</span>&#160;        }</div>
+<div class="line"><a name="l01346"></a><span class="lineno"> 1346</span>&#160;        <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l01347"></a><span class="lineno"> 1347</span>&#160;          <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01348"></a><span class="lineno"> 1348</span>&#160;          <span class="comment">// Conservatively ensure that xt[0] needed for updating the first column has been</span></div>
+<div class="line"><a name="l01349"></a><span class="lineno"> 1349</span>&#160;          <span class="comment">// received. Just wait for xt because communication of x happens over rows, while the</span></div>
+<div class="line"><a name="l01350"></a><span class="lineno"> 1350</span>&#160;          <span class="comment">// pivot rank can just block rank in the same column.</span></div>
+<div class="line"><a name="l01351"></a><span class="lineno"> 1351</span>&#160;          trigger_panel = xt.read(at) | ex::drop_value() | ex::ensure_started();</div>
+<div class="line"><a name="l01352"></a><span class="lineno"> 1352</span>&#160;        }</div>
+<div class="line"><a name="l01353"></a><span class="lineno"> 1353</span>&#160;      }</div>
+<div class="line"><a name="l01354"></a><span class="lineno"> 1354</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l01355"></a><span class="lineno"> 1355</span>&#160;        <span class="keywordflow">if</span> (rank.row() == rank_v0.row()) {</div>
+<div class="line"><a name="l01356"></a><span class="lineno"> 1356</span>&#160;          <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01357"></a><span class="lineno"> 1357</span>&#160;          <span class="comment">// on the pivot rank, i.e. the one that would quickly go to the next panel and block, from</span></div>
+<div class="line"><a name="l01358"></a><span class="lineno"> 1358</span>&#160;          <span class="comment">// implementation we know that xt[0] is set as an external tile pointing to x[0].</span></div>
+<div class="line"><a name="l01359"></a><span class="lineno"> 1359</span>&#160;          <span class="comment">// We cannot wait on xt readwrite (because it is an external tile in a panel, that constraints</span></div>
+<div class="line"><a name="l01360"></a><span class="lineno"> 1360</span>&#160;          <span class="comment">// it to be just readable), but we can wait on its source x[0]. This has a subtle implication,</span></div>
+<div class="line"><a name="l01361"></a><span class="lineno"> 1361</span>&#160;          <span class="comment">// since we will wait not just for the communication to be complete (which is already more</span></div>
+<div class="line"><a name="l01362"></a><span class="lineno"> 1362</span>&#160;          <span class="comment">// than what needed), but we will also wait till xt[0] will be released, so after all local</span></div>
+<div class="line"><a name="l01363"></a><span class="lineno"> 1363</span>&#160;          <span class="comment">// communication and computation on the first column of the trailing matrix will be completed.</span></div>
+<div class="line"><a name="l01364"></a><span class="lineno"> 1364</span>&#160;          trigger_panel = x.readwrite(at) | ex::drop_value() | ex::ensure_started();</div>
+<div class="line"><a name="l01365"></a><span class="lineno"> 1365</span>&#160;        }</div>
+<div class="line"><a name="l01366"></a><span class="lineno"> 1366</span>&#160;        <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l01367"></a><span class="lineno"> 1367</span>&#160;          <span class="comment">// Note:</span></div>
+<div class="line"><a name="l01368"></a><span class="lineno"> 1368</span>&#160;          <span class="comment">// Conservatively ensure that xt[0] needed for updating the first column has been</span></div>
+<div class="line"><a name="l01369"></a><span class="lineno"> 1369</span>&#160;          <span class="comment">// received. Just wait for xt because communication of x happens over rows, while the</span></div>
+<div class="line"><a name="l01370"></a><span class="lineno"> 1370</span>&#160;          <span class="comment">// pivot rank can just block rank in the same column.</span></div>
+<div class="line"><a name="l01371"></a><span class="lineno"> 1371</span>&#160;          trigger_panel = xt.read(at) | ex::drop_value() | ex::ensure_started();</div>
+<div class="line"><a name="l01372"></a><span class="lineno"> 1372</span>&#160;        }</div>
+<div class="line"><a name="l01373"></a><span class="lineno"> 1373</span>&#160;      }</div>
+<div class="line"><a name="l01374"></a><span class="lineno"> 1374</span>&#160;    }</div>
+<div class="line"><a name="l01375"></a><span class="lineno"> 1375</span>&#160; </div>
+<div class="line"><a name="l01376"></a><span class="lineno"> 1376</span>&#160;    <span class="comment">// At -= X . V* + V . X*</span></div>
+<div class="line"><a name="l01377"></a><span class="lineno"> 1377</span>&#160;    her2kUpdateTrailingMatrix&lt;B&gt;(trailing_matrix_view, mat_a, x, vt, v, xt);</div>
+<div class="line"><a name="l01378"></a><span class="lineno"> 1378</span>&#160; </div>
+<div class="line"><a name="l01379"></a><span class="lineno"> 1379</span>&#160;    xt.reset();</div>
+<div class="line"><a name="l01380"></a><span class="lineno"> 1380</span>&#160;    x.reset();</div>
+<div class="line"><a name="l01381"></a><span class="lineno"> 1381</span>&#160;    wt.reset();</div>
+<div class="line"><a name="l01382"></a><span class="lineno"> 1382</span>&#160;    w.reset();</div>
+<div class="line"><a name="l01383"></a><span class="lineno"> 1383</span>&#160;    vt.reset();</div>
+<div class="line"><a name="l01384"></a><span class="lineno"> 1384</span>&#160;    v.reset();</div>
+<div class="line"><a name="l01385"></a><span class="lineno"> 1385</span>&#160;  }</div>
+<div class="line"><a name="l01386"></a><span class="lineno"> 1386</span>&#160; </div>
+<div class="line"><a name="l01387"></a><span class="lineno"> 1387</span>&#160;  <span class="keywordflow">return</span> mat_taus;</div>
+<div class="line"><a name="l01388"></a><span class="lineno"> 1388</span>&#160;}</div>
 <div class="line"><a name="l01389"></a><span class="lineno"> 1389</span>&#160;}</div>
-<div class="line"><a name="l01390"></a><span class="lineno"> 1390</span>&#160;}</div>
 <div class="ttc" id="ablas_2tile_8h_html"><div class="ttname"><a href="blas_2tile_8h.html">tile.h</a></div></div>
 <div class="ttc" id="abroadcast__panel_8h_html"><div class="ttname"><a href="broadcast__panel_8h.html">broadcast_panel.h</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_index2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_index2_d.html">dlaf::common::Index2D&lt; IndexT_MPI, TAG_MPI &gt;</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::GlobalElement_TAG &gt;</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1internal_1_1_policy_html"><div class="ttname"><a href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a></div><div class="ttdef"><b>Definition:</b> policy.h:24</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html">dlaf::matrix::Distribution</a></div><div class="ttdef"><b>Definition:</b> distribution.h:27</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:121</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a></div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:36</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:122</div></div>
 <div class="ttc" id="acommunicator_8h_html"><div class="ttname"><a href="communicator_8h.html">communicator.h</a></div></div>
 <div class="ttc" id="acommunicator_8h_html_a2b48f62607e5e128dff19ceac22093e9"><div class="ttname"><a href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">dlaf::comm::IndexT_MPI</a></div><div class="ttdeci">int IndexT_MPI</div><div class="ttdoc">Type used for indexes in MPI API.</div><div class="ttdef"><b>Definition:</b> communicator.h:23</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
@@ -1484,19 +1482,18 @@
 <div class="ttc" id="amatrix_2tile_8h_html"><div class="ttname"><a href="matrix_2tile_8h.html">tile.h</a></div></div>
 <div class="ttc" id="amatrix_2tile_8h_html_ae46de76ccc35985387f6820b1db9fb51"><div class="ttname"><a href="matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51">dlaf::matrix::splitTile</a></div><div class="ttdeci">ReadOnlyTileSender&lt; T, D &gt; splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const SubTileSpec &amp;spec)</div><div class="ttdef"><b>Definition:</b> tile.h:507</div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="anorm_8h_html_a2d0adfb7be9cfe934f96e9dd1c38d839"><div class="ttname"><a href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">dlaf::auxiliary::norm</a></div><div class="ttdeci">dlaf::BaseType&lt; T &gt; norm(comm::CommunicatorGrid grid, comm::Index2D rank, lapack::Norm norm_type, blas::Uplo uplo, Matrix&lt; const T, device &gt; &amp;A)</div><div class="ttdef"><b>Definition:</b> norm.h:43</div></div>
+<div class="ttc" id="anorm_8h_html_a2d0adfb7be9cfe934f96e9dd1c38d839"><div class="ttname"><a href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">dlaf::auxiliary::norm</a></div><div class="ttdeci">dlaf::BaseType&lt; T &gt; norm(comm::CommunicatorGrid grid, comm::Index2D rank, lapack::Norm norm_type, blas::Uplo uplo, Matrix&lt; const T, device &gt; &amp;A)</div><div class="ttdef"><b>Definition:</b> norm.h:44</div></div>
 <div class="ttc" id="apanel_8h_html"><div class="ttname"><a href="panel_8h.html">panel.h</a></div></div>
 <div class="ttc" id="apipeline_8h_html"><div class="ttname"><a href="pipeline_8h.html">pipeline.h</a></div></div>
 <div class="ttc" id="aqr_8h_html"><div class="ttname"><a href="qr_8h.html">qr.h</a></div></div>
 <div class="ttc" id="arange2d_8h_html"><div class="ttname"><a href="range2d_8h.html">range2d.h</a></div></div>
 <div class="ttc" id="ardma_8h_html"><div class="ttname"><a href="rdma_8h.html">rdma.h</a></div></div>
-<div class="ttc" id="aretiled__matrix_8h_html"><div class="ttname"><a href="retiled__matrix_8h.html">retiled_matrix.h</a></div></div>
 <div class="ttc" id="around__robin_8h_html"><div class="ttname"><a href="round__robin_8h.html">round_robin.h</a></div></div>
 <div class="ttc" id="aschedulers_8h_html"><div class="ttname"><a href="schedulers_8h.html">schedulers.h</a></div></div>
 <div class="ttc" id="asingle__threaded__blas_8h_html"><div class="ttname"><a href="single__threaded__blas_8h.html">single_threaded_blas.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1common_1_1_round_robin_html"><div class="ttname"><a href="structdlaf_1_1common_1_1_round_robin.html">dlaf::common::RoundRobin</a></div><div class="ttdef"><b>Definition:</b> round_robin.h:20</div></div>
 <div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">dlaf::eigensolver::internal::ReductionToBand</a></div><div class="ttdef"><b>Definition:</b> api.h:21</div></div>
-<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper</a></div><div class="ttdef"><b>Definition:</b> impl.h:826</div></div>
+<div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper</a></div><div class="ttdef"><b>Definition:</b> impl.h:825</div></div>
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_panel_html"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_panel.html">dlaf::matrix::Panel</a></div><div class="ttdef"><b>Definition:</b> panel.h:552</div></div>
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_panel_html_aac41b4dfa833e4a24839fe1d470b835a"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">dlaf::matrix::Panel::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(LocalTileIndex index)</div><div class="ttdef"><b>Definition:</b> panel.h:570</div></div>
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_sub_panel_view_html"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_sub_panel_view.html">dlaf::matrix::SubPanelView</a></div><div class="ttdef"><b>Definition:</b> views.h:132</div></div>
diff --git a/master/files.html b/master/files.html
index cdbba16a25..a9d003ade2 100644
--- a/master/files.html
+++ b/master/files.html
@@ -216,10 +216,9 @@
 <tr id="row_0_0_8_11_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="print__csv_8h_source.html"><span class="icondoc"></span></a><a class="el" href="print__csv_8h.html" target="_self">print_csv.h</a></td><td class="desc"></td></tr>
 <tr id="row_0_0_8_12_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="print__gpu_8h_source.html"><span class="icondoc"></span></a><a class="el" href="print__gpu_8h.html" target="_self">print_gpu.h</a></td><td class="desc"></td></tr>
 <tr id="row_0_0_8_13_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="print__numpy_8h_source.html"><span class="icondoc"></span></a><a class="el" href="print__numpy_8h.html" target="_self">print_numpy.h</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_8_14_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="retiled__matrix_8h_source.html"><span class="icondoc"></span></a><a class="el" href="retiled__matrix_8h.html" target="_self">retiled_matrix.h</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_8_15_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="matrix_2tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="matrix_2tile_8h.html" target="_self">tile.h</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_8_16_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="util__distribution_8h_source.html"><span class="icondoc"></span></a><a class="el" href="util__distribution_8h.html" target="_self">util_distribution.h</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_8_17_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="views_8h_source.html"><span class="icondoc"></span></a><a class="el" href="views_8h.html" target="_self">views.h</a></td><td class="desc"></td></tr>
+<tr id="row_0_0_8_14_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="matrix_2tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="matrix_2tile_8h.html" target="_self">tile.h</a></td><td class="desc"></td></tr>
+<tr id="row_0_0_8_15_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="util__distribution_8h_source.html"><span class="icondoc"></span></a><a class="el" href="util__distribution_8h.html" target="_self">util_distribution.h</a></td><td class="desc"></td></tr>
+<tr id="row_0_0_8_16_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="views_8h_source.html"><span class="icondoc"></span></a><a class="el" href="views_8h.html" target="_self">views.h</a></td><td class="desc"></td></tr>
 <tr id="row_0_0_9_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_9_" class="arrow" onclick="toggleFolder('0_0_9_')">&#9658;</span><span id="img_0_0_9_" class="iconfclosed" onclick="toggleFolder('0_0_9_')">&#160;</span><a class="el" href="dir_677a63fd1eacc456aa0231f45944b703.html" target="_self">memory</a></td><td class="desc"></td></tr>
 <tr id="row_0_0_9_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="memory__chunk_8h_source.html"><span class="icondoc"></span></a><a class="el" href="memory__chunk_8h.html" target="_self">memory_chunk.h</a></td><td class="desc"></td></tr>
 <tr id="row_0_0_9_1_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><a href="memory__view_8h_source.html"><span class="icondoc"></span></a><a class="el" href="memory__view_8h.html" target="_self">memory_view.h</a></td><td class="desc"></td></tr>
diff --git a/master/functions_d.html b/master/functions_d.html
index af9b81d1ca..2b1efff2e7 100644
--- a/master/functions_d.html
+++ b/master/functions_d.html
@@ -91,6 +91,9 @@ <h3><a id="index_d"></a>- d -</h3><ul>
 <li>distribution()
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">dlaf::matrix::internal::MatrixBase</a>
 </li>
+<li>done()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
diff --git a/master/functions_func_d.html b/master/functions_func_d.html
index 7da8334928..1ae3105610 100644
--- a/master/functions_func_d.html
+++ b/master/functions_func_d.html
@@ -81,6 +81,9 @@ <h3><a id="index_d"></a>- d -</h3><ul>
 <li>distribution()
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">dlaf::matrix::internal::MatrixBase</a>
 </li>
+<li>done()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
diff --git a/master/functions_func_r.html b/master/functions_func_r.html
index 348a38a440..eec6e1a6bc 100644
--- a/master/functions_func_r.html
+++ b/master/functions_func_r.html
@@ -97,13 +97,11 @@ <h3><a id="index_r"></a>- r -</h3><ul>
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a99845f6d6b238d3a8d543d20d3adb04d">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
 , <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
 , <a class="el" href="structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a4631ad4a6fa72e74cf95798c527a48d1">dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;</a>
-, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
 </li>
 <li>readwrite()
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#ab0a26ee4322ab4b7a3d250a82d072f68">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
 , <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix&lt; T, D &gt;</a>
 , <a class="el" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">dlaf::matrix::Panel&lt; axis, T, D, Storage &gt;</a>
-, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
 </li>
 <li>readwrite_with_wrapper()
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a17403152214a88994a75395f7bebfe3c">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
@@ -113,8 +111,11 @@ <h3><a id="index_r"></a>- r -</h3><ul>
 , <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a83ffbae7e4944baa1bc4bfbe5dd1100d">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
 , <a class="el" href="structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acb87326419c25da556f027565b96c086">dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;</a>
 </li>
-<li>RetiledMatrix()
-: <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
+<li>retiledSubPipeline()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">dlaf::matrix::Matrix&lt; T, D &gt;</a>
+</li>
+<li>retiledSubPipelineConst()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
 </li>
 <li>rowCommunicator()
 : <a class="el" href="classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391">dlaf::comm::CommunicatorGrid</a>
diff --git a/master/functions_func_s.html b/master/functions_func_s.html
index 617197a5e0..34786b10a4 100644
--- a/master/functions_func_s.html
+++ b/master/functions_func_s.html
@@ -102,6 +102,12 @@ <h3><a id="index_s"></a>- s -</h3><ul>
 <li>SubPanelView()
 : <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html#a556b70975f5928ca81f2196d549be232">dlaf::matrix::SubPanelView</a>
 </li>
+<li>subPipeline()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">dlaf::matrix::Matrix&lt; T, D &gt;</a>
+</li>
+<li>subPipelineConst()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
+</li>
 <li>subTileReference()
 : <a class="el" href="classdlaf_1_1matrix_1_1_tile.html#a670161e49f6a18b5979e9938e4e7e867">dlaf::matrix::Tile&lt; T, D &gt;</a>
 , <a class="el" href="classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a4adf525073d06baaa47b06886272da41">dlaf::matrix::Tile&lt; const T, D &gt;</a>
diff --git a/master/functions_func_w.html b/master/functions_func_w.html
index 413bbe4aff..69d218dfcc 100644
--- a/master/functions_func_w.html
+++ b/master/functions_func_w.html
@@ -66,7 +66,6 @@
 <h3><a id="index_w"></a>- w -</h3><ul>
 <li>waitLocalTiles()
 : <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
-, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
diff --git a/master/functions_r.html b/master/functions_r.html
index 0ec72bd5c5..d2e68d5e82 100644
--- a/master/functions_r.html
+++ b/master/functions_r.html
@@ -97,13 +97,11 @@ <h3><a id="index_r"></a>- r -</h3><ul>
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a99845f6d6b238d3a8d543d20d3adb04d">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
 , <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
 , <a class="el" href="structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a4631ad4a6fa72e74cf95798c527a48d1">dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;</a>
-, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
 </li>
 <li>readwrite()
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#ab0a26ee4322ab4b7a3d250a82d072f68">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
 , <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix&lt; T, D &gt;</a>
 , <a class="el" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">dlaf::matrix::Panel&lt; axis, T, D, Storage &gt;</a>
-, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
 </li>
 <li>readwrite_with_wrapper()
 : <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a17403152214a88994a75395f7bebfe3c">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
@@ -113,8 +111,11 @@ <h3><a id="index_r"></a>- r -</h3><ul>
 , <a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a83ffbae7e4944baa1bc4bfbe5dd1100d">dlaf::matrix::internal::TilePipeline&lt; T, D &gt;</a>
 , <a class="el" href="structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acb87326419c25da556f027565b96c086">dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;</a>
 </li>
-<li>RetiledMatrix()
-: <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
+<li>retiledSubPipeline()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">dlaf::matrix::Matrix&lt; T, D &gt;</a>
+</li>
+<li>retiledSubPipelineConst()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
 </li>
 <li>rowCommunicator()
 : <a class="el" href="classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391">dlaf::comm::CommunicatorGrid</a>
diff --git a/master/functions_s.html b/master/functions_s.html
index 1444582871..bc1d3042b3 100644
--- a/master/functions_s.html
+++ b/master/functions_s.html
@@ -108,6 +108,12 @@ <h3><a id="index_s"></a>- s -</h3><ul>
 <li>SubPanelView()
 : <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html#a556b70975f5928ca81f2196d549be232">dlaf::matrix::SubPanelView</a>
 </li>
+<li>subPipeline()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">dlaf::matrix::Matrix&lt; T, D &gt;</a>
+</li>
+<li>subPipelineConst()
+: <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
+</li>
 <li>subTileReference()
 : <a class="el" href="classdlaf_1_1matrix_1_1_tile.html#a670161e49f6a18b5979e9938e4e7e867">dlaf::matrix::Tile&lt; T, D &gt;</a>
 , <a class="el" href="classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a4adf525073d06baaa47b06886272da41">dlaf::matrix::Tile&lt; const T, D &gt;</a>
diff --git a/master/functions_w.html b/master/functions_w.html
index 89f0ef8197..49eb922c52 100644
--- a/master/functions_w.html
+++ b/master/functions_w.html
@@ -66,7 +66,6 @@
 <h3><a id="index_w"></a>- w -</h3><ul>
 <li>waitLocalTiles()
 : <a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">dlaf::matrix::Matrix&lt; const T, D &gt;</a>
-, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
diff --git a/master/gen__eigensolver_8h_source.html b/master/gen__eigensolver_8h_source.html
index aa4eb0c628..e4eadf64fb 100644
--- a/master/gen__eigensolver_8h_source.html
+++ b/master/gen__eigensolver_8h_source.html
@@ -110,83 +110,91 @@
 <div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;              eigenvectors);</div>
 <div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  DLAF_ASSERT(eigenvectors.size() == mat_a.size(), eigenvectors, mat_a);</div>
 <div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  DLAF_ASSERT(eigenvectors.blockSize() == mat_a.blockSize(), eigenvectors, mat_a);</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160; </div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html">internal::GenEigensolver&lt;B, D, T&gt;::call</a>(uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;}</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160; </div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="gen__eigensolver_8h.html#ad60b7fb5135b8ea685d781e4e4165c47">   81</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">genEigensolver</a>(blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat_a, Matrix&lt;T, D&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160; </div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="keyword">const</span> SizeType size = mat_a.size().rows();</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160; </div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat_a.blockSize().rows(), 1));</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, size), mat_a.blockSize());</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(eigenvalues), eigenvalues);</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html">internal::GenEigensolver&lt;B, D, T&gt;::call</a>(uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;}</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="gen__eigensolver_8h.html#ad60b7fb5135b8ea685d781e4e4165c47">   85</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">genEigensolver</a>(blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat_a, Matrix&lt;T, D&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160; </div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="keyword">const</span> SizeType size = mat_a.size().rows();</div>
 <div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160; </div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  genEigensolver&lt;B, D, T&gt;(uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160; </div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;}</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160; </div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="gen__eigensolver_8h.html#a9d80f2453da0de6a6ad73c55165f7f52">  122</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">genEigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;                    Matrix&lt;T, D&gt;&amp; mat_b, Matrix&lt;BaseType&lt;T&gt;, D&gt;&amp; eigenvalues,</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;                    Matrix&lt;T, D&gt;&amp; eigenvectors) {</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  DLAF_ASSERT(matrix::local_matrix(eigenvalues), eigenvalues);</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(eigenvectors, grid), eigenvectors, grid);</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  DLAF_ASSERT(matrix::square_size(eigenvectors), eigenvectors);</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(eigenvectors), eigenvectors);</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  DLAF_ASSERT(eigenvalues.size().rows() == eigenvectors.size().rows(), eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  DLAF_ASSERT(eigenvalues.blockSize().rows() == eigenvectors.blockSize().rows(), eigenvalues,</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;              eigenvectors);</div>
-<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  DLAF_ASSERT(eigenvectors.size() == mat_a.size(), eigenvectors, mat_a);</div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  DLAF_ASSERT(eigenvectors.blockSize() == mat_a.blockSize(), eigenvectors, mat_a);</div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160; </div>
-<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html">internal::GenEigensolver&lt;B, D, T&gt;::call</a>(grid, uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;}</div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160; </div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="gen__eigensolver_8h.html#a7578fbe49ba90d7ef916ac81860c3858">  163</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">genEigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;                                       Matrix&lt;T, D&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
-<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
-<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160; </div>
-<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;  <span class="keyword">const</span> SizeType size = mat_a.size().rows();</div>
-<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160; </div>
-<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
-<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat_a.blockSize().rows(), 1));</div>
-<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>(size, size), mat_a.blockSize(), grid);</div>
-<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160; </div>
-<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  genEigensolver&lt;B, D, T&gt;(grid, uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat_a.blockSize().rows(), 1));</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, size), mat_a.blockSize());</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160; </div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  genEigensolver&lt;B, D, T&gt;(uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160; </div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;}</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160; </div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="gen__eigensolver_8h.html#a9d80f2453da0de6a6ad73c55165f7f52">  126</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">genEigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                    Matrix&lt;T, D&gt;&amp; mat_b, Matrix&lt;BaseType&lt;T&gt;, D&gt;&amp; eigenvalues,</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                    Matrix&lt;T, D&gt;&amp; eigenvectors) {</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  DLAF_ASSERT(matrix::local_matrix(eigenvalues), eigenvalues);</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(eigenvectors, grid), eigenvectors, grid);</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  DLAF_ASSERT(matrix::square_size(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  DLAF_ASSERT(eigenvalues.size().rows() == eigenvectors.size().rows(), eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  DLAF_ASSERT(eigenvalues.blockSize().rows() == eigenvectors.blockSize().rows(), eigenvalues,</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;              eigenvectors);</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  DLAF_ASSERT(eigenvectors.size() == mat_a.size(), eigenvectors, mat_a);</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  DLAF_ASSERT(eigenvectors.blockSize() == mat_a.blockSize(), eigenvectors, mat_a);</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(eigenvalues), eigenvalues);</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(eigenvectors), eigenvectors);</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160; </div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html">internal::GenEigensolver&lt;B, D, T&gt;::call</a>(grid, uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;}</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160; </div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="gen__eigensolver_8h.html#a7578fbe49ba90d7ef916ac81860c3858">  171</a></span>&#160;<a class="code" href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">EigensolverResult&lt;T, D&gt;</a> <a class="code" href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">genEigensolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;                                       Matrix&lt;T, D&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
 <div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160; </div>
-<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
-<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;}</div>
-<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;}</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  <span class="keyword">const</span> SizeType size = mat_a.size().rows();</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160; </div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;BaseType&lt;T&gt;</a>, D&gt; eigenvalues(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>(size, 1),</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;                                             <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>(mat_a.blockSize().rows(), 1));</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">matrix::Matrix&lt;T, D&gt;</a> eigenvectors(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>(size, size), mat_a.blockSize(), grid);</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160; </div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  genEigensolver&lt;B, D, T&gt;(grid, uplo, mat_a, mat_b, eigenvalues, eigenvectors);</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160; </div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  <span class="keywordflow">return</span> {std::move(eigenvalues), std::move(eigenvectors)};</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;}</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;</a></div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="agen__eigensolver_8h_html_ae119b500260a60dcabdd237e461a12dd"><div class="ttname"><a href="gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd">dlaf::eigensolver::genEigensolver</a></div><div class="ttdeci">void genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)</div><div class="ttdef"><b>Definition:</b> gen_eigensolver.h:42</div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1eigensolver_1_1_eigensolver_result_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1_eigensolver_result.html">dlaf::eigensolver::EigensolverResult</a></div><div class="ttdef"><b>Definition:</b> api.h:22</div></div>
diff --git a/master/gen__to__std_8h.html b/master/gen__to__std_8h.html
index 99a2f4fe22..b7cd4771a9 100644
--- a/master/gen__to__std_8h.html
+++ b/master/gen__to__std_8h.html
@@ -137,6 +137,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a8f0b0f0094c0185dc428f69f
 <dd>
 mat_a and mat_b have the same square block size, </dd>
 <dd>
+mat_a and mat_b have the same tile and block sizes, </dd>
+<dd>
 mat_a and mat_b are not distributed. </dd></dl>
 
 </div>
@@ -195,6 +197,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a1c178c1c870afbc1c4928a4d
 <dd>
 mat_a and mat_b have the same square block size, </dd>
 <dd>
+mat_a and mat_b have the same tile and block sizes, </dd>
+<dd>
 mat_a and mat_b are distributed according to the grid. </dd></dl>
 
 </div>
diff --git a/master/gen__to__std_8h_source.html b/master/gen__to__std_8h_source.html
index a1d3b85752..c7a56d10ba 100644
--- a/master/gen__to__std_8h_source.html
+++ b/master/gen__to__std_8h_source.html
@@ -92,61 +92,65 @@
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="keyword">namespace </span><a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a> {</div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160; </div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">   43</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">genToStd</a>(blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_L</a>(mat_a, mat_b);</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_U</a>(mat_a, mat_b);</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">   44</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">genToStd</a>(blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_L</a>(mat_a, mat_b);</div>
 <div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_U</a>(mat_a, mat_b);</div>
 <div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  }</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;}</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="gen__to__std_8h.html#a1c178c1c870afbc1c4928a4dbe078aa4">   85</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">genToStd</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;              Matrix&lt;T, device&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160; </div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_L</a>(grid, mat_a, mat_b);</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_U</a>(grid, mat_a, mat_b);</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  }</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;}</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="gen__to__std_8h.html#a1c178c1c870afbc1c4928a4dbe078aa4">   89</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">genToStd</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Uplo uplo, Matrix&lt;T, device&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;              Matrix&lt;T, device&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_b), mat_b);</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  DLAF_ASSERT(mat_a.size() == mat_b.size(), mat_a, mat_b);</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  DLAF_ASSERT(mat_a.blockSize() == mat_b.blockSize(), mat_a, mat_b);</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160; </div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_L</a>(grid, mat_a, mat_b);</div>
 <div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  }</div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;}</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160; </div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;}</div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;}</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">internal::GenToStd&lt;backend, device, T&gt;::call_U</a>(grid, mat_a, mat_b);</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;      <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  }</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;}</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160; </div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;}</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="aeigensolver_2eigensolver_8h_html_a7aeed252a1783c24f778eb250d0efd72"><div class="ttname"><a href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">dlaf::eigensolver::eigensolver</a></div><div class="ttdeci">void eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)</div><div class="ttdef"><b>Definition:</b> eigensolver.h:39</div></div>
-<div class="ttc" id="agen__to__std_8h_html_a8f0b0f0094c0185dc428f69f8506ba8f"><div class="ttname"><a href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">dlaf::eigensolver::genToStd</a></div><div class="ttdeci">void genToStd(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)</div><div class="ttdef"><b>Definition:</b> gen_to_std.h:43</div></div>
+<div class="ttc" id="agen__to__std_8h_html_a8f0b0f0094c0185dc428f69f8506ba8f"><div class="ttname"><a href="gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f">dlaf::eigensolver::genToStd</a></div><div class="ttdeci">void genToStd(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)</div><div class="ttdef"><b>Definition:</b> gen_to_std.h:44</div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html">dlaf::eigensolver::internal::GenToStd</a></div><div class="ttdef"><b>Definition:</b> api.h:20</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
diff --git a/master/hermitian_8h.html b/master/hermitian_8h.html
index 57d7780bf6..25923c3f5b 100644
--- a/master/hermitian_8h.html
+++ b/master/hermitian_8h.html
@@ -162,6 +162,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a117a0b955e26513fecdc562d
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a mat_b and mat_c have equal tile and block size, </dd>
+<dd>
 mat_a mat_b and mat_c are not distributed, </dd>
 <dd>
 mat_a mat_b are multipliable and the result can be summed to mat_c. </dd></dl>
@@ -246,6 +248,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a3a63ff51bec2e9383f3dfd8b
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a, mat_b and mat_c have equal tile and block size, </dd>
+<dd>
 mat_a, mat_b and mat_c are distributed according to the grid, </dd>
 <dd>
 mat_a mat_b are multipliable and the result can be summed to mat_c. </dd></dl>
diff --git a/master/hermitian_8h_source.html b/master/hermitian_8h_source.html
index 42b3ccbe8b..d7e90ff7a6 100644
--- a/master/hermitian_8h_source.html
+++ b/master/hermitian_8h_source.html
@@ -91,72 +91,78 @@
 <div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160; </div>
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span>dlaf::multiplication {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160; </div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">   41</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">hermitian</a>(blas::Side side, blas::Uplo uplo, <span class="keyword">const</span> T alpha, Matrix&lt;const T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;               Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta, Matrix&lt;T, D&gt;&amp; mat_c) {</div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_c), mat_c);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160; </div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                mat_b, mat_c);</div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html">internal::Hermitian&lt;B, D, T&gt;::call_LL</a>(alpha, mat_a, mat_b, beta, mat_c);</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;        <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;        <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    }</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  }</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;                mat_b, mat_c);</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    DLAF_UNIMPLEMENTED(side);</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  }</div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;}</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160; </div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="hermitian_8h.html#a3a63ff51bec2e9383f3dfd8b2914673e">   89</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">hermitian</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Side side, blas::Uplo uplo, <span class="keyword">const</span> T alpha,</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;               Matrix&lt;const T, D&gt;&amp; mat_a, Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta, Matrix&lt;T, D&gt;&amp; mat_c) {</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_c, grid), mat_c, grid);</div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160; </div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                mat_b, mat_c);</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html">internal::Hermitian&lt;B, D, T&gt;::call_LL</a>(grid, alpha, mat_a, mat_b, beta, mat_c);</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;        <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;        <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;        <span class="keywordflow">break</span>;</div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    }</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  }</div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                mat_b, mat_c);</div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    DLAF_UNIMPLEMENTED(side);</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  }</div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;}</div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160; </div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;}</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">   42</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">hermitian</a>(blas::Side side, blas::Uplo uplo, <span class="keyword">const</span> T alpha, Matrix&lt;const T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;               Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta, Matrix&lt;T, D&gt;&amp; mat_c) {</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_c), mat_c);</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_c), mat_c);</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;                mat_b, mat_c);</div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html">internal::Hermitian&lt;B, D, T&gt;::call_LL</a>(alpha, mat_a, mat_b, beta, mat_c);</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;        <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;        <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;        <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    }</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  }</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                mat_b, mat_c);</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    DLAF_UNIMPLEMENTED(side);</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  }</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;}</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160; </div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="hermitian_8h.html#a3a63ff51bec2e9383f3dfd8b2914673e">   94</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">hermitian</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Side side, blas::Uplo uplo, <span class="keyword">const</span> T alpha,</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;               Matrix&lt;const T, D&gt;&amp; mat_a, Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta, Matrix&lt;T, D&gt;&amp; mat_c) {</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_c), mat_c);</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_c, grid), mat_c, grid);</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160; </div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                mat_b, mat_c);</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html">internal::Hermitian&lt;B, D, T&gt;::call_LL</a>(grid, alpha, mat_a, mat_b, beta, mat_c);</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;        <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;        <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;      <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;        DLAF_UNIMPLEMENTED(uplo);</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;        <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    }</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  }</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_c, blas::Op::NoTrans, blas::Op::NoTrans), mat_a,</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                mat_b, mat_c);</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    DLAF_UNIMPLEMENTED(side);</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  }</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;}</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160; </div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
-<div class="ttc" id="ahermitian_8h_html_a117a0b955e26513fecdc562da0f96922"><div class="ttname"><a href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">dlaf::multiplication::hermitian</a></div><div class="ttdeci">void hermitian(blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)</div><div class="ttdef"><b>Definition:</b> hermitian.h:41</div></div>
+<div class="ttc" id="ahermitian_8h_html_a117a0b955e26513fecdc562da0f96922"><div class="ttname"><a href="hermitian_8h.html#a117a0b955e26513fecdc562da0f96922">dlaf::multiplication::hermitian</a></div><div class="ttdeci">void hermitian(blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)</div><div class="ttdef"><b>Definition:</b> hermitian.h:42</div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1multiplication_1_1internal_1_1_hermitian_html"><div class="ttname"><a href="structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html">dlaf::multiplication::internal::Hermitian</a></div><div class="ttdef"><b>Definition:</b> api.h:17</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
diff --git a/master/hierarchy.html b/master/hierarchy.html
index e79c2658b6..d5e0443886 100644
--- a/master/hierarchy.html
+++ b/master/hierarchy.html
@@ -186,7 +186,6 @@
 <tr id="row_86_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_matrix.html" target="_self">dlaf::matrix::Matrix&lt; T, Target &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_87_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_87_" class="arrow" onclick="toggleFolder('87_')">&#9658;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html" target="_self">dlaf::matrix::internal::MatrixBase</a></td><td class="desc"></td></tr>
 <tr id="row_87_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html" target="_self">dlaf::matrix::Matrix&lt; const T, D &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_87_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html" target="_self">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_88_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_matrix_mirror.html" target="_self">dlaf::matrix::MatrixMirror&lt; T, Target, Source &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_89_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_89_" class="arrow" onclick="toggleFolder('89_')">&#9658;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html" target="_self">dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_89_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html" target="_self">dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;</a></td><td class="desc"></td></tr>
diff --git a/master/matrix_8h.html b/master/matrix_8h.html
index a9abf17dd9..3365ad9a2f 100644
--- a/master/matrix_8h.html
+++ b/master/matrix_8h.html
@@ -77,6 +77,7 @@
 <code>#include &lt;vector&gt;</code><br />
 <code>#include &lt;pika/execution.hpp&gt;</code><br />
 <code>#include &lt;<a class="el" href="range2d_8h_source.html">dlaf/common/range2d.h</a>&gt;</code><br />
+<code>#include &lt;<a class="el" href="vector_8h_source.html">dlaf/common/vector.h</a>&gt;</code><br />
 <code>#include &lt;<a class="el" href="communicator__grid_8h_source.html">dlaf/communication/communicator_grid.h</a>&gt;</code><br />
 <code>#include &lt;<a class="el" href="distribution_8h_source.html">dlaf/matrix/distribution.h</a>&gt;</code><br />
 <code>#include &lt;dlaf/matrix/internal/tile_pipeline.h&gt;</code><br />
diff --git a/master/matrix_8h_source.html b/master/matrix_8h_source.html
index 25a8a83a15..f0482c09b8 100644
--- a/master/matrix_8h_source.html
+++ b/master/matrix_8h_source.html
@@ -88,254 +88,273 @@
 <div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="preprocessor">#include &lt;pika/execution.hpp&gt;</span></div>
 <div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160; </div>
 <div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="range2d_8h.html">dlaf/common/range2d.h</a>&gt;</span></div>
-<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="communicator__grid_8h.html">dlaf/communication/communicator_grid.h</a>&gt;</span></div>
-<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="distribution_8h.html">dlaf/matrix/distribution.h</a>&gt;</span></div>
-<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/internal/tile_pipeline.h&gt;</span></div>
-<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="layout__info_8h.html">dlaf/matrix/layout_info.h</a>&gt;</span></div>
-<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__base_8h.html">dlaf/matrix/matrix_base.h</a>&gt;</span></div>
-<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
-<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
-<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160; </div>
-<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
-<div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="keyword">namespace </span>matrix {</div>
-<div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160; </div>
-<div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span>internal {</div>
-<div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160; </div>
-<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> Func&gt;</div>
-<div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1">   38</a></span>&#160;<span class="keyword">auto</span> <a class="code" href="matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1">selectGeneric</a>(Func&amp;&amp; f, <a class="code" href="classdlaf_1_1common_1_1_iterable_range2_d.html">common::IterableRange2D&lt;SizeType, LocalTile_TAG&gt;</a> range) {</div>
-<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;  <span class="keyword">using</span> RetT = decltype(f(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>{}));</div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160; </div>
-<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  std::vector&lt;RetT&gt; tiles;</div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  tiles.reserve(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(std::distance(range.begin(), range.end())));</div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  std::transform(range.begin(), range.end(), std::back_inserter(tiles),</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;                 [&amp;](<span class="keyword">auto</span> idx) { return f(idx); });</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  <span class="keywordflow">return</span> tiles;</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;}</div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">dlaf/common/vector.h</a>&gt;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="communicator__grid_8h.html">dlaf/communication/communicator_grid.h</a>&gt;</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="distribution_8h.html">dlaf/matrix/distribution.h</a>&gt;</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/internal/tile_pipeline.h&gt;</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="layout__info_8h.html">dlaf/matrix/layout_info.h</a>&gt;</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__base_8h.html">dlaf/matrix/matrix_base.h</a>&gt;</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
+<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160; </div>
+<div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
+<div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="keyword">namespace </span>matrix {</div>
+<div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160; </div>
+<div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>internal {</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160; </div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> Func&gt;</div>
+<div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1">   39</a></span>&#160;<span class="keyword">auto</span> <a class="code" href="matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1">selectGeneric</a>(Func&amp;&amp; f, <a class="code" href="classdlaf_1_1common_1_1_iterable_range2_d.html">common::IterableRange2D&lt;SizeType, LocalTile_TAG&gt;</a> range) {</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  <span class="keyword">using</span> RetT = decltype(f(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>{}));</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160; </div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  std::vector&lt;RetT&gt; tiles;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  tiles.reserve(<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(std::distance(range.begin(), range.end())));</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  std::transform(range.begin(), range.end(), std::back_inserter(tiles),</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;                 [&amp;](<span class="keyword">auto</span> idx) { return f(idx); });</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="keywordflow">return</span> tiles;</div>
 <div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;}</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160; </div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html">   55</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> : <span class="keyword">public</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt;const T, D&gt; {</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="keyword">public</span>:</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keyword">static</span> constexpr Device device = D;</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160; </div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">using</span> ElementType = T;</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">TileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">ConstTileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;const ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">TileDataType</a> = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">internal::TileData&lt;const ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">using</span> ReadWriteSenderType = ReadWriteTileSender&lt;T, D&gt;;</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="keyword">friend</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
-<div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">   70</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size);</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160; </div>
-<div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023">   77</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;         <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm);</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160; </div>
-<div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37">   81</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution);</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160; </div>
-<div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1">   90</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout) noexcept;</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160; </div>
-<div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49">   99</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr);</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160; </div>
-<div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472">  110</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr) noexcept;</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160; </div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160; </div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160; </div>
-<div class="line"><a name="l00121"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">  121</a></span>&#160;  ReadWriteSenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <span class="keywordflow">return</span> tile_managers_[tileLinearIndex(index)].readwrite();</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  }</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160; </div>
-<div class="line"><a name="l00129"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">  129</a></span>&#160;  ReadWriteSenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">readwrite</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(this-&gt;distribution().localTileIndex(index));</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  }</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160; </div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">private</span>:</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <span class="keyword">using</span> <span class="keyword">typename</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D&gt;::SubPipelineTag</a>;</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; mat, <span class="keyword">const</span> SubPipelineTag);</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160; </div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="keyword">public</span>:</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> subPipeline() {</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(*<span class="keyword">this</span>, SubPipelineTag{});</div>
-<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  }</div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160; </div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">Matrix&lt;const T, D&gt;::tileLinearIndex</a>;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;}</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160; </div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
+<div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html">   56</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> : <span class="keyword">public</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt;const T, D&gt; {</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="keyword">static</span> constexpr Device device = D;</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160; </div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="keyword">using</span> ElementType = T;</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">TileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">ConstTileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;const ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">TileDataType</a> = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">internal::TileData&lt;const ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="keyword">using</span> ReadWriteSenderType = ReadWriteTileSender&lt;T, D&gt;;</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="keyword">friend</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160; </div>
+<div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">   71</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size);</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160; </div>
+<div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023">   78</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;         <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm);</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160; </div>
+<div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37">   82</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160; </div>
+<div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1">   91</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout) noexcept;</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160; </div>
+<div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49">  100</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr);</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160; </div>
+<div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472">  111</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr) noexcept;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160; </div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160; </div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160; </div>
+<div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">  122</a></span>&#160;  ReadWriteSenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keywordflow">return</span> tile_managers_[tileLinearIndex(index)].readwrite();</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  }</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160; </div>
+<div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">  130</a></span>&#160;  ReadWriteSenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">readwrite</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) noexcept {</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(this-&gt;distribution().localTileIndex(index));</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  }</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160; </div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">  141</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">subPipeline</a>() {</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(*<span class="keyword">this</span>, SubPipelineTag{});</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  }</div>
 <div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160; </div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="keyword">private</span>:</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <span class="keyword">using</span> Matrix&lt;const T, D&gt;::setUpTiles;</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <span class="keyword">using</span> Matrix&lt;const T, D&gt;::tile_managers_;</div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;};</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160; </div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00151"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">  151</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt;const T, D&gt; : <span class="keyword">public</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">internal::MatrixBase</a> {</div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="keyword">public</span>:</div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keyword">static</span> constexpr Device device = D;</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160; </div>
-<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <span class="keyword">using</span> ElementType = T;</div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">TileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">ConstTileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;const ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">TileDataType</a> = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">internal::TileData&lt;ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  <span class="keyword">using</span> ReadOnlySenderType = ReadOnlyTileSender&lt;T, D&gt;;</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <span class="keyword">friend</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160; </div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr);</div>
-<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160; </div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, <span class="keyword">const</span> ElementType* ptr)</div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      : <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(layout, <span class="keyword">const_cast&lt;</span>ElementType*<span class="keyword">&gt;</span>(ptr)) {}</div>
-<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160; </div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr) noexcept;</div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160; </div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, <span class="keyword">const</span> ElementType* ptr)</div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      : <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(std::move(distribution), layout, <span class="keyword">const_cast&lt;</span>ElementType*<span class="keyword">&gt;</span>(ptr)) {}</div>
-<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160; </div>
-<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
-<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
+<div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">  154</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">retiledSubPipeline</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>&amp; tiles_per_block) {</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(*<span class="keyword">this</span>, tiles_per_block);</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  }</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160; </div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="keyword">protected</span>:</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D&gt;::tileLinearIndex</a>;</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160; </div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <span class="keyword">using</span> <span class="keyword">typename</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D&gt;::SubPipelineTag</a>;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; mat, <span class="keyword">const</span> SubPipelineTag);</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; mat, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>&amp; tiles_per_block);</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160; </div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D&gt;::setUpTiles</a>;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D&gt;::tile_managers_</a>;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;};</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160; </div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
+<div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">  171</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&lt;const T, D&gt; : <span class="keyword">public</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">internal::MatrixBase</a> {</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  <span class="keyword">static</span> constexpr Device device = D;</div>
 <div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160; </div>
-<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
-<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
-<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160; </div>
-<div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">  181</a></span>&#160;  ReadOnlySenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">read</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keywordflow">return</span> tile_managers_[tileLinearIndex(index)].read();</div>
-<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;  }</div>
-<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160; </div>
-<div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">  189</a></span>&#160;  ReadOnlySenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">read</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) {</div>
-<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keywordflow">return</span> read(distribution().localTileIndex(index));</div>
-<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;  }</div>
-<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160; </div>
-<div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">  197</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">waitLocalTiles</a>() noexcept;</div>
-<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160; </div>
-<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> subPipelineConst() {</div>
-<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(*<span class="keyword">this</span>, SubPipelineTag{});</div>
-<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;  }</div>
-<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160; </div>
-<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution) : internal::MatrixBase{std::move(distribution)} {}</div>
-<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160; </div>
-<div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html">  206</a></span>&#160;  <span class="keyword">struct </span>SubPipelineTag {};</div>
-<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; mat, <span class="keyword">const</span> SubPipelineTag);</div>
-<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160; </div>
-<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;  <span class="keywordtype">void</span> setUpTiles(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1memory_1_1_memory_view.html">memory::MemoryView&lt;ElementType, D&gt;</a>&amp; mem, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout) noexcept;</div>
-<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="keywordtype">void</span> setUpSubPipelines(<a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp;) noexcept;</div>
-<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160; </div>
-<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  std::vector&lt;internal::TilePipeline&lt;T, D&gt;&gt; tile_managers_;</div>
-<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;};</div>
-<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160; </div>
-<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;<span class="comment">// Note: the templates of the following helper functions are inverted w.r.t. the Matrix templates</span></div>
-<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="comment">// to allow the user to only specify the device and let the compiler deduce the type T.</span></div>
-<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160; </div>
-<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="comment">// Local versions</span></div>
-<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160; </div>
-<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">  230</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">createMatrixFromColMajor</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;                                      SizeType ld, T* ptr) {</div>
-<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(<a class="code" href="layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902">colMajorLayout</a>(size, block_size, ld), ptr);</div>
-<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;}</div>
-<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160; </div>
-<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">  243</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;                                  T* ptr) {</div>
-<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(<a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(size, block_size), ptr);</div>
-<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;}</div>
-<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160; </div>
-<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00260"></a><span class="lineno"><a class="line" href="matrix_8h.html#a5b237a24c0c9c1d9ca958e56684973ae">  260</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;                                  SizeType ld_tile, SizeType tiles_per_col, T* ptr) {</div>
-<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(<a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(size, block_size, ld_tile, tiles_per_col), ptr);</div>
-<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;}</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <span class="keyword">using</span> ElementType = T;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">TileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">ConstTileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;const ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">TileDataType</a> = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">internal::TileData&lt;ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  <span class="keyword">using</span> ReadOnlySenderType = ReadOnlyTileSender&lt;T, D&gt;;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  <span class="keyword">friend</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;ElementType, D&gt;</a>;</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160; </div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr);</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160; </div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, <span class="keyword">const</span> ElementType* ptr)</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      : <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(layout, <span class="keyword">const_cast&lt;</span>ElementType*<span class="keyword">&gt;</span>(ptr)) {}</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160; </div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, ElementType* ptr) noexcept;</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160; </div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout, <span class="keyword">const</span> ElementType* ptr)</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      : <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(std::move(distribution), layout, <span class="keyword">const_cast&lt;</span>ElementType*<span class="keyword">&gt;</span>(ptr)) {}</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160; </div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160; </div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; operator=(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160; </div>
+<div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">  201</a></span>&#160;  ReadOnlySenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">read</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;    <span class="keywordflow">return</span> tile_managers_[tileLinearIndex(index)].read();</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  }</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160; </div>
+<div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">  209</a></span>&#160;  ReadOnlySenderType <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">read</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) {</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <span class="keywordflow">return</span> read(distribution().localTileIndex(index));</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  }</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160; </div>
+<div class="line"><a name="l00217"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">  217</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">waitLocalTiles</a>() noexcept;</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160; </div>
+<div class="line"><a name="l00225"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c">  225</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> subPipelineConst() {</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(*<span class="keyword">this</span>, SubPipelineTag{});</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;  }</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160; </div>
+<div class="line"><a name="l00238"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">  238</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">retiledSubPipelineConst</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>&amp; tiles_per_block) {</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(*<span class="keyword">this</span>, tiles_per_block);</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;  }</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160; </div>
+<div class="line"><a name="l00246"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">  246</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">done</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> i = tileLinearIndex(index);</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    tile_managers_[i].reset();</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  }</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160; </div>
+<div class="line"><a name="l00255"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2">  255</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2">done</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) noexcept {</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    done(distribution().localTileIndex(index));</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  }</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160; </div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;<span class="keyword">protected</span>:</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution) : internal::MatrixBase{std::move(distribution)} {}</div>
+<div class="line"><a name="l00261"></a><span class="lineno"><a class="line" href="structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html">  261</a></span>&#160;  <span class="keyword">struct </span>SubPipelineTag {};</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; mat, <span class="keyword">const</span> SubPipelineTag);</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">Matrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix</a>&amp; mat, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>&amp; tiles_per_block);</div>
 <div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160; </div>
-<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;<span class="comment">// Distributed versions</span></div>
-<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160; </div>
-<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00279"></a><span class="lineno"><a class="line" href="matrix_8h.html#aace8acce04f452c07b86ea6d04b33366">  279</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">createMatrixFromColMajor</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;                                      SizeType ld, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm,</div>
-<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;                                      <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>&amp; source_rank_index, T* ptr) {</div>
-<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution(size, block_size, comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>(), comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">rank</a>(), source_rank_index);</div>
-<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;  <span class="keyword">auto</span> layout = <a class="code" href="layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902">colMajorLayout</a>(distribution.localSize(), block_size, ld);</div>
-<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160; </div>
-<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(std::move(distribution), layout, ptr);</div>
-<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;}</div>
-<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160; </div>
-<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00299"></a><span class="lineno"><a class="line" href="matrix_8h.html#a6191cb29721235980256d98eeea8d722">  299</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">createMatrixFromColMajor</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;                                      SizeType ld, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm, T* ptr) {</div>
-<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;  <span class="keywordflow">return</span> createMatrixFromColMajor&lt;D&gt;(size, block_size, ld, comm, {0, 0}, ptr);</div>
-<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;}</div>
-<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160; </div>
-<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00314"></a><span class="lineno"><a class="line" href="matrix_8h.html#a56931003af5239d82bb1ba403af878e4">  314</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm,</div>
-<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>&amp; source_rank_index, T* ptr) {</div>
-<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution(size, block_size, comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>(), comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">rank</a>(), source_rank_index);</div>
-<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;  <span class="keyword">auto</span> layout = <a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(distribution.localSize(), block_size);</div>
-<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160; </div>
-<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(std::move(distribution), layout, ptr);</div>
-<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;}</div>
-<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160; </div>
-<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="matrix_8h.html#a26c92f6737011495d6b3764725c4949a">  332</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm, T* ptr) {</div>
-<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;  <span class="keywordflow">return</span> createMatrixFromTile&lt;D&gt;(size, block_size, comm, {0, 0}, ptr);</div>
-<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;}</div>
-<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160; </div>
-<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00351"></a><span class="lineno"><a class="line" href="matrix_8h.html#a6bbd903412fe86fb4e7ad4b9b52a2102">  351</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;                                  SizeType ld_tile, SizeType tiles_per_col,</div>
-<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm,</div>
-<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>&amp; source_rank_index, T* ptr) {</div>
-<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution(size, block_size, comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>(), comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">rank</a>(), source_rank_index);</div>
-<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  <span class="keyword">auto</span> layout = <a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(distribution.localSize(), block_size, ld_tile, tiles_per_col);</div>
-<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160; </div>
-<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(std::move(distribution), layout, ptr);</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;  <span class="keywordtype">void</span> setUpTiles(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1memory_1_1_memory_view.html">memory::MemoryView&lt;ElementType, D&gt;</a>&amp; mem, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_layout_info.html">LayoutInfo</a>&amp; layout) noexcept;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;  <span class="keywordtype">void</span> setUpSubPipelines(<a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp;) noexcept;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;  <span class="keywordtype">void</span> setUpRetiledSubPipelines(<a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp;, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>&amp; tiles_per_block) noexcept;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160; </div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;  std::vector&lt;internal::TilePipeline&lt;T, D&gt;&gt; tile_managers_;</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;};</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160; </div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="comment">// Note: the templates of the following helper functions are inverted w.r.t. the Matrix templates</span></div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;<span class="comment">// to allow the user to only specify the device and let the compiler deduce the type T.</span></div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160; </div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;<span class="comment">// Local versions</span></div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160; </div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">  287</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">createMatrixFromColMajor</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;                                      SizeType ld, T* ptr) {</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(<a class="code" href="layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902">colMajorLayout</a>(size, block_size, ld), ptr);</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;}</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160; </div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">  300</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;                                  T* ptr) {</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(<a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(size, block_size), ptr);</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;}</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160; </div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00317"></a><span class="lineno"><a class="line" href="matrix_8h.html#a5b237a24c0c9c1d9ca958e56684973ae">  317</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                                  SizeType ld_tile, SizeType tiles_per_col, T* ptr) {</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(<a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(size, block_size, ld_tile, tiles_per_col), ptr);</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;}</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160; </div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="comment">// Distributed versions</span></div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160; </div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00336"></a><span class="lineno"><a class="line" href="matrix_8h.html#aace8acce04f452c07b86ea6d04b33366">  336</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">createMatrixFromColMajor</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;                                      SizeType ld, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm,</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;                                      <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>&amp; source_rank_index, T* ptr) {</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution(size, block_size, comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>(), comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">rank</a>(), source_rank_index);</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;  <span class="keyword">auto</span> layout = <a class="code" href="layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902">colMajorLayout</a>(distribution.localSize(), block_size, ld);</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160; </div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(std::move(distribution), layout, ptr);</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;}</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160; </div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00356"></a><span class="lineno"><a class="line" href="matrix_8h.html#a6191cb29721235980256d98eeea8d722">  356</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">createMatrixFromColMajor</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;                                      SizeType ld, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm, T* ptr) {</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;  <span class="keywordflow">return</span> createMatrixFromColMajor&lt;D&gt;(size, block_size, ld, comm, {0, 0}, ptr);</div>
 <div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;}</div>
 <div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160; </div>
-<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00374"></a><span class="lineno"><a class="line" href="matrix_8h.html#a71205e9a339140e0f9844c929d963d85">  374</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
-<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;                                  SizeType ld_tile, SizeType tiles_per_col,</div>
-<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm, T* ptr) {</div>
-<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;  <span class="keywordflow">return</span> createMatrixFromTile&lt;D&gt;(size, block_size, ld_tile, tiles_per_col, comm, {0, 0}, ptr);</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00371"></a><span class="lineno"><a class="line" href="matrix_8h.html#a56931003af5239d82bb1ba403af878e4">  371</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm,</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>&amp; source_rank_index, T* ptr) {</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution(size, block_size, comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>(), comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">rank</a>(), source_rank_index);</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;  <span class="keyword">auto</span> layout = <a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(distribution.localSize(), block_size);</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160; </div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(std::move(distribution), layout, ptr);</div>
 <div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;}</div>
 <div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160; </div>
-<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLike&gt;</div>
-<div class="line"><a name="l00384"></a><span class="lineno"><a class="line" href="matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20">  384</a></span>&#160;<span class="keyword">auto</span> <a class="code" href="matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20">selectRead</a>(MatrixLike&amp; matrix, <a class="code" href="classdlaf_1_1common_1_1_iterable_range2_d.html">common::IterableRange2D&lt;SizeType, LocalTile_TAG&gt;</a> range) {</div>
-<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;  <span class="keywordflow">return</span> internal::selectGeneric([&amp;](<span class="keyword">auto</span> index) { <span class="keywordflow">return</span> matrix.read(index); }, range);</div>
-<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;}</div>
-<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160; </div>
-<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLike&gt;</div>
-<div class="line"><a name="l00392"></a><span class="lineno"><a class="line" href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">  392</a></span>&#160;<span class="keyword">auto</span> <a class="code" href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">select</a>(MatrixLike&amp; matrix, <a class="code" href="classdlaf_1_1common_1_1_iterable_range2_d.html">common::IterableRange2D&lt;SizeType, LocalTile_TAG&gt;</a> range) {</div>
-<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;  <span class="keywordflow">return</span> internal::selectGeneric([&amp;](<span class="keyword">auto</span> index) { <span class="keywordflow">return</span> matrix.readwrite(index); }, range);</div>
-<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;}</div>
-<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160; </div>
-<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;<span class="comment">// ETI</span></div>
-<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160; </div>
-<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;<span class="preprocessor">#define DLAF_MATRIX_ETI(KWORD, DATATYPE, DEVICE) \</span></div>
-<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="preprocessor">  KWORD template class Matrix&lt;DATATYPE, DEVICE&gt;; \</span></div>
-<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;<span class="preprocessor">  KWORD template class Matrix&lt;const DATATYPE, DEVICE&gt;;</span></div>
-<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160; </div>
-<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">float</span>, Device::CPU)</div>
-<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">double</span>, Device::CPU)</div>
-<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;float&gt;, Device::CPU)</div>
-<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;double&gt;, Device::CPU)</div>
-<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160; </div>
-<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;<span class="preprocessor">#if defined(DLAF_WITH_GPU)</span></div>
-<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">float</span>, Device::GPU)</div>
-<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">double</span>, Device::GPU)</div>
-<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;float&gt;, Device::GPU)</div>
-<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;double&gt;, Device::GPU)</div>
-<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;}</div>
-<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;<span class="preprocessor">#ifndef DLAF_DOXYGEN</span></div>
-<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;<span class="comment">// Note: Doxygen doesn&#39;t deal correctly with template specialized inheritance,</span></div>
-<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;<span class="comment">// and this line makes it run infinitely</span></div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00389"></a><span class="lineno"><a class="line" href="matrix_8h.html#a26c92f6737011495d6b3764725c4949a">  389</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm, T* ptr) {</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;  <span class="keywordflow">return</span> createMatrixFromTile&lt;D&gt;(size, block_size, comm, {0, 0}, ptr);</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;}</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160; </div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00408"></a><span class="lineno"><a class="line" href="matrix_8h.html#a6bbd903412fe86fb4e7ad4b9b52a2102">  408</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;                                  SizeType ld_tile, SizeType tiles_per_col,</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm,</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a>&amp; source_rank_index, T* ptr) {</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a> distribution(size, block_size, comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">size</a>(), comm.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">rank</a>(), source_rank_index);</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;  <span class="keyword">auto</span> layout = <a class="code" href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">tileLayout</a>(distribution.localSize(), block_size, ld_tile, tiles_per_col);</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160; </div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>(std::move(distribution), layout, ptr);</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;}</div>
 <div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160; </div>
-<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;<span class="keyword">using</span> matrix::Matrix;</div>
-<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;}</div>
-<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160; </div>
-<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/matrix.tpp&gt;</span></div>
-<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/matrix_const.tpp&gt;</span></div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;<span class="keyword">template</span> &lt;Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00431"></a><span class="lineno"><a class="line" href="matrix_8h.html#a71205e9a339140e0f9844c929d963d85">  431</a></span>&#160;<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a> <a class="code" href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">createMatrixFromTile</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">GlobalElementSize</a>&amp; size, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">TileElementSize</a>&amp; block_size,</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;                                  SizeType ld_tile, SizeType tiles_per_col,</div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;                                  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; comm, T* ptr) {</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;  <span class="keywordflow">return</span> createMatrixFromTile&lt;D&gt;(size, block_size, ld_tile, tiles_per_col, comm, {0, 0}, ptr);</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;}</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160; </div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLike&gt;</div>
+<div class="line"><a name="l00441"></a><span class="lineno"><a class="line" href="matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20">  441</a></span>&#160;<span class="keyword">auto</span> <a class="code" href="matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20">selectRead</a>(MatrixLike&amp; matrix, <a class="code" href="classdlaf_1_1common_1_1_iterable_range2_d.html">common::IterableRange2D&lt;SizeType, LocalTile_TAG&gt;</a> range) {</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;  <span class="keywordflow">return</span> internal::selectGeneric([&amp;](<span class="keyword">auto</span> index) { <span class="keywordflow">return</span> matrix.read(index); }, range);</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;}</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160; </div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLike&gt;</div>
+<div class="line"><a name="l00449"></a><span class="lineno"><a class="line" href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">  449</a></span>&#160;<span class="keyword">auto</span> <a class="code" href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">select</a>(MatrixLike&amp; matrix, <a class="code" href="classdlaf_1_1common_1_1_iterable_range2_d.html">common::IterableRange2D&lt;SizeType, LocalTile_TAG&gt;</a> range) {</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  <span class="keywordflow">return</span> internal::selectGeneric([&amp;](<span class="keyword">auto</span> index) { <span class="keywordflow">return</span> matrix.readwrite(index); }, range);</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;}</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160; </div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;<span class="comment">// ETI</span></div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160; </div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;<span class="preprocessor">#define DLAF_MATRIX_ETI(KWORD, DATATYPE, DEVICE) \</span></div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;<span class="preprocessor">  KWORD template class Matrix&lt;DATATYPE, DEVICE&gt;; \</span></div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;<span class="preprocessor">  KWORD template class Matrix&lt;const DATATYPE, DEVICE&gt;;</span></div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160; </div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">float</span>, Device::CPU)</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">double</span>, Device::CPU)</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;float&gt;, Device::CPU)</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;double&gt;, Device::CPU)</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160; </div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;<span class="preprocessor">#if defined(DLAF_WITH_GPU)</span></div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">float</span>, Device::GPU)</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">double</span>, Device::GPU)</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;float&gt;, Device::GPU)</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;DLAF_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;double&gt;, Device::GPU)</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;}</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;<span class="preprocessor">#ifndef DLAF_DOXYGEN</span></div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;<span class="comment">// Note: Doxygen doesn&#39;t deal correctly with template specialized inheritance,</span></div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;<span class="comment">// and this line makes it run infinitely</span></div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160; </div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;<span class="keyword">using</span> matrix::Matrix;</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;}</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160; </div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/matrix.tpp&gt;</span></div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/matrix_const.tpp&gt;</span></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html_a45574d05dd3cfb3d40d198cdf10b169e"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e">dlaf::comm::CommunicatorGrid::rank</a></div><div class="ttdeci">Index2D rank() const noexcept</div><div class="ttdef"><b>Definition:</b> communicator_grid.h:63</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html_a9307e8d79bffad58211c317c92c7dc77"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77">dlaf::comm::CommunicatorGrid::size</a></div><div class="ttdeci">Size2D size() const noexcept</div><div class="ttdoc">Return the number of rows in the grid.</div><div class="ttdef"><b>Definition:</b> communicator_grid.h:68</div></div>
@@ -344,22 +363,26 @@
 <div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html">dlaf::matrix::Distribution</a></div><div class="ttdef"><b>Definition:</b> distribution.h:27</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_layout_info_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_layout_info.html">dlaf::matrix::LayoutInfo</a></div><div class="ttdef"><b>Definition:</b> layout_info.h:26</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> matrix.h:151</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_a8485d802a7f318a845de46e1b4e48118"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">dlaf::matrix::Matrix&lt; const T, D &gt;::read</a></div><div class="ttdeci">ReadOnlySenderType read(const GlobalTileIndex &amp;index)</div><div class="ttdef"><b>Definition:</b> matrix.h:189</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_abd8114d7c9ff03a2ff5c8613284135f6"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">dlaf::matrix::Matrix&lt; const T, D &gt;::read</a></div><div class="ttdeci">ReadOnlySenderType read(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:181</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> matrix.h:171</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_a8485d802a7f318a845de46e1b4e48118"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118">dlaf::matrix::Matrix&lt; const T, D &gt;::read</a></div><div class="ttdeci">ReadOnlySenderType read(const GlobalTileIndex &amp;index)</div><div class="ttdef"><b>Definition:</b> matrix.h:209</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_aa10512ea4bde924a55e73bfe07050942"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942">dlaf::matrix::Matrix&lt; const T, D &gt;::retiledSubPipelineConst</a></div><div class="ttdeci">Matrix retiledSubPipelineConst(const LocalTileSize &amp;tiles_per_block)</div><div class="ttdef"><b>Definition:</b> matrix.h:238</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_aaac68e6ec599e12aac6e7e4bd32570a8"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8">dlaf::matrix::Matrix&lt; const T, D &gt;::done</a></div><div class="ttdeci">void done(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:246</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_abd8114d7c9ff03a2ff5c8613284135f6"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6">dlaf::matrix::Matrix&lt; const T, D &gt;::read</a></div><div class="ttdeci">ReadOnlySenderType read(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:201</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_abffc73bf079f7f7c23af3fca4dec329f"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f">dlaf::matrix::Matrix&lt; const T, D &gt;::waitLocalTiles</a></div><div class="ttdeci">void waitLocalTiles() noexcept</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html_ade093c346a4df7e85c94b71fd86eaec2"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2">dlaf::matrix::Matrix&lt; const T, D &gt;::done</a></div><div class="ttdeci">void done(const GlobalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:255</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_a1f0c98f29fa14cccef9f5378f6ee20b1"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1">dlaf::matrix::Matrix::Matrix</a></div><div class="ttdeci">Matrix(Distribution distribution, const LayoutInfo &amp;layout) noexcept</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_a5d2827ca2dbad4d6e6482e4c1e963472"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472">dlaf::matrix::Matrix::Matrix</a></div><div class="ttdeci">Matrix(Distribution distribution, const LayoutInfo &amp;layout, ElementType *ptr) noexcept</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_a65b04ca6f55cf213c52cda2f3a532023"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023">dlaf::matrix::Matrix::Matrix</a></div><div class="ttdeci">Matrix(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm)</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_a720bcfeb6db4c2f2d6e144f8570b8e23"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23">dlaf::matrix::Matrix::subPipeline</a></div><div class="ttdeci">Matrix subPipeline()</div><div class="ttdef"><b>Definition:</b> matrix.h:141</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_a73b38df3414aa5272abd3b6e87d67e37"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37">dlaf::matrix::Matrix::Matrix</a></div><div class="ttdeci">Matrix(Distribution distribution)</div><div class="ttdoc">Create a matrix distributed according to the distribution distribution.</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_aa0614a38addeb9aaf83d268f1092b779"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779">dlaf::matrix::Matrix::Matrix</a></div><div class="ttdeci">Matrix(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:121</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_aae1c8b22f9862944a006003f528595ff"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff">dlaf::matrix::Matrix::retiledSubPipeline</a></div><div class="ttdeci">Matrix retiledSubPipeline(const LocalTileSize &amp;tiles_per_block)</div><div class="ttdef"><b>Definition:</b> matrix.h:154</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:122</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad5f429b579c79194b453206f24d7de49"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49">dlaf::matrix::Matrix::Matrix</a></div><div class="ttdeci">Matrix(const LayoutInfo &amp;layout, ElementType *ptr)</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_af486e66243b57df94b9822bd2553ae38"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const GlobalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:129</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_af486e66243b57df94b9822bd2553ae38"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const GlobalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:130</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile.html">dlaf::matrix::Tile</a></div><div class="ttdef"><b>Definition:</b> tile.h:329</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_matrix_base_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></div><div class="ttdef"><b>Definition:</b> matrix_base.h:24</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_matrix_base_html_a5cdaa0376724e6f624591a6a6bcf46d9"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">dlaf::matrix::internal::MatrixBase::tileLinearIndex</a></div><div class="ttdeci">std::size_t tileLinearIndex(const LocalTileIndex &amp;index) const noexcept</div><div class="ttdef"><b>Definition:</b> matrix_base.h:111</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_tile_data_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">dlaf::matrix::internal::TileData</a></div><div class="ttdef"><b>Definition:</b> tile.h:35</div></div>
 <div class="ttc" id="aclassdlaf_1_1memory_1_1_memory_view_html"><div class="ttname"><a href="classdlaf_1_1memory_1_1_memory_view.html">dlaf::memory::MemoryView</a></div><div class="ttdef"><b>Definition:</b> memory_view.h:32</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
@@ -368,15 +391,16 @@
 <div class="ttc" id="alayout__info_8h_html_a94ba1a30c8eef4798f864ae119c77113"><div class="ttname"><a href="layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113">dlaf::matrix::tileLayout</a></div><div class="ttdeci">LayoutInfo tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col)</div><div class="ttdoc">Returns LayoutInfo for a local matrix which use the tile layout (Advanced interface).</div><div class="ttdef"><b>Definition:</b> layout_info.h:135</div></div>
 <div class="ttc" id="alayout__info_8h_html_adf298ab87e69a013e5f06856ab7e7902"><div class="ttname"><a href="layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902">dlaf::matrix::colMajorLayout</a></div><div class="ttdeci">LayoutInfo colMajorLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld)</div><div class="ttdoc">Returns LayoutInfo for a local column major matrix.</div><div class="ttdef"><b>Definition:</b> layout_info.h:125</div></div>
 <div class="ttc" id="amatrix_2tile_8h_html"><div class="ttname"><a href="matrix_2tile_8h.html">tile.h</a></div></div>
-<div class="ttc" id="amatrix_8h_html_a02db5399b6bc7e53a162f5939ed7ca20"><div class="ttname"><a href="matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20">dlaf::matrix::selectRead</a></div><div class="ttdeci">auto selectRead(MatrixLike &amp;matrix, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:384</div></div>
-<div class="ttc" id="amatrix_8h_html_a0edf764f5d64e80355ffe9a5c8eb31e7"><div class="ttname"><a href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">dlaf::matrix::createMatrixFromColMajor</a></div><div class="ttdeci">Matrix&lt; T, D &gt; createMatrixFromColMajor(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, T *ptr)</div><div class="ttdef"><b>Definition:</b> matrix.h:230</div></div>
-<div class="ttc" id="amatrix_8h_html_a1abc47c06dc1c46c9bdc2425090a02ab"><div class="ttname"><a href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">dlaf::matrix::select</a></div><div class="ttdeci">auto select(MatrixLike &amp;matrix, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:392</div></div>
-<div class="ttc" id="amatrix_8h_html_abae8f550140d87bbe74dfb9bc35c5226"><div class="ttname"><a href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">dlaf::matrix::createMatrixFromTile</a></div><div class="ttdeci">Matrix&lt; T, D &gt; createMatrixFromTile(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, T *ptr)</div><div class="ttdef"><b>Definition:</b> matrix.h:243</div></div>
-<div class="ttc" id="amatrix_8h_html_ac3737882aaaf23b1f901da6396202ba1"><div class="ttname"><a href="matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1">dlaf::matrix::internal::selectGeneric</a></div><div class="ttdeci">auto selectGeneric(Func &amp;&amp;f, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:38</div></div>
+<div class="ttc" id="amatrix_8h_html_a02db5399b6bc7e53a162f5939ed7ca20"><div class="ttname"><a href="matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20">dlaf::matrix::selectRead</a></div><div class="ttdeci">auto selectRead(MatrixLike &amp;matrix, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:441</div></div>
+<div class="ttc" id="amatrix_8h_html_a0edf764f5d64e80355ffe9a5c8eb31e7"><div class="ttname"><a href="matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7">dlaf::matrix::createMatrixFromColMajor</a></div><div class="ttdeci">Matrix&lt; T, D &gt; createMatrixFromColMajor(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, T *ptr)</div><div class="ttdef"><b>Definition:</b> matrix.h:287</div></div>
+<div class="ttc" id="amatrix_8h_html_a1abc47c06dc1c46c9bdc2425090a02ab"><div class="ttname"><a href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">dlaf::matrix::select</a></div><div class="ttdeci">auto select(MatrixLike &amp;matrix, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:449</div></div>
+<div class="ttc" id="amatrix_8h_html_abae8f550140d87bbe74dfb9bc35c5226"><div class="ttname"><a href="matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226">dlaf::matrix::createMatrixFromTile</a></div><div class="ttdeci">Matrix&lt; T, D &gt; createMatrixFromTile(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, T *ptr)</div><div class="ttdef"><b>Definition:</b> matrix.h:300</div></div>
+<div class="ttc" id="amatrix_8h_html_ac3737882aaaf23b1f901da6396202ba1"><div class="ttname"><a href="matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1">dlaf::matrix::internal::selectGeneric</a></div><div class="ttdeci">auto selectGeneric(Func &amp;&amp;f, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:39</div></div>
 <div class="ttc" id="amatrix__base_8h_html"><div class="ttname"><a href="matrix__base_8h.html">matrix_base.h</a></div></div>
 <div class="ttc" id="arange2d_8h_html"><div class="ttname"><a href="range2d_8h.html">range2d.h</a></div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="atypes_8h_html_a25d16ff6621f011d9a98be3d9ebf29f1"><div class="ttname"><a href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">dlaf::to_sizet</a></div><div class="ttdeci">auto to_sizet(const T signed_value)</div><div class="ttdef"><b>Definition:</b> types.h:265</div></div>
+<div class="ttc" id="avector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
diff --git a/master/multiplication_2general_8h.html b/master/multiplication_2general_8h.html
index da0af44ffb..945a760519 100644
--- a/master/multiplication_2general_8h.html
+++ b/master/multiplication_2general_8h.html
@@ -187,6 +187,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a0aa788470aca6ca602025132
 <dd>
 mat_a, mat_b and mat_c have the same size, </dd>
 <dd>
+mat_a, mat_b and mat_c have equal tile and block sizes, </dd>
+<dd>
 a &lt;= b &lt;= mat_a.nrTiles().rows() </dd></dl>
 
 </div>
@@ -275,6 +277,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a45f04fd24259c413a07a210a
 <dd>
 mat_a, mat_b and mat_c have the same size, </dd>
 <dd>
+mat_a, mat_b and mat_c have equal tile and block sizes, </dd>
+<dd>
 mat_a, mat_b and mat_c are not distributed, </dd>
 <dd>
 a &lt;= b &lt;= mat_a.nrTiles().rows() </dd></dl>
diff --git a/master/multiplication_2general_8h_source.html b/master/multiplication_2general_8h_source.html
index e1fbb11869..59e66fe68c 100644
--- a/master/multiplication_2general_8h_source.html
+++ b/master/multiplication_2general_8h_source.html
@@ -95,86 +95,94 @@
 <div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160; </div>
 <div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="keyword">namespace </span>dlaf::multiplication {</div>
 <div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160; </div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">   48</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">generalSubMatrix</a>(<span class="keyword">const</span> SizeType a, <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> blas::Op opA, <span class="keyword">const</span> blas::Op opB,</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                      <span class="keyword">const</span> T alpha, Matrix&lt;const T, D&gt;&amp; mat_a, Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta,</div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                      Matrix&lt;T, D&gt;&amp; mat_c) {</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_c), mat_c);</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160; </div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_c), mat_c);</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160; </div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="comment">// This is an over-constraint, since the algorithm just cares about the sub-matrix size.</span></div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="comment">// It simplifies next check about [a,b) range validity, that otherwise would require it to be</span></div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="comment">// validated against every single sub-matrix in a, b and c that might have different element sizes.</span></div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">// At the moment, we don&#39;t have this use-case, so let&#39;s keep it simple.</span></div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_b), mat_a, mat_b);</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_c), mat_a, mat_c);</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  [[maybe_unused]] <span class="keyword">const</span> SizeType m = mat_a.nrTiles().rows();</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  DLAF_ASSERT(a &lt;= b, a, b);</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  DLAF_ASSERT(a &gt;= 0 &amp;&amp; a &lt;= m, a, m);</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  DLAF_ASSERT(b &gt;= 0 &amp;&amp; b &lt;= m, b, m);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">   49</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">generalSubMatrix</a>(<span class="keyword">const</span> SizeType a, <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> blas::Op opA, <span class="keyword">const</span> blas::Op opB,</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                      <span class="keyword">const</span> T alpha, Matrix&lt;const T, D&gt;&amp; mat_a, Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta,</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                      Matrix&lt;T, D&gt;&amp; mat_c) {</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_c), mat_c);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_c), mat_c);</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160; </div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_c), mat_c);</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160; </div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">// This is an over-constraint, since the algorithm just cares about the sub-matrix size.</span></div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="comment">// It simplifies next check about [a,b) range validity, that otherwise would require it to be</span></div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="comment">// validated against every single sub-matrix in a, b and c that might have different element sizes.</span></div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <span class="comment">// At the moment, we don&#39;t have this use-case, so let&#39;s keep it simple.</span></div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_b), mat_a, mat_b);</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_c), mat_a, mat_c);</div>
 <div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160; </div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keywordflow">if</span> (opA == Op::NoTrans &amp;&amp; opB == Op::NoTrans)</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html">internal::GeneralSub&lt;B, D, T&gt;::callNN</a>(a, b, opA, opB, alpha, mat_a, mat_b, beta, mat_c);</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    DLAF_UNIMPLEMENTED(opA, opB);</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;}</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160; </div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="multiplication_2general_8h.html#a0aa788470aca6ca60202513251578a36">   98</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">generalSubMatrix</a>([[maybe_unused]] <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid,</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                      <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a>&amp; row_task_chain,</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                      <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a>&amp; col_task_chain, <span class="keyword">const</span> SizeType a,</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                      <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> T alpha, Matrix&lt;const T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;                      Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta, Matrix&lt;T, D&gt;&amp; mat_c) {</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  DLAF_ASSERT(equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  DLAF_ASSERT(equal_process_grid(mat_b, grid), mat_a, grid);</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(equal_process_grid(mat_c, grid), mat_a, grid);</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160; </div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_b), mat_b);</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_c), mat_c);</div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="comment">// This is an over-constraint, since the algorithm just cares about the sub-matrix size (and its</span></div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="comment">// distribution).</span></div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <span class="comment">// It simplifies next check about [a,b) range validity, that otherwise would require it to be</span></div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <span class="comment">// validated against every single sub-matrix in a, b and c that might have different element sizes.</span></div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <span class="comment">//</span></div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <span class="comment">// At the moment, we don&#39;t have this use-case, so let&#39;s keep it simple.</span></div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_b), mat_a, mat_b);</div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_c), mat_a, mat_c);</div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160; </div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  [[maybe_unused]] <span class="keyword">const</span> SizeType m = mat_a.nrTiles().rows();</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  DLAF_ASSERT(a &lt;= b, a, b);</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  DLAF_ASSERT(a &gt;= 0 &amp;&amp; a &lt;= m, a, m);</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  DLAF_ASSERT(b &gt;= 0 &amp;&amp; b &lt;= m, b, m);</div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160; </div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html">internal::GeneralSub&lt;B, D, T&gt;::callNN</a>(row_task_chain, col_task_chain, a, b, alpha, mat_a, mat_b, beta,</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                                        mat_c);</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;}</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160; </div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="keywordtype">void</span> generalSubMatrix(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <span class="keyword">const</span> SizeType a, <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> T alpha,</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;                      Matrix&lt;const T, D&gt;&amp; mat_a, Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta,</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                      Matrix&lt;T, D&gt;&amp; mat_c) {</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a> row_task_chain(grid.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391">rowCommunicator</a>().<a class="code" href="classdlaf_1_1comm_1_1_communicator.html#a436eca0d1c23635a6dcd209f1a1c37df">clone</a>());</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a> col_task_chain(grid.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#af6821b23aeb96284b9e217a02c5115e5">colCommunicator</a>().<a class="code" href="classdlaf_1_1comm_1_1_communicator.html#a436eca0d1c23635a6dcd209f1a1c37df">clone</a>());</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  generalSubMatrix&lt;B, D, T&gt;(grid, row_task_chain, col_task_chain, a, b, alpha, mat_a, mat_b, beta,</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                            mat_c);</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  [[maybe_unused]] <span class="keyword">const</span> SizeType m = mat_a.nrTiles().rows();</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  DLAF_ASSERT(a &lt;= b, a, b);</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  DLAF_ASSERT(a &gt;= 0 &amp;&amp; a &lt;= m, a, m);</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  DLAF_ASSERT(b &gt;= 0 &amp;&amp; b &lt;= m, b, m);</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160; </div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keyword">using namespace </span>blas;</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160; </div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  <span class="keywordflow">if</span> (opA == Op::NoTrans &amp;&amp; opB == Op::NoTrans)</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html">internal::GeneralSub&lt;B, D, T&gt;::callNN</a>(a, b, opA, opB, alpha, mat_a, mat_b, beta, mat_c);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    DLAF_UNIMPLEMENTED(opA, opB);</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;}</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160; </div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="multiplication_2general_8h.html#a0aa788470aca6ca60202513251578a36">  104</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">generalSubMatrix</a>([[maybe_unused]] <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid,</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;                      <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a>&amp; row_task_chain,</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;                      <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a>&amp; col_task_chain, <span class="keyword">const</span> SizeType a,</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                      <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> T alpha, Matrix&lt;const T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;                      Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta, Matrix&lt;T, D&gt;&amp; mat_c) {</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  DLAF_ASSERT(equal_process_grid(mat_b, grid), mat_a, grid);</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  DLAF_ASSERT(equal_process_grid(mat_c, grid), mat_a, grid);</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160; </div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_b), mat_b);</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_blocksize(mat_c), mat_c);</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160; </div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_c), mat_c);</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160; </div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="comment">// This is an over-constraint, since the algorithm just cares about the sub-matrix size (and its</span></div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="comment">// distribution).</span></div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="comment">// It simplifies next check about [a,b) range validity, that otherwise would require it to be</span></div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="comment">// validated against every single sub-matrix in a, b and c that might have different element sizes.</span></div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  <span class="comment">//</span></div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="comment">// At the moment, we don&#39;t have this use-case, so let&#39;s keep it simple.</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  DLAF_ASSERT(dlaf::matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_b), mat_a, mat_b);</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  DLAF_ASSERT(equal_size(mat_a, mat_c), mat_a, mat_c);</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160; </div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  [[maybe_unused]] <span class="keyword">const</span> SizeType m = mat_a.nrTiles().rows();</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  DLAF_ASSERT(a &lt;= b, a, b);</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  DLAF_ASSERT(a &gt;= 0 &amp;&amp; a &lt;= m, a, m);</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  DLAF_ASSERT(b &gt;= 0 &amp;&amp; b &lt;= m, b, m);</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160; </div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html">internal::GeneralSub&lt;B, D, T&gt;::callNN</a>(row_task_chain, col_task_chain, a, b, alpha, mat_a, mat_b, beta,</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                                        mat_c);</div>
 <div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;}</div>
 <div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160; </div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;}</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keywordtype">void</span> generalSubMatrix(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <span class="keyword">const</span> SizeType a, <span class="keyword">const</span> SizeType b, <span class="keyword">const</span> T alpha,</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;                      Matrix&lt;const T, D&gt;&amp; mat_a, Matrix&lt;const T, D&gt;&amp; mat_b, <span class="keyword">const</span> T beta,</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;                      Matrix&lt;T, D&gt;&amp; mat_c) {</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a> row_task_chain(grid.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391">rowCommunicator</a>().<a class="code" href="classdlaf_1_1comm_1_1_communicator.html#a436eca0d1c23635a6dcd209f1a1c37df">clone</a>());</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a> col_task_chain(grid.<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html#af6821b23aeb96284b9e217a02c5115e5">colCommunicator</a>().<a class="code" href="classdlaf_1_1comm_1_1_communicator.html#a436eca0d1c23635a6dcd209f1a1c37df">clone</a>());</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  generalSubMatrix&lt;B, D, T&gt;(grid, row_task_chain, col_task_chain, a, b, alpha, mat_a, mat_b, beta,</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;                            mat_c);</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;}</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160; </div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html_ab13487adb2992d2cc50e06b498582391"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391">dlaf::comm::CommunicatorGrid::rowCommunicator</a></div><div class="ttdeci">Communicator &amp; rowCommunicator() noexcept</div><div class="ttdoc">Return a Communicator grouping all ranks in the row (that includes the current process).</div><div class="ttdef"><b>Definition:</b> communicator_grid.h:78</div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html_af6821b23aeb96284b9e217a02c5115e5"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html#af6821b23aeb96284b9e217a02c5115e5">dlaf::comm::CommunicatorGrid::colCommunicator</a></div><div class="ttdeci">Communicator &amp; colCommunicator() noexcept</div><div class="ttdoc">Return a Communicator grouping all ranks in the column (that includes the current process).</div><div class="ttdef"><b>Definition:</b> communicator_grid.h:83</div></div>
@@ -184,7 +192,7 @@
 <div class="ttc" id="adistribution_8h_html"><div class="ttname"><a href="distribution_8h.html">distribution.h</a></div></div>
 <div class="ttc" id="aindex_8h_html"><div class="ttname"><a href="index_8h.html">index.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="amultiplication_2general_8h_html_a45f04fd24259c413a07a210a17b91b93"><div class="ttname"><a href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">dlaf::multiplication::generalSubMatrix</a></div><div class="ttdeci">void generalSubMatrix(const SizeType a, const SizeType b, const blas::Op opA, const blas::Op opB, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)</div><div class="ttdef"><b>Definition:</b> general.h:48</div></div>
+<div class="ttc" id="amultiplication_2general_8h_html_a45f04fd24259c413a07a210a17b91b93"><div class="ttname"><a href="multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93">dlaf::multiplication::generalSubMatrix</a></div><div class="ttdeci">void generalSubMatrix(const SizeType a, const SizeType b, const blas::Op opA, const blas::Op opB, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)</div><div class="ttdef"><b>Definition:</b> general.h:49</div></div>
 <div class="ttc" id="apipeline_8h_html"><div class="ttname"><a href="pipeline_8h.html">pipeline.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1multiplication_1_1internal_1_1_general_sub_html"><div class="ttname"><a href="structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html">dlaf::multiplication::internal::GeneralSub</a></div><div class="ttdef"><b>Definition:</b> api.h:23</div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
diff --git a/master/multiplication_2triangular_8h.html b/master/multiplication_2triangular_8h.html
index a4b7425141..7198174257 100644
--- a/master/multiplication_2triangular_8h.html
+++ b/master/multiplication_2triangular_8h.html
@@ -163,6 +163,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a6300b8eb1a939512a5b1c452
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a and mat_b have equal tile and block sizes, </dd>
+<dd>
 mat_a and mat_b are not distributed, </dd>
 <dd>
 mat_a and mat_b are multipliable. </dd></dl>
@@ -248,6 +250,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#ad4de985e76a6c12c487b36fa
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a and mat_b have equal tile and block sizes, </dd>
+<dd>
 mat_a and mat_b are distributed according to the grid, </dd>
 <dd>
 mat_a and mat_b are multipliable. </dd></dl>
diff --git a/master/multiplication_2triangular_8h_source.html b/master/multiplication_2triangular_8h_source.html
index 1885aa4ae3..69093b6f18 100644
--- a/master/multiplication_2triangular_8h_source.html
+++ b/master/multiplication_2triangular_8h_source.html
@@ -92,116 +92,120 @@
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="keyword">namespace </span>multiplication {</div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160; </div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">   43</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">triangular</a>(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha,</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;                Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160; </div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">   44</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">triangular</a>(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha,</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;                Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
 <div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;      }</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;      }</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    }</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;      }</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      }</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    }</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;      }</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    }</div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  }</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160; </div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      }</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      }</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    }</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  }</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      }</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    }</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      }</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      }</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    }</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      }</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    }</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  }</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160; </div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="multiplication_2triangular_8h.html#ad4de985e76a6c12c487b36fa773b870b">  110</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">triangular</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Side side, blas::Uplo uplo, blas::Op op,</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                blas::Diag diag, T alpha, Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160; </div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160; </div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;      }</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;        <span class="comment">// Left Lower Trans/ConjTrans</span></div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      }</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    }</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      }</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;        <span class="comment">// Left Upper Trans/ConjTrans</span></div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      }</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    }</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160; </div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      }</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        <span class="comment">// Right Lower Trans/ConjTrans</span></div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      }</div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    }</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      }</div>
-<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;        <span class="comment">// Right Upper Trans/ConjTrans</span></div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      }</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    }</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  }</div>
-<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;}</div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160; </div>
-<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;}</div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;}</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      }</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    }</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  }</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;}</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160; </div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="multiplication_2triangular_8h.html#ad4de985e76a6c12c487b36fa773b870b">  114</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">triangular</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Side side, blas::Uplo uplo, blas::Op op,</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                blas::Diag diag, T alpha, Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160; </div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160; </div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      }</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;        <span class="comment">// Left Lower Trans/ConjTrans</span></div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      }</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    }</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      }</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;        <span class="comment">// Left Upper Trans/ConjTrans</span></div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      }</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    }</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  }</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160; </div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      }</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;        <span class="comment">// Right Lower Trans/ConjTrans</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      }</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    }</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;        <a class="code" href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      }</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;        <span class="comment">// Right Upper Trans/ConjTrans</span></div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;        DLAF_UNIMPLEMENTED(side, uplo, op, diag);</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      }</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    }</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  }</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;}</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160; </div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;}</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="amultiplication_2triangular_8h_html_a6300b8eb1a939512a5b1c45286e89f51"><div class="ttname"><a href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">dlaf::multiplication::triangular</a></div><div class="ttdeci">void triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)</div><div class="ttdef"><b>Definition:</b> triangular.h:43</div></div>
+<div class="ttc" id="amultiplication_2triangular_8h_html_a6300b8eb1a939512a5b1c45286e89f51"><div class="ttname"><a href="multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51">dlaf::multiplication::triangular</a></div><div class="ttdeci">void triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)</div><div class="ttdef"><b>Definition:</b> triangular.h:44</div></div>
 <div class="ttc" id="astructdlaf_1_1multiplication_1_1internal_1_1_triangular_html"><div class="ttname"><a href="structdlaf_1_1multiplication_1_1internal_1_1_triangular.html">dlaf::multiplication::internal::Triangular</a></div><div class="ttdef"><b>Definition:</b> api.h:21</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
diff --git a/master/norm_8h.html b/master/norm_8h.html
index c7f8e6f77d..a4219880e8 100644
--- a/master/norm_8h.html
+++ b/master/norm_8h.html
@@ -149,7 +149,9 @@ <h2 class="memtitle"><span class="permalink"><a href="#a2d0adfb7be9cfe934f96e9dd
 <li>With <code>norm_type</code> = lapack::Norm::{One, Two, Inf, Fro} <dl class="section note"><dt>Note</dt><dd>not yet implemented</dd></dl>
 <dl class="section pre"><dt>Precondition</dt><dd><code>A.blockSize().rows() == A.blockSize().cols()</code>, </dd>
 <dd>
-<code>A</code> is distributed according to <code>grid</code>, </dd></dl>
+<code>A</code> is distributed according to <code>grid</code>, </dd>
+<dd>
+<code>A</code> has equal tile and block sizes, </dd></dl>
 <dl class="section return"><dt>Returns</dt><dd>the norm <code>norm_type</code> of the Matrix <code>A</code> or 0 if <code>A.size().isEmpty()</code> (see LAPACK doc for additional info). </dd></dl>
 </li>
 </ul>
diff --git a/master/norm_8h_source.html b/master/norm_8h_source.html
index df04f2b0cb..e930d0e8a8 100644
--- a/master/norm_8h_source.html
+++ b/master/norm_8h_source.html
@@ -93,49 +93,51 @@
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160; </div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="keyword">namespace </span>dlaf::auxiliary {</div>
 <div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160; </div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">   43</a></span>&#160;dlaf::BaseType&lt;T&gt; <a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a> rank, lapack::Norm norm_type,</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;                       blas::Uplo uplo, Matrix&lt;const T, device&gt;&amp; A) {</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  <span class="keyword">using</span> dlaf::matrix::equal_process_grid;</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160; </div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(equal_process_grid(A, grid), A, grid);</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">   44</a></span>&#160;dlaf::BaseType&lt;T&gt; <a class="code" href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">norm</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">comm::Index2D</a> rank, lapack::Norm norm_type,</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;                       blas::Uplo uplo, Matrix&lt;const T, device&gt;&amp; A) {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="keyword">using</span> dlaf::matrix::equal_process_grid;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  <span class="keyword">using</span> dlaf::matrix::single_tile_per_block;</div>
 <div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160; </div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="comment">// LAPACK documentation specify that if any dimension is 0, the result is 0</span></div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="keywordflow">if</span> (A.size().isEmpty())</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordflow">return</span> {0};</div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordflow">switch</span> (norm_type) {</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::One:</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Two:</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Inf:</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Fro:</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;      DLAF_UNIMPLEMENTED(norm_type);</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;      <span class="keywordflow">return</span> {};</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Max:</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      <span class="keywordflow">switch</span> (uplo) {</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;        <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;          <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1auxiliary_1_1internal_1_1_norm.html">internal::Norm&lt;backend, device, T&gt;::max_L</a>(grid, rank, A);</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;        <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;          DLAF_UNIMPLEMENTED(norm_type, uplo);</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          <span class="keywordflow">return</span> {};</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;        <span class="keywordflow">case</span> blas::Uplo::General:</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1auxiliary_1_1internal_1_1_norm.html">internal::Norm&lt;backend, device, T&gt;::max_G</a>(grid, rank, A);</div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;        <span class="keywordflow">default</span>:</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;          <span class="keywordflow">return</span> {};</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      }</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="keywordflow">default</span>:</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      <span class="keywordflow">return</span> {};</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  }</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;}</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160; </div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;}</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(equal_process_grid(A, grid), A, grid);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(single_tile_per_block(A), A);</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160; </div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// LAPACK documentation specify that if any dimension is 0, the result is 0</span></div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordflow">if</span> (A.size().isEmpty())</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keywordflow">return</span> {0};</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keywordflow">switch</span> (norm_type) {</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::One:</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Two:</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Inf:</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Fro:</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      DLAF_UNIMPLEMENTED(norm_type);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      <span class="keywordflow">return</span> {};</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordflow">case</span> lapack::Norm::Max:</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;      <span class="keywordflow">switch</span> (uplo) {</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;        <span class="keywordflow">case</span> blas::Uplo::Lower:</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1auxiliary_1_1internal_1_1_norm.html">internal::Norm&lt;backend, device, T&gt;::max_L</a>(grid, rank, A);</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;        <span class="keywordflow">case</span> blas::Uplo::Upper:</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          DLAF_UNIMPLEMENTED(norm_type, uplo);</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;          <span class="keywordflow">return</span> {};</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;        <span class="keywordflow">case</span> blas::Uplo::General:</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1auxiliary_1_1internal_1_1_norm.html">internal::Norm&lt;backend, device, T&gt;::max_G</a>(grid, rank, A);</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;        <span class="keywordflow">default</span>:</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;          <span class="keywordflow">return</span> {};</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      }</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordflow">default</span>:</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="keywordflow">return</span> {};</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  }</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;}</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160; </div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;}</div>
 <div class="ttc" id="ablas_2enum__output_8h_html"><div class="ttname"><a href="blas_2enum__output_8h.html">enum_output.h</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_index2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_index2_d.html">dlaf::common::Index2D&lt; IndexT_MPI, TAG_MPI &gt;</a></div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="alapack_2tile_8h_html"><div class="ttname"><a href="lapack_2tile_8h.html">tile.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="anorm_8h_html_a2d0adfb7be9cfe934f96e9dd1c38d839"><div class="ttname"><a href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">dlaf::auxiliary::norm</a></div><div class="ttdeci">dlaf::BaseType&lt; T &gt; norm(comm::CommunicatorGrid grid, comm::Index2D rank, lapack::Norm norm_type, blas::Uplo uplo, Matrix&lt; const T, device &gt; &amp;A)</div><div class="ttdef"><b>Definition:</b> norm.h:43</div></div>
+<div class="ttc" id="anorm_8h_html_a2d0adfb7be9cfe934f96e9dd1c38d839"><div class="ttname"><a href="norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839">dlaf::auxiliary::norm</a></div><div class="ttdeci">dlaf::BaseType&lt; T &gt; norm(comm::CommunicatorGrid grid, comm::Index2D rank, lapack::Norm norm_type, blas::Uplo uplo, Matrix&lt; const T, device &gt; &amp;A)</div><div class="ttdef"><b>Definition:</b> norm.h:44</div></div>
 <div class="ttc" id="astructdlaf_1_1auxiliary_1_1internal_1_1_norm_html"><div class="ttname"><a href="structdlaf_1_1auxiliary_1_1internal_1_1_norm.html">dlaf::auxiliary::internal::Norm</a></div><div class="ttdef"><b>Definition:</b> api.h:19</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
diff --git a/master/panel_8h_source.html b/master/panel_8h_source.html
index 746915844c..090adbd2d2 100644
--- a/master/panel_8h_source.html
+++ b/master/panel_8h_source.html
@@ -552,7 +552,7 @@
 <div class="ttc" id="aclassdlaf_1_1common_1_1internal_1_1basic__coords_html_a23701a66458fad55204f90b84674a8e2"><div class="ttname"><a href="classdlaf_1_1common_1_1internal_1_1basic__coords.html#a23701a66458fad55204f90b84674a8e2">dlaf::common::internal::basic_coords::get</a></div><div class="ttdeci">IndexT get() const noexcept</div><div class="ttdoc">Return a copy of the row or the col index as specified by rc.</div><div class="ttdef"><b>Definition:</b> index2d.h:86</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1internal_1_1basic__coords_html_a98f8b3b0cd7b4c1fa62b40b9de0041bb"><div class="ttname"><a href="classdlaf_1_1common_1_1internal_1_1basic__coords.html#a98f8b3b0cd7b4c1fa62b40b9de0041bb">dlaf::common::internal::basic_coords::transpose</a></div><div class="ttdeci">void transpose() noexcept</div><div class="ttdoc">Swaps row and column index/size.</div><div class="ttdef"><b>Definition:</b> index2d.h:106</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html">dlaf::matrix::Distribution</a></div><div class="ttdef"><b>Definition:</b> distribution.h:27</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Tile&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> tile.h:201</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile.html">dlaf::matrix::Tile</a></div><div class="ttdef"><b>Definition:</b> tile.h:329</div></div>
 <div class="ttc" id="acommunicator_8h_html"><div class="ttname"><a href="communicator_8h.html">communicator.h</a></div></div>
diff --git a/master/permutations_2general_2impl_8h_source.html b/master/permutations_2general_2impl_8h_source.html
index b9c31c3b12..a350e08801 100644
--- a/master/permutations_2general_2impl_8h_source.html
+++ b/master/permutations_2general_2impl_8h_source.html
@@ -655,8 +655,8 @@
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_aed7a91383a0146b02008c6d6bfed2850"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#aed7a91383a0146b02008c6d6bfed2850">dlaf::matrix::Distribution::globalElementFromGlobalTileAndTileElement</a></div><div class="ttdeci">SizeType globalElementFromGlobalTileAndTileElement(SizeType global_tile, SizeType tile_element) const noexcept</div><div class="ttdef"><b>Definition:</b> distribution.h:247</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_afcd76386ddd1319978242aaf54412825"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#afcd76386ddd1319978242aaf54412825">dlaf::matrix::Distribution::nextLocalTileFromGlobalTile</a></div><div class="ttdeci">SizeType nextLocalTileFromGlobalTile(SizeType global_tile) const noexcept</div><div class="ttdef"><b>Definition:</b> distribution.h:351</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_layout_info_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_layout_info.html">dlaf::matrix::LayoutInfo</a></div><div class="ttdef"><b>Definition:</b> layout_info.h:26</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> matrix.h:151</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> matrix.h:171</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="acommunicator_8h_html"><div class="ttname"><a href="communicator_8h.html">communicator.h</a></div></div>
 <div class="ttc" id="acopy__tile_8h_html"><div class="ttname"><a href="copy__tile_8h.html">copy_tile.h</a></div></div>
 <div class="ttc" id="aindex2d_8h_html"><div class="ttname"><a href="index2d_8h.html">index2d.h</a></div></div>
diff --git a/master/permutations_2general_8h_source.html b/master/permutations_2general_8h_source.html
index fd82240d72..affdb84dff 100644
--- a/master/permutations_2general_8h_source.html
+++ b/master/permutations_2general_8h_source.html
@@ -109,51 +109,59 @@
 <div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(matrix::equal_size(mat_in, mat_out), mat_in);</div>
 <div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  DLAF_ASSERT(matrix::equal_blocksize(mat_in, mat_out), mat_in);</div>
 <div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160; </div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  DLAF_ASSERT(perms.size().rows() == mat_in.size().rows(), perms, mat_in);</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  DLAF_ASSERT(perms.size().cols() == 1, perms);</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  DLAF_ASSERT(perms.blockSize().rows() == mat_in.blockSize().rows(), mat_in, perms);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(perms), perms);</div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_in), mat_in);</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_out), mat_out);</div>
 <div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160; </div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  DLAF_ASSERT(i_begin &gt;= 0 &amp;&amp; i_begin &lt;= i_end, i_begin, i_end);</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  DLAF_ASSERT(i_end &lt;= perms.nrTiles().rows(), i_end, perms);</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160; </div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <a class="code" href="structdlaf_1_1permutations_1_1internal_1_1_permutations.html">internal::Permutations&lt;B, D, T, coord&gt;::call</a>(i_begin, i_end, perms, mat_in, mat_out);</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;}</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160; </div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T, Coord coord&gt;</div>
-<div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="permutations_2general_8h.html#a9dbcd748dd76ddf1b2dfef0d08bba03c">   86</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="permutations_2general_8h.html#af301d1e323dbafdc8503756ccd42edcd">permute</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a>&amp; sub_task_chain,</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;             SizeType i_begin, SizeType i_end, Matrix&lt;const SizeType, D&gt;&amp; perms,</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;             Matrix&lt;const T, D&gt;&amp; mat_in, Matrix&lt;T, D&gt;&amp; mat_out) {</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  DLAF_ASSERT(matrix::local_matrix(perms), perms);</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_in, grid), mat_in, grid);</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_out, grid), mat_out, grid);</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160; </div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <span class="comment">// Note:</span></div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="comment">// These are not implementation constraints, but more logic constraints. Indeed, these ensure that</span></div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="comment">// the range [i_begin, i_end] is square in terms of elements (it would not make sense to have it square</span></div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="comment">// in terms of number of tiles). Moreover, by requiring mat_in and mat_out matrices to have the same</span></div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="comment">// shape, it is ensured that range [i_begin, i_end] is actually the same on both sides.</span></div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  DLAF_ASSERT(square_size(mat_in), mat_in);</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_in), mat_in);</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  DLAF_ASSERT(matrix::equal_size(mat_in, mat_out), mat_in);</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  DLAF_ASSERT(matrix::equal_blocksize(mat_in, mat_out), mat_in);</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160; </div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  DLAF_ASSERT(perms.size().rows() == mat_in.size().rows(), perms, mat_in);</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  DLAF_ASSERT(perms.size().cols() == 1, perms);</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(perms.blockSize().rows() == mat_in.blockSize().rows(), mat_in, perms);</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  DLAF_ASSERT(perms.size().rows() == mat_in.size().rows(), perms, mat_in);</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  DLAF_ASSERT(perms.size().cols() == 1, perms);</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  DLAF_ASSERT(perms.blockSize().rows() == mat_in.blockSize().rows(), mat_in, perms);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160; </div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  DLAF_ASSERT(i_begin &gt;= 0 &amp;&amp; i_begin &lt;= i_end, i_begin, i_end);</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  DLAF_ASSERT(i_end &lt;= perms.nrTiles().rows(), i_end, perms);</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <a class="code" href="structdlaf_1_1permutations_1_1internal_1_1_permutations.html">internal::Permutations&lt;B, D, T, coord&gt;::call</a>(i_begin, i_end, perms, mat_in, mat_out);</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;}</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T, Coord coord&gt;</div>
+<div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="permutations_2general_8h.html#a9dbcd748dd76ddf1b2dfef0d08bba03c">   90</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="permutations_2general_8h.html#af301d1e323dbafdc8503756ccd42edcd">permute</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a>&amp; sub_task_chain,</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;             SizeType i_begin, SizeType i_end, Matrix&lt;const SizeType, D&gt;&amp; perms,</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;             Matrix&lt;const T, D&gt;&amp; mat_in, Matrix&lt;T, D&gt;&amp; mat_out) {</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  DLAF_ASSERT(matrix::local_matrix(perms), perms);</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_in, grid), mat_in, grid);</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_out, grid), mat_out, grid);</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160; </div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="comment">// Note:</span></div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  <span class="comment">// These are not implementation constraints, but more logic constraints. Indeed, these ensure that</span></div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <span class="comment">// the range [i_begin, i_end] is square in terms of elements (it would not make sense to have it square</span></div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  <span class="comment">// in terms of number of tiles). Moreover, by requiring mat_in and mat_out matrices to have the same</span></div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <span class="comment">// shape, it is ensured that range [i_begin, i_end] is actually the same on both sides.</span></div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  DLAF_ASSERT(square_size(mat_in), mat_in);</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_in), mat_in);</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  DLAF_ASSERT(matrix::equal_size(mat_in, mat_out), mat_in);</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(matrix::equal_blocksize(mat_in, mat_out), mat_in);</div>
 <div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160; </div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  DLAF_ASSERT(i_begin &gt;= 0 &amp;&amp; i_begin &lt;= i_end, i_begin, i_end);</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(i_end &lt;= perms.nrTiles().rows(), i_end, perms);</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160; </div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  <a class="code" href="structdlaf_1_1permutations_1_1internal_1_1_permutations.html">internal::Permutations&lt;B, D, T, coord&gt;::call</a>(sub_task_chain, i_begin, i_end, perms, mat_in, mat_out);</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;}</div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160; </div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T, Coord coord&gt;</div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="keywordtype">void</span> permute(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, SizeType i_begin, SizeType i_end,</div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;             Matrix&lt;const SizeType, D&gt;&amp; perms, Matrix&lt;const T, D&gt;&amp; mat_in, Matrix&lt;T, D&gt;&amp; mat_out) {</div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a> sub_task_chain(grid.subCommunicator(<a class="code" href="index2d_8h.html#a9b3be798b052f32def2a280a80e2295c">orthogonal</a>(coord)).clone());</div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  permute&lt;B, D, T, coord&gt;(grid, sub_task_chain, i_begin, i_end, perms, mat_in, mat_out);</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;}</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;}</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(perms), perms);</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_in), mat_in);</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_out), mat_out);</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  DLAF_ASSERT(perms.size().rows() == mat_in.size().rows(), perms, mat_in);</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  DLAF_ASSERT(perms.size().cols() == 1, perms);</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  DLAF_ASSERT(perms.blockSize().rows() == mat_in.blockSize().rows(), mat_in, perms);</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160; </div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  DLAF_ASSERT(i_begin &gt;= 0 &amp;&amp; i_begin &lt;= i_end, i_begin, i_end);</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  DLAF_ASSERT(i_end &lt;= perms.nrTiles().rows(), i_end, perms);</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160; </div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <a class="code" href="structdlaf_1_1permutations_1_1internal_1_1_permutations.html">internal::Permutations&lt;B, D, T, coord&gt;::call</a>(sub_task_chain, i_begin, i_end, perms, mat_in, mat_out);</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;}</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160; </div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T, Coord coord&gt;</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="keywordtype">void</span> permute(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, SizeType i_begin, SizeType i_end,</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;             Matrix&lt;const SizeType, D&gt;&amp; perms, Matrix&lt;const T, D&gt;&amp; mat_in, Matrix&lt;T, D&gt;&amp; mat_out) {</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <a class="code" href="classdlaf_1_1common_1_1_pipeline.html">common::Pipeline&lt;comm::Communicator&gt;</a> sub_task_chain(grid.subCommunicator(<a class="code" href="index2d_8h.html#a9b3be798b052f32def2a280a80e2295c">orthogonal</a>(coord)).clone());</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  permute&lt;B, D, T, coord&gt;(grid, sub_task_chain, i_begin, i_end, perms, mat_in, mat_out);</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_pipeline_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_pipeline.html">dlaf::common::Pipeline</a></div><div class="ttdef"><b>Definition:</b> pipeline.h:31</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
diff --git a/master/print__csv_8h_source.html b/master/print__csv_8h_source.html
index 0067cc52c5..2569826fc1 100644
--- a/master/print__csv_8h_source.html
+++ b/master/print__csv_8h_source.html
@@ -140,7 +140,7 @@
 <div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;}</div>
 <div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_index2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_index2_d.html">dlaf::common::Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;</a></div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile.html">dlaf::matrix::Tile</a></div><div class="ttdef"><b>Definition:</b> tile.h:329</div></div>
 <div class="ttc" id="aindex2d_8h_html"><div class="ttname"><a href="index2d_8h.html">index2d.h</a></div></div>
 <div class="ttc" id="amatrix_2tile_8h_html"><div class="ttname"><a href="matrix_2tile_8h.html">tile.h</a></div></div>
@@ -150,7 +150,7 @@
 <div class="ttc" id="astructdlaf_1_1format_1_1csv_html"><div class="ttname"><a href="structdlaf_1_1format_1_1csv.html">dlaf::format::csv</a></div><div class="ttdef"><b>Definition:</b> print_csv.h:24</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
-<div class="ttc" id="autil__matrix_8h_html_a801d4c1863ecd48a5758741b63781921"><div class="ttname"><a href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">dlaf::matrix::local_matrix</a></div><div class="ttdeci">bool local_matrix(const Matrix&lt; const T, D &gt; &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix is local to a process.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:66</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a801d4c1863ecd48a5758741b63781921"><div class="ttname"><a href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">dlaf::matrix::local_matrix</a></div><div class="ttdeci">bool local_matrix(const Matrix&lt; const T, D &gt; &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix is local to a process.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:72</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
diff --git a/master/reduction__to__band_8h.html b/master/reduction__to__band_8h.html
index 7ddea9d8c7..11ac78bed0 100644
--- a/master/reduction__to__band_8h.html
+++ b/master/reduction__to__band_8h.html
@@ -153,6 +153,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a143b74447a1f72d4d5368b9b
 <dd>
 mat_a has a square block size </dd>
 <dd>
+mat_a has equal tile and block sizes </dd>
+<dd>
 mat_a is distributed according to <code>grid</code> </dd>
 <dd>
 mat_a.blockSize().rows() % band_size == 0 </dd></dl>
@@ -199,6 +201,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a00574f61da45042c5276b043
 <dd>
 mat_a has a square block size </dd>
 <dd>
+mat_a has equal tile and block sizes </dd>
+<dd>
 mat_a is a local matrix </dd>
 <dd>
 mat_a.blockSize().rows() % band_size == 0 </dd></dl>
diff --git a/master/reduction__to__band_8h_source.html b/master/reduction__to__band_8h_source.html
index 35ceff6a22..5755dc74cb 100644
--- a/master/reduction__to__band_8h_source.html
+++ b/master/reduction__to__band_8h_source.html
@@ -91,38 +91,40 @@
 <div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="keyword">namespace </span>dlaf::eigensolver {</div>
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160; </div>
 <div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment">//</span></div>
-<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment"></span><span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">   38</a></span>&#160;Matrix&lt;T, Device::CPU&gt; <a class="code" href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">reductionToBand</a>(Matrix&lt;T, D&gt;&amp; mat_a, <span class="keyword">const</span> SizeType band_size) {</div>
-<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160; </div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment"></span><span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">   39</a></span>&#160;Matrix&lt;T, Device::CPU&gt; <a class="code" href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">reductionToBand</a>(Matrix&lt;T, D&gt;&amp; mat_a, <span class="keyword">const</span> SizeType band_size) {</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
 <div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160; </div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(mat_a.blockSize().rows() % band_size == 0, mat_a.blockSize().rows(), band_size);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160; </div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">internal::ReductionToBand&lt;B, D, T&gt;::call</a>(mat_a, band_size);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;}</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160; </div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160; </div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160; </div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="reduction__to__band_8h.html#a143b74447a1f72d4d5368b9bad10b331">  103</a></span>&#160;Matrix&lt;T, Device::CPU&gt; <a class="code" href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">reductionToBand</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, Matrix&lt;T, D&gt;&amp; mat_a,</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;                                       <span class="keyword">const</span> SizeType band_size) {</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160; </div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
-<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  DLAF_ASSERT(mat_a.blockSize().rows() % band_size == 0, mat_a.blockSize().rows(), band_size);</div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160; </div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">internal::ReductionToBand&lt;B, D, T&gt;::call</a>(grid, mat_a, band_size);</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;}</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;}</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160; </div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(mat_a.blockSize().rows() % band_size == 0, mat_a.blockSize().rows(), band_size);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160; </div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">internal::ReductionToBand&lt;B, D, T&gt;::call</a>(mat_a, band_size);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;}</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160; </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160; </div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160; </div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="reduction__to__band_8h.html#a143b74447a1f72d4d5368b9bad10b331">  106</a></span>&#160;Matrix&lt;T, Device::CPU&gt; <a class="code" href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">reductionToBand</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, Matrix&lt;T, D&gt;&amp; mat_a,</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                                       <span class="keyword">const</span> SizeType band_size) {</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160; </div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  DLAF_ASSERT(band_size &gt;= 2, band_size);</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  DLAF_ASSERT(mat_a.blockSize().rows() % band_size == 0, mat_a.blockSize().rows(), band_size);</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160; </div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">internal::ReductionToBand&lt;B, D, T&gt;::call</a>(grid, mat_a, band_size);</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;}</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="areduction__to__band_8h_html_a00574f61da45042c5276b043d7c33617"><div class="ttname"><a href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">dlaf::eigensolver::reductionToBand</a></div><div class="ttdeci">Matrix&lt; T, Device::CPU &gt; reductionToBand(Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)</div><div class="ttdef"><b>Definition:</b> reduction_to_band.h:38</div></div>
+<div class="ttc" id="areduction__to__band_8h_html_a00574f61da45042c5276b043d7c33617"><div class="ttname"><a href="reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617">dlaf::eigensolver::reductionToBand</a></div><div class="ttdeci">Matrix&lt; T, Device::CPU &gt; reductionToBand(Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)</div><div class="ttdef"><b>Definition:</b> reduction_to_band.h:39</div></div>
 <div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html">dlaf::eigensolver::internal::ReductionToBand</a></div><div class="ttdef"><b>Definition:</b> api.h:21</div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
 </div><!-- fragment --></div><!-- contents -->
diff --git a/master/retiled__matrix_8h.html b/master/retiled__matrix_8h.html
deleted file mode 100644
index 5388d15e3c..0000000000
--- a/master/retiled__matrix_8h.html
+++ /dev/null
@@ -1,105 +0,0 @@
-<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
-<html xmlns="http://www.w3.org/1999/xhtml">
-<head>
-<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
-<meta http-equiv="X-UA-Compatible" content="IE=9"/>
-<meta name="generator" content="Doxygen 1.9.1"/>
-<meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>DLAF: /home/runner/work/DLA-Future/DLA-Future/include/dlaf/matrix/retiled_matrix.h File Reference</title>
-<link href="tabs.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="jquery.js"></script>
-<script type="text/javascript" src="dynsections.js"></script>
-<link href="search/search.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="search/searchdata.js"></script>
-<script type="text/javascript" src="search/search.js"></script>
-<link href="doxygen.css" rel="stylesheet" type="text/css" />
-</head>
-<body>
-<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
-<div id="titlearea">
-<table cellspacing="0" cellpadding="0">
- <tbody>
- <tr style="height: 56px;">
-  <td id="projectalign" style="padding-left: 0.5em;">
-   <div id="projectname">DLAF
-   </div>
-  </td>
- </tr>
- </tbody>
-</table>
-</div>
-<!-- end header part -->
-<!-- Generated by Doxygen 1.9.1 -->
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-var searchBox = new SearchBox("searchBox", "search",false,'Search','.html');
-/* @license-end */
-</script>
-<script type="text/javascript" src="menudata.js"></script>
-<script type="text/javascript" src="menu.js"></script>
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-$(function() {
-  initMenu('',true,false,'search.php','Search');
-  $(document).ready(function() { init_search(); });
-});
-/* @license-end */</script>
-<div id="main-nav"></div>
-<!-- window showing the filter options -->
-<div id="MSearchSelectWindow"
-     onmouseover="return searchBox.OnSearchSelectShow()"
-     onmouseout="return searchBox.OnSearchSelectHide()"
-     onkeydown="return searchBox.OnSearchSelectKey(event)">
-</div>
-
-<!-- iframe showing the search results (closed by default) -->
-<div id="MSearchResultsWindow">
-<iframe src="javascript:void(0)" frameborder="0" 
-        name="MSearchResults" id="MSearchResults">
-</iframe>
-</div>
-
-<div id="nav-path" class="navpath">
-  <ul>
-<li class="navelem"><a class="el" href="dir_d44c64559bbebec7f509842c48db8b23.html">include</a></li><li class="navelem"><a class="el" href="dir_415b543d06dcd728a2539f6ad76147ea.html">dlaf</a></li><li class="navelem"><a class="el" href="dir_21834082df7a318c018c9cc963be86ec.html">matrix</a></li>  </ul>
-</div>
-</div><!-- top -->
-<div class="header">
-  <div class="summary">
-<a href="#nested-classes">Classes</a> &#124;
-<a href="#define-members">Macros</a>  </div>
-  <div class="headertitle">
-<div class="title">retiled_matrix.h File Reference</div>  </div>
-</div><!--header-->
-<div class="contents">
-<div class="textblock"><code>#include &lt;cstddef&gt;</code><br />
-<code>#include &lt;vector&gt;</code><br />
-<code>#include &lt;<a class="el" href="range2d_8h_source.html">dlaf/common/range2d.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="vector_8h_source.html">dlaf/common/vector.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="distribution_8h_source.html">dlaf/matrix/distribution.h</a>&gt;</code><br />
-<code>#include &lt;dlaf/matrix/internal/tile_pipeline.h&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix_8h_source.html">dlaf/matrix/matrix.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix__base_8h_source.html">dlaf/matrix/matrix_base.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix_2tile_8h_source.html">dlaf/matrix/tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="types_8h_source.html">dlaf/types.h</a>&gt;</code><br />
-</div>
-<p><a href="retiled__matrix_8h_source.html">Go to the source code of this file.</a></p>
-<table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
-Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix&lt; T, D &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="define-members"></a>
-Macros</h2></td></tr>
-<tr class="memitem:aac9cc91d5c0f684e0c3200dc54c1af91"><td class="memItemLeft" align="right" valign="top"><a id="aac9cc91d5c0f684e0c3200dc54c1af91"></a>
-#define&#160;</td><td class="memItemRight" valign="bottom"><b>DLAF_RETILED_MATRIX_ETI</b>(KWORD,  DATATYPE,  DEVICE)&#160;&#160;&#160;  KWORD template class RetiledMatrix&lt;DATATYPE, DEVICE&gt;;</td></tr>
-<tr class="separator:aac9cc91d5c0f684e0c3200dc54c1af91"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table>
-</div><!-- contents -->
-<!-- start footer part -->
-<hr class="footer"/><address class="footer"><small>
-Generated by&#160;<a href="https://www.doxygen.org/index.html"><img class="footer" src="doxygen.svg" width="104" height="31" alt="doxygen"/></a> 1.9.1
-</small></address>
-</body>
-</html>
diff --git a/master/retiled__matrix_8h_source.html b/master/retiled__matrix_8h_source.html
deleted file mode 100644
index 687d255d46..0000000000
--- a/master/retiled__matrix_8h_source.html
+++ /dev/null
@@ -1,260 +0,0 @@
-<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
-<html xmlns="http://www.w3.org/1999/xhtml">
-<head>
-<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
-<meta http-equiv="X-UA-Compatible" content="IE=9"/>
-<meta name="generator" content="Doxygen 1.9.1"/>
-<meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>DLAF: /home/runner/work/DLA-Future/DLA-Future/include/dlaf/matrix/retiled_matrix.h Source File</title>
-<link href="tabs.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="jquery.js"></script>
-<script type="text/javascript" src="dynsections.js"></script>
-<link href="search/search.css" rel="stylesheet" type="text/css"/>
-<script type="text/javascript" src="search/searchdata.js"></script>
-<script type="text/javascript" src="search/search.js"></script>
-<link href="doxygen.css" rel="stylesheet" type="text/css" />
-</head>
-<body>
-<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
-<div id="titlearea">
-<table cellspacing="0" cellpadding="0">
- <tbody>
- <tr style="height: 56px;">
-  <td id="projectalign" style="padding-left: 0.5em;">
-   <div id="projectname">DLAF
-   </div>
-  </td>
- </tr>
- </tbody>
-</table>
-</div>
-<!-- end header part -->
-<!-- Generated by Doxygen 1.9.1 -->
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-var searchBox = new SearchBox("searchBox", "search",false,'Search','.html');
-/* @license-end */
-</script>
-<script type="text/javascript" src="menudata.js"></script>
-<script type="text/javascript" src="menu.js"></script>
-<script type="text/javascript">
-/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
-$(function() {
-  initMenu('',true,false,'search.php','Search');
-  $(document).ready(function() { init_search(); });
-});
-/* @license-end */</script>
-<div id="main-nav"></div>
-<!-- window showing the filter options -->
-<div id="MSearchSelectWindow"
-     onmouseover="return searchBox.OnSearchSelectShow()"
-     onmouseout="return searchBox.OnSearchSelectHide()"
-     onkeydown="return searchBox.OnSearchSelectKey(event)">
-</div>
-
-<!-- iframe showing the search results (closed by default) -->
-<div id="MSearchResultsWindow">
-<iframe src="javascript:void(0)" frameborder="0" 
-        name="MSearchResults" id="MSearchResults">
-</iframe>
-</div>
-
-<div id="nav-path" class="navpath">
-  <ul>
-<li class="navelem"><a class="el" href="dir_d44c64559bbebec7f509842c48db8b23.html">include</a></li><li class="navelem"><a class="el" href="dir_415b543d06dcd728a2539f6ad76147ea.html">dlaf</a></li><li class="navelem"><a class="el" href="dir_21834082df7a318c018c9cc963be86ec.html">matrix</a></li>  </ul>
-</div>
-</div><!-- top -->
-<div class="header">
-  <div class="headertitle">
-<div class="title">retiled_matrix.h</div>  </div>
-</div><!--header-->
-<div class="contents">
-<a href="retiled__matrix_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">//</span></div>
-<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">// Distributed Linear Algebra with Future (DLAF)</span></div>
-<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment">//</span></div>
-<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment">// Copyright (c) 2018-2023, ETH Zurich</span></div>
-<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment">// All rights reserved.</span></div>
-<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment">//</span></div>
-<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment">// Please, refer to the LICENSE file in the root directory.</span></div>
-<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment">// SPDX-License-Identifier: BSD-3-Clause</span></div>
-<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment">//</span></div>
-<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160; </div>
-<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="preprocessor">#pragma once</span></div>
-<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160; </div>
-<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160; </div>
-<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="preprocessor">#include &lt;cstddef&gt;</span></div>
-<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="preprocessor">#include &lt;vector&gt;</span></div>
-<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160; </div>
-<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="range2d_8h.html">dlaf/common/range2d.h</a>&gt;</span></div>
-<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">dlaf/common/vector.h</a>&gt;</span></div>
-<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="distribution_8h.html">dlaf/matrix/distribution.h</a>&gt;</span></div>
-<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="preprocessor">#include &lt;dlaf/matrix/internal/tile_pipeline.h&gt;</span></div>
-<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_8h.html">dlaf/matrix/matrix.h</a>&gt;</span></div>
-<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__base_8h.html">dlaf/matrix/matrix_base.h</a>&gt;</span></div>
-<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix_2tile_8h.html">dlaf/matrix/tile.h</a>&gt;</span></div>
-<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="types_8h.html">dlaf/types.h</a>&gt;</span></div>
-<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160; </div>
-<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="keyword">namespace </span>dlaf::matrix {</div>
-<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160; </div>
-<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00036"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">   36</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a> : <span class="keyword">public</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">internal::MatrixBase</a> {</div>
-<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">public</span>:</div>
-<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;  <span class="keyword">static</span> constexpr Device device = D;</div>
-<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160; </div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  <span class="keyword">using</span> ElementType = T;</div>
-<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">TileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">ConstTileType</a> = <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;const ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">TileDataType</a> = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">internal::TileData&lt;const ElementType, D&gt;</a>;</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160; </div>
-<div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">   46</a></span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">RetiledMatrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>&amp; mat, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a>&amp; tiles_per_block)</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;      : MatrixBase(mat.<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>(), tiles_per_block) {</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;    <span class="keyword">using</span> <a class="code" href="structdlaf_1_1common_1_1internal_1_1vector.html">common::internal::vector</a>;</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keyword">namespace </span>ex = pika::execution::experimental;</div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160; </div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> n = <a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().localNrTiles().linear_size());</div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    tile_managers_.reserve(n);</div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keywordflow">for</span> (std::size_t i = 0; i &lt; n; ++i) {</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;      tile_managers_.emplace_back(<a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;T, D&gt;</a>());</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    }</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160; </div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> tile_size = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().baseTileSize();</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    vector&lt;SubTileSpec&gt; specs;</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    vector&lt;LocalTileIndex&gt; indices;</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    specs.reserve(tiles_per_block.linear_size());</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    indices.reserve(tiles_per_block.linear_size());</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160; </div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; orig_tile_index : common::iterate_range2d(mat.distribution().localNrTiles())) {</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;      <span class="keyword">const</span> <span class="keyword">auto</span> original_tile_size = mat.tileSize(mat.distribution().globalTileIndex(orig_tile_index));</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160; </div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;      <span class="keywordflow">for</span> (SizeType j = 0; j &lt; original_tile_size.cols(); j += tile_size.cols())</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;        <span class="keywordflow">for</span> (SizeType i = 0; i &lt; original_tile_size.rows(); i += tile_size.rows()) {</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          indices.emplace_back(</div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;              <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>{orig_tile_index.row() * tiles_per_block.rows() + i / tile_size.rows(),</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                             orig_tile_index.col() * tiles_per_block.cols() + j / tile_size.cols()});</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          specs.emplace_back(<a class="code" href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">SubTileSpec</a>{{i, j},</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                                         <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5">tileSize</a>(<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().globalTileIndex(indices.back()))});</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;        }</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160; </div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="keyword">auto</span> sub_tiles = <a class="code" href="matrix_2tile_8h.html#a4c15e2e57d6336347e6e19d945bd650e">splitTileDisjoint</a>(mat.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(orig_tile_index), specs);</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160; </div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      DLAF_ASSERT_HEAVY(specs.size() == indices.size(), specs.size(), indices.size());</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="keywordflow">for</span> (SizeType j = 0; j &lt; specs.size(); ++j) {</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;        <span class="keyword">const</span> <span class="keyword">auto</span> i = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(indices[j]);</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160; </div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;        <span class="comment">// Move subtile to be managed by the tile manager of RetiledMatrix. We</span></div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;        <span class="comment">// use readwrite_with_wrapper to get access to the original tile managed</span></div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;        <span class="comment">// by the underlying async_rw_mutex.</span></div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;        <span class="keyword">auto</span> s =</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;            ex::when_all(tile_managers_[i].readwrite_with_wrapper(), std::move(sub_tiles[<a class="code" href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">to_sizet</a>(j)])) |</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;            ex::then([](internal::TileAsyncRwMutexReadWriteWrapper&lt;T, D&gt; empty_tile_wrapper,</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                        <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;T, D&gt;</a> sub_tile) { empty_tile_wrapper.get() = std::move(sub_tile); });</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;        ex::start_detached(std::move(s));</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      }</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160; </div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      specs.clear();</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      indices.clear();</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    }</div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  }</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160; </div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">RetiledMatrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">RetiledMatrix</a>(<a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160; </div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a>&amp; operator=(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a>&amp; rhs) = <span class="keyword">delete</span>;</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a>&amp; operator=(<a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">RetiledMatrix</a>&amp;&amp; rhs) = <span class="keywordflow">default</span>;</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160; </div>
-<div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">  105</a></span>&#160;  ReadOnlyTileSender&lt;T, D&gt; <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">read</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> i = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(index);</div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keywordflow">return</span> tile_managers_[i].read();</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  }</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160; </div>
-<div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579">  114</a></span>&#160;  ReadOnlyTileSender&lt;T, D&gt; <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579">read</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">read</a>(<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().localTileIndex(index));</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  }</div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160; </div>
-<div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">  122</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">waitLocalTiles</a>() noexcept {</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keyword">auto</span> readwrite_f = [<span class="keyword">this</span>](<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) {</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      <span class="keywordflow">return</span> this-&gt;tile_managers_[<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(index)].readwrite();</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    };</div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160; </div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> range_local = common::iterate_range2d(<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().localNrTiles());</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    pika::this_thread::experimental::sync_wait(pika::execution::experimental::when_all_vector(</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        internal::selectGeneric(readwrite_f, range_local)));</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  }</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160; </div>
-<div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">  135</a></span>&#160;  ReadWriteTileSender&lt;T, D&gt; <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">readwrite</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> i = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(index);</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <span class="keywordflow">return</span> tile_managers_[i].readwrite();</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160; </div>
-<div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167">  144</a></span>&#160;  ReadWriteTileSender&lt;T, D&gt; <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167">readwrite</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">readwrite</a>(<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().localTileIndex(index));</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  }</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160; </div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="keywordtype">void</span> done(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="keyword">const</span> <span class="keyword">auto</span> i = <a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">tileLinearIndex</a>(index);</div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    tile_managers_[i].reset();</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  }</div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160; </div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keywordtype">void</span> done(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a>&amp; index) noexcept {</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    done(<a class="code" href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">distribution</a>().localTileIndex(index));</div>
-<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  }</div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160; </div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="keyword">protected</span>:</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  std::vector&lt;internal::TilePipeline&lt;T, D&gt;&gt; tile_managers_;</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;};</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160; </div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="keyword">class </span>RetiledMatrix&lt;const T, D&gt;;</div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160; </div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;<span class="comment">// ETI</span></div>
-<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160; </div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="preprocessor">#define DLAF_RETILED_MATRIX_ETI(KWORD, DATATYPE, DEVICE) \</span></div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="preprocessor">  KWORD template class RetiledMatrix&lt;DATATYPE, DEVICE&gt;;</span></div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160; </div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">float</span>, Device::CPU)</div>
-<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">double</span>, Device::CPU)</div>
-<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;float&gt;, Device::CPU)</div>
-<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;double&gt;, Device::CPU)</div>
-<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160; </div>
-<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="preprocessor">#if defined(DLAF_WITH_GPU)</span></div>
-<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">float</span>, Device::GPU)</div>
-<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, <span class="keywordtype">double</span>, Device::GPU)</div>
-<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;float&gt;, Device::GPU)</div>
-<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;DLAF_RETILED_MATRIX_ETI(<span class="keyword">extern</span>, std::complex&lt;double&gt;, Device::GPU)</div>
-<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;<span class="preprocessor">#endif</span></div>
-<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;}</div>
-<div class="ttc" id="aclassdlaf_1_1common_1_1_index2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_index2_d.html">dlaf::common::Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;</a></div></div>
-<div class="ttc" id="aclassdlaf_1_1common_1_1_size2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_size2_d.html">dlaf::common::Size2D&lt; SizeType, matrix::LocalTile_TAG &gt;</a></div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:121</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html">dlaf::matrix::RetiledMatrix</a></div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:36</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html_a4e208b9159a478b3fa20167ec8e04318"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318">dlaf::matrix::RetiledMatrix::RetiledMatrix</a></div><div class="ttdeci">RetiledMatrix(Matrix&lt; T, D &gt; &amp;mat, const LocalTileSize &amp;tiles_per_block)</div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:46</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html_a814972188382d0ae0120b6acfddd92bb"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb">dlaf::matrix::RetiledMatrix::read</a></div><div class="ttdeci">ReadOnlyTileSender&lt; T, D &gt; read(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:105</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html_aa0e45d9a97f8d3ff418d2bd08211a5bf"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf">dlaf::matrix::RetiledMatrix::readwrite</a></div><div class="ttdeci">ReadWriteTileSender&lt; T, D &gt; readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:135</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html_ab731cfea1c5b07288bc3b34c59cb37d0"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0">dlaf::matrix::RetiledMatrix::waitLocalTiles</a></div><div class="ttdeci">void waitLocalTiles() noexcept</div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:122</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html_ac3ca2e52e6627f5890bcb25fcff60167"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167">dlaf::matrix::RetiledMatrix::readwrite</a></div><div class="ttdeci">ReadWriteTileSender&lt; T, D &gt; readwrite(const GlobalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:144</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_retiled_matrix_html_afacf9af5a45a341c284844d866227579"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579">dlaf::matrix::RetiledMatrix::read</a></div><div class="ttdeci">ReadOnlyTileSender&lt; T, D &gt; read(const GlobalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> retiled_matrix.h:114</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile.html">dlaf::matrix::Tile</a></div><div class="ttdef"><b>Definition:</b> tile.h:329</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_matrix_base_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html">dlaf::matrix::internal::MatrixBase</a></div><div class="ttdef"><b>Definition:</b> matrix_base.h:24</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_matrix_base_html_a28967ff509064a6e04cfc8b2d35af402"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402">dlaf::matrix::internal::MatrixBase::distribution</a></div><div class="ttdeci">const matrix::Distribution &amp; distribution() const noexcept</div><div class="ttdoc">Returns the distribution of the matrix.</div><div class="ttdef"><b>Definition:</b> matrix_base.h:90</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_matrix_base_html_a5cdaa0376724e6f624591a6a6bcf46d9"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9">dlaf::matrix::internal::MatrixBase::tileLinearIndex</a></div><div class="ttdeci">std::size_t tileLinearIndex(const LocalTileIndex &amp;index) const noexcept</div><div class="ttdef"><b>Definition:</b> matrix_base.h:111</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_matrix_base_html_a891c1da69cefcfdfb73b3915ccc2cce5"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5">dlaf::matrix::internal::MatrixBase::tileSize</a></div><div class="ttdeci">TileElementSize tileSize(const GlobalTileIndex &amp;index) const noexcept</div><div class="ttdoc">Returns the size of the Tile with global index index.</div><div class="ttdef"><b>Definition:</b> matrix_base.h:95</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1internal_1_1_tile_data_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1internal_1_1_tile_data.html">dlaf::matrix::internal::TileData</a></div><div class="ttdef"><b>Definition:</b> tile.h:35</div></div>
-<div class="ttc" id="adistribution_8h_html"><div class="ttname"><a href="distribution_8h.html">distribution.h</a></div></div>
-<div class="ttc" id="amatrix_2tile_8h_html"><div class="ttname"><a href="matrix_2tile_8h.html">tile.h</a></div></div>
-<div class="ttc" id="amatrix_2tile_8h_html_a4c15e2e57d6336347e6e19d945bd650e"><div class="ttname"><a href="matrix_2tile_8h.html#a4c15e2e57d6336347e6e19d945bd650e">dlaf::matrix::splitTileDisjoint</a></div><div class="ttdeci">std::vector&lt; ReadWriteTileSender&lt; T, D &gt; &gt; splitTileDisjoint(ReadWriteTileSender&lt; T, D &gt; &amp;&amp;tile, const std::vector&lt; SubTileSpec &gt; &amp;specs)</div><div class="ttdef"><b>Definition:</b> tile.h:570</div></div>
-<div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="amatrix__base_8h_html"><div class="ttname"><a href="matrix__base_8h.html">matrix_base.h</a></div></div>
-<div class="ttc" id="arange2d_8h_html"><div class="ttname"><a href="range2d_8h.html">range2d.h</a></div></div>
-<div class="ttc" id="astructdlaf_1_1common_1_1internal_1_1vector_html"><div class="ttname"><a href="structdlaf_1_1common_1_1internal_1_1vector.html">dlaf::common::internal::vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:27</div></div>
-<div class="ttc" id="astructdlaf_1_1matrix_1_1_sub_tile_spec_html"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_sub_tile_spec.html">dlaf::matrix::SubTileSpec</a></div><div class="ttdoc">Contains the information to create a subtile.</div><div class="ttdef"><b>Definition:</b> tile.h:109</div></div>
-<div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
-<div class="ttc" id="atypes_8h_html_a25d16ff6621f011d9a98be3d9ebf29f1"><div class="ttname"><a href="types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1">dlaf::to_sizet</a></div><div class="ttdeci">auto to_sizet(const T signed_value)</div><div class="ttdef"><b>Definition:</b> types.h:265</div></div>
-<div class="ttc" id="avector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div></div>
-</div><!-- fragment --></div><!-- contents -->
-<!-- start footer part -->
-<hr class="footer"/><address class="footer"><small>
-Generated by&#160;<a href="https://www.doxygen.org/index.html"><img class="footer" src="doxygen.svg" width="104" height="31" alt="doxygen"/></a> 1.9.1
-</small></address>
-</body>
-</html>
diff --git a/master/rot_8h_source.html b/master/rot_8h_source.html
index 930ce43641..f778e02f20 100644
--- a/master/rot_8h_source.html
+++ b/master/rot_8h_source.html
@@ -448,7 +448,7 @@
 <div class="ttc" id="adistribution_8h_html"><div class="ttname"><a href="distribution_8h.html">distribution.h</a></div></div>
 <div class="ttc" id="aindex_8h_html"><div class="ttname"><a href="index_8h.html">index.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
-<div class="ttc" id="amatrix_8h_html_a1abc47c06dc1c46c9bdc2425090a02ab"><div class="ttname"><a href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">dlaf::matrix::select</a></div><div class="ttdeci">auto select(MatrixLike &amp;matrix, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:392</div></div>
+<div class="ttc" id="amatrix_8h_html_a1abc47c06dc1c46c9bdc2425090a02ab"><div class="ttname"><a href="matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab">dlaf::matrix::select</a></div><div class="ttdeci">auto select(MatrixLike &amp;matrix, common::IterableRange2D&lt; SizeType, LocalTile_TAG &gt; range)</div><div class="ttdef"><b>Definition:</b> matrix.h:449</div></div>
 <div class="ttc" id="amemory__view_8h_html"><div class="ttname"><a href="memory__view_8h.html">memory_view.h</a></div></div>
 <div class="ttc" id="ap2p_8h_html"><div class="ttname"><a href="p2p_8h.html">p2p.h</a></div></div>
 <div class="ttc" id="apanel_8h_html"><div class="ttname"><a href="panel_8h.html">panel.h</a></div></div>
diff --git a/master/search/all_10.js b/master/search/all_10.js
index 91fbc31ca4..7fad8e0000 100644
--- a/master/search/all_10.js
+++ b/master/search/all_10.js
@@ -1,34 +1,34 @@
 var searchData=
 [
-  ['range2d_2eh_343',['range2d.h',['../range2d_8h.html',1,'']]],
-  ['rangeend_344',['rangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a3aa72e4de5ae6c2d87b0643e08311df8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rangeendlocal_345',['rangeEndLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a7aa91d49db2332c93e5b2b2e1aadbecf',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rangestart_346',['rangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a09572f6a6461327f0ed6d0e471174410',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rangestartlocal_347',['rangeStartLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acef133d14867a04758e8914135c5d5f8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rank_348',['rank',['../classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e',1,'dlaf::comm::CommunicatorGrid::rank()'],['../classdlaf_1_1comm_1_1_communicator.html#a52be17b02755dcbfbdcaa95ba5f9230c',1,'dlaf::comm::Communicator::rank()']]],
-  ['rankfullcommunicator_349',['rankFullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ad9a0a0a05723adbe0e57171c7c1e2e93',1,'dlaf::comm::CommunicatorGrid']]],
-  ['rankglobalelement_350',['rankGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a8eac06b3be1805d7261a75809529a910',1,'dlaf::matrix::Distribution']]],
-  ['rankglobaltile_351',['rankGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#a49ff769692620e7f94cf796a65ff6a9e',1,'dlaf::matrix::Distribution::rankGlobalTile()'],['../util__distribution_8h.html#ad89b3802ea0ed39625419b53e3f199d1',1,'dlaf::util::matrix::rankGlobalTile()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f',1,'dlaf::matrix::internal::MatrixBase::rankGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758',1,'dlaf::matrix::Distribution::rankGlobalTile()']]],
-  ['rankindex_352',['rankIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['rdma_2eh_353',['rdma.h',['../rdma_8h.html',1,'']]],
-  ['read_354',['read',['../classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579',1,'dlaf::matrix::RetiledMatrix::read(const GlobalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb',1,'dlaf::matrix::RetiledMatrix::read(const LocalTileIndex &amp;index) noexcept'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a4631ad4a6fa72e74cf95798c527a48d1',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::read()'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read(const GlobalTileIndex &amp;index)'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a99845f6d6b238d3a8d543d20d3adb04d',1,'dlaf::matrix::internal::TilePipeline::read()']]],
-  ['readwrite_355',['readwrite',['../classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811',1,'dlaf::matrix::Matrix::readwrite()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#ab0a26ee4322ab4b7a3d250a82d072f68',1,'dlaf::matrix::internal::TilePipeline::readwrite()'],['../classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38',1,'dlaf::matrix::Matrix::readwrite()'],['../structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a',1,'dlaf::matrix::Panel::readwrite()'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf',1,'dlaf::matrix::RetiledMatrix::readwrite(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167',1,'dlaf::matrix::RetiledMatrix::readwrite(const GlobalTileIndex &amp;index) noexcept']]],
-  ['readwrite_5fwith_5fwrapper_356',['readwrite_with_wrapper',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a17403152214a88994a75395f7bebfe3c',1,'dlaf::matrix::internal::TilePipeline']]],
-  ['receive_5ffrom_357',['receive_from',['../sync_2broadcast_8h.html#a86fb5d23e8299cbd380a4e7d724c1112',1,'dlaf::comm::sync::broadcast::receive_from()'],['../basic_8h.html#a13040096b22855cefca83ec02f0c64c0',1,'dlaf::comm::sync::receive_from(int sender_rank, Communicator &amp;communicator, DataOut &amp;&amp;data)']]],
-  ['reduce_358',['reduce',['../sync_2reduce_8h.html#a22dfe268f1dcd2f08e2678af288063be',1,'dlaf::comm::sync']]],
-  ['reduce_2eh_359',['reduce.h',['../kernels_2reduce_8h.html',1,'(Global Namespace)'],['../sync_2reduce_8h.html',1,'(Global Namespace)']]],
-  ['reduceinplace_360',['reduceInPlace',['../sync_2reduce_8h.html#a86b20000f6542c605c6b5f2bcc9e625b',1,'dlaf::comm::sync']]],
-  ['reducerecv_361',['reduceRecv',['../sync_2reduce_8h.html#a03e9b0551a974dfa12fc9885272a1bee',1,'dlaf::comm::sync']]],
-  ['reducerecvinplace_362',['reduceRecvInPlace',['../sync_2reduce_8h.html#a1ce87e8bcfccf05e7edd9d23e1f778f3',1,'dlaf::comm::sync']]],
-  ['reducesend_363',['reduceSend',['../sync_2reduce_8h.html#a27df5989f95087d0259a3e381b1539b3',1,'dlaf::comm::sync']]],
-  ['reduction_5fto_5fband_2eh_364',['reduction_to_band.h',['../reduction__to__band_8h.html',1,'']]],
-  ['reductiontoband_365',['ReductionToBand',['../structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html',1,'dlaf::eigensolver::internal']]],
-  ['reductiontoband_366',['reductionToBand',['../reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617',1,'dlaf::eigensolver::reductionToBand(Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)'],['../reduction__to__band_8h.html#a143b74447a1f72d4d5368b9bad10b331',1,'dlaf::eigensolver::reductionToBand(comm::CommunicatorGrid grid, Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)']]],
-  ['reset_367',['reset',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acb87326419c25da556f027565b96c086',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::reset()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a83ffbae7e4944baa1bc4bfbe5dd1100d',1,'dlaf::matrix::internal::TilePipeline::reset()'],['../classdlaf_1_1common_1_1_pipeline.html#a4a9e1a35ffad351b5b4e01b88ef8a447',1,'dlaf::common::Pipeline::reset()']]],
-  ['retiled_5fmatrix_2eh_368',['retiled_matrix.h',['../retiled__matrix_8h.html',1,'']]],
-  ['retiledmatrix_369',['RetiledMatrix',['../classdlaf_1_1matrix_1_1_retiled_matrix.html',1,'dlaf::matrix::RetiledMatrix&lt; T, D &gt;'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318',1,'dlaf::matrix::RetiledMatrix::RetiledMatrix()']]],
-  ['round_5frobin_2eh_370',['round_robin.h',['../round__robin_8h.html',1,'']]],
-  ['roundrobin_371',['RoundRobin',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]],
-  ['roundrobin_3c_20dlaf_3a_3amatrix_3a_3apanel_3c_20coord_3a_3acol_2c_20t_2c_20device_3a_3acpu_20_3e_20_3e_372',['RoundRobin&lt; dlaf::matrix::Panel&lt; Coord::Col, T, Device::CPU &gt; &gt;',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]],
-  ['rowcommunicator_373',['rowCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391',1,'dlaf::comm::CommunicatorGrid']]]
+  ['range2d_2eh_344',['range2d.h',['../range2d_8h.html',1,'']]],
+  ['rangeend_345',['rangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a3aa72e4de5ae6c2d87b0643e08311df8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rangeendlocal_346',['rangeEndLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a7aa91d49db2332c93e5b2b2e1aadbecf',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rangestart_347',['rangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a09572f6a6461327f0ed6d0e471174410',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rangestartlocal_348',['rangeStartLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acef133d14867a04758e8914135c5d5f8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rank_349',['rank',['../classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e',1,'dlaf::comm::CommunicatorGrid::rank()'],['../classdlaf_1_1comm_1_1_communicator.html#a52be17b02755dcbfbdcaa95ba5f9230c',1,'dlaf::comm::Communicator::rank()']]],
+  ['rankfullcommunicator_350',['rankFullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ad9a0a0a05723adbe0e57171c7c1e2e93',1,'dlaf::comm::CommunicatorGrid']]],
+  ['rankglobalelement_351',['rankGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a8eac06b3be1805d7261a75809529a910',1,'dlaf::matrix::Distribution']]],
+  ['rankglobaltile_352',['rankGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#a49ff769692620e7f94cf796a65ff6a9e',1,'dlaf::matrix::Distribution::rankGlobalTile()'],['../util__distribution_8h.html#ad89b3802ea0ed39625419b53e3f199d1',1,'dlaf::util::matrix::rankGlobalTile()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f',1,'dlaf::matrix::internal::MatrixBase::rankGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758',1,'dlaf::matrix::Distribution::rankGlobalTile()']]],
+  ['rankindex_353',['rankIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['rdma_2eh_354',['rdma.h',['../rdma_8h.html',1,'']]],
+  ['read_355',['read',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a4631ad4a6fa72e74cf95798c527a48d1',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::read()'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a99845f6d6b238d3a8d543d20d3adb04d',1,'dlaf::matrix::internal::TilePipeline::read()'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read()']]],
+  ['readwrite_356',['readwrite',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#ab0a26ee4322ab4b7a3d250a82d072f68',1,'dlaf::matrix::internal::TilePipeline::readwrite()'],['../structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a',1,'dlaf::matrix::Panel::readwrite()'],['../classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38',1,'dlaf::matrix::Matrix::readwrite(const GlobalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811',1,'dlaf::matrix::Matrix::readwrite(const LocalTileIndex &amp;index) noexcept']]],
+  ['readwrite_5fwith_5fwrapper_357',['readwrite_with_wrapper',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a17403152214a88994a75395f7bebfe3c',1,'dlaf::matrix::internal::TilePipeline']]],
+  ['receive_5ffrom_358',['receive_from',['../sync_2broadcast_8h.html#a86fb5d23e8299cbd380a4e7d724c1112',1,'dlaf::comm::sync::broadcast::receive_from()'],['../basic_8h.html#a13040096b22855cefca83ec02f0c64c0',1,'dlaf::comm::sync::receive_from(int sender_rank, Communicator &amp;communicator, DataOut &amp;&amp;data)']]],
+  ['reduce_359',['reduce',['../sync_2reduce_8h.html#a22dfe268f1dcd2f08e2678af288063be',1,'dlaf::comm::sync']]],
+  ['reduce_2eh_360',['reduce.h',['../kernels_2reduce_8h.html',1,'(Global Namespace)'],['../sync_2reduce_8h.html',1,'(Global Namespace)']]],
+  ['reduceinplace_361',['reduceInPlace',['../sync_2reduce_8h.html#a86b20000f6542c605c6b5f2bcc9e625b',1,'dlaf::comm::sync']]],
+  ['reducerecv_362',['reduceRecv',['../sync_2reduce_8h.html#a03e9b0551a974dfa12fc9885272a1bee',1,'dlaf::comm::sync']]],
+  ['reducerecvinplace_363',['reduceRecvInPlace',['../sync_2reduce_8h.html#a1ce87e8bcfccf05e7edd9d23e1f778f3',1,'dlaf::comm::sync']]],
+  ['reducesend_364',['reduceSend',['../sync_2reduce_8h.html#a27df5989f95087d0259a3e381b1539b3',1,'dlaf::comm::sync']]],
+  ['reduction_5fto_5fband_2eh_365',['reduction_to_band.h',['../reduction__to__band_8h.html',1,'']]],
+  ['reductiontoband_366',['ReductionToBand',['../structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html',1,'dlaf::eigensolver::internal']]],
+  ['reductiontoband_367',['reductionToBand',['../reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617',1,'dlaf::eigensolver::reductionToBand(Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)'],['../reduction__to__band_8h.html#a143b74447a1f72d4d5368b9bad10b331',1,'dlaf::eigensolver::reductionToBand(comm::CommunicatorGrid grid, Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)']]],
+  ['reset_368',['reset',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acb87326419c25da556f027565b96c086',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::reset()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a83ffbae7e4944baa1bc4bfbe5dd1100d',1,'dlaf::matrix::internal::TilePipeline::reset()'],['../classdlaf_1_1common_1_1_pipeline.html#a4a9e1a35ffad351b5b4e01b88ef8a447',1,'dlaf::common::Pipeline::reset()']]],
+  ['retiledsubpipeline_369',['retiledSubPipeline',['../classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff',1,'dlaf::matrix::Matrix']]],
+  ['retiledsubpipelineconst_370',['retiledSubPipelineConst',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['round_5frobin_2eh_371',['round_robin.h',['../round__robin_8h.html',1,'']]],
+  ['roundrobin_372',['RoundRobin',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]],
+  ['roundrobin_3c_20dlaf_3a_3amatrix_3a_3apanel_3c_20coord_3a_3acol_2c_20t_2c_20device_3a_3acpu_20_3e_20_3e_373',['RoundRobin&lt; dlaf::matrix::Panel&lt; Coord::Col, T, Device::CPU &gt; &gt;',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]],
+  ['rowcommunicator_374',['rowCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391',1,'dlaf::comm::CommunicatorGrid']]]
 ];
diff --git a/master/search/all_11.js b/master/search/all_11.js
index 7b677b0825..2da024476b 100644
--- a/master/search/all_11.js
+++ b/master/search/all_11.js
@@ -1,68 +1,71 @@
 var searchData=
 [
-  ['samesign_374',['sameSign',['../util__math_8h.html#a0922553e7cd5d09cc857bb33e8a1b91b',1,'dlaf::util']]],
-  ['scal_2eh_375',['scal.h',['../scal_8h.html',1,'']]],
-  ['scheduleallreduce_376',['scheduleAllReduce',['../kernels_2all__reduce_8h.html#a8cb64ca1859aef0b95cdcfa8a1f05297',1,'dlaf::comm']]],
-  ['scheduleallreduceinplace_377',['scheduleAllReduceInPlace',['../kernels_2all__reduce_8h.html#a689b3d06eea6e5d2c9899521e970ecb0',1,'dlaf::comm']]],
-  ['scheduleallsump2p_378',['scheduleAllSumP2P',['../p2p__allsum_8h.html#ac786ec776d72b61529c8a79c5baffff4',1,'dlaf::comm']]],
-  ['schedulerecvbcast_379',['scheduleRecvBcast',['../kernels_2broadcast_8h.html#a3645d0cfc3caad43c37c355896a7215f',1,'dlaf::comm']]],
-  ['schedulereducerecvinplace_380',['scheduleReduceRecvInPlace',['../kernels_2reduce_8h.html#a89af8ab199d6ba8902cc962122477f00',1,'dlaf::comm']]],
-  ['schedulereducesend_381',['scheduleReduceSend',['../kernels_2reduce_8h.html#a60899e3a349b0defe79b1561045a373a',1,'dlaf::comm']]],
-  ['schedulers_2eh_382',['schedulers.h',['../schedulers_8h.html',1,'']]],
-  ['schedulesendbcast_383',['scheduleSendBcast',['../kernels_2broadcast_8h.html#a98b583f24caaccdf37f3db1f3b46b457',1,'dlaf::comm']]],
-  ['scopedinitializer_384',['ScopedInitializer',['../structdlaf_1_1_scoped_initializer.html',1,'dlaf']]],
-  ['select_385',['select',['../matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab',1,'dlaf::matrix']]],
-  ['selectgeneric_386',['selectGeneric',['../matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1',1,'dlaf::matrix::internal']]],
-  ['selectread_387',['selectRead',['../matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20',1,'dlaf::matrix']]],
-  ['send_388',['send',['../sync_2broadcast_8h.html#a313a9dc3d212f70d7af273fa0c681aee',1,'dlaf::comm::sync::broadcast']]],
-  ['send_5fto_389',['send_to',['../basic_8h.html#adfd3205605f800afb2208146565a3bd4',1,'dlaf::comm::sync']]],
-  ['sendersinglevaluetypeimpl_390',['SenderSingleValueTypeImpl',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3aread_20_3e_20_3e_20_3e_20_3e_391',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::read &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_356df456d49829a554002eacb85cc5b7.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3areadwrite_20_3e_20_3e_20_3e_20_3e_392',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::readwrite &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_3535bbe9d77284105a6158ec315ee38c.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_20_3e_20_3e_393',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; std::reference_wrapper&lt; T &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01std_1b569951bd408b620bb545799a6089d25.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20t_20_3e_20_3e_20_3e_394',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; T &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01_t_01_4_01_4_01_4.html',1,'dlaf::internal']]],
-  ['set_395',['set',['../util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f)'],['../util__matrix_8h.html#af07478cd4a633a1422e160863d3d8510',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f, const blas::Op op)']]],
-  ['set0_396',['set0',['../lapack_2tile_8h.html#ab094eeac6052422b50a298b42a947251',1,'dlaf::tile::set0()'],['../util__matrix_8h.html#a6cdf6afc18a6456ed68b3fd1dffa9c39',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, LocalTileIndex begin, LocalTileSize sz, Matrix&lt; T, D &gt; &amp;matrix)'],['../util__matrix_8h.html#a79688b3669b67c143114cf2eef3ba69b',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, Panel&lt; axis, T, D, storage &gt; &amp;panel)']]],
-  ['set_5frandom_397',['set_random',['../util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0',1,'dlaf::matrix::util']]],
-  ['set_5frandom_5fhermitian_398',['set_random_hermitian',['../util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476',1,'dlaf::matrix::util']]],
-  ['set_5frandom_5fhermitian_5fpositive_5fdefinite_399',['set_random_hermitian_positive_definite',['../util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58',1,'dlaf::matrix::util']]],
-  ['set_5frandom_5fhermitian_5fwith_5foffset_400',['set_random_hermitian_with_offset',['../util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133',1,'dlaf::matrix::util::internal']]],
-  ['setheight_401',['setHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a5ffd11dcc29ca2731c0cf232cb599d8e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setrange_402',['setRange',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a88f387bed0a5cf8dabd5f6c5b3d2c3b0',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setrangeend_403',['setRangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a542319871ee2379e84651d7dd91f0749',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setrangestart_404',['setRangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a621d6ffd26cb962792c4087159df2769',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['settile_405',['setTile',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa9c0ce49a7829488736d99011c5ac6c9',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setupinternalmatrix_406',['setupInternalMatrix',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a11f5026c35f76adb7c99c725dc969c44',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setwidth_407',['setWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a74e5d5d87edfb1d2de8a54cfa812bd04',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['sharereadwritetile_408',['shareReadWriteTile',['../matrix_2tile_8h.html#aa8e4a64946c725cef06834fb80b75276',1,'dlaf::matrix']]],
-  ['single_5fthreaded_5fblas_2eh_409',['single_threaded_blas.h',['../single__threaded__blas_8h.html',1,'']]],
-  ['singlethreadedblasscope_410',['SingleThreadedBlasScope',['../classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html',1,'dlaf::common::internal']]],
-  ['size_411',['size',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805',1,'dlaf::matrix::internal::MatrixBase::size()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7ef713ad7d24caccfc0863ab4b8481f2',1,'dlaf::matrix::Tile&lt; const T, D &gt;::size()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a886c87812f0a8eb9071c70477ac9f042',1,'dlaf::memory::MemoryChunk::size()'],['../classdlaf_1_1memory_1_1_memory_view.html#a5ae9491601035e4f2fd87352916f84c2',1,'dlaf::memory::MemoryView::size()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77',1,'dlaf::comm::CommunicatorGrid::size()'],['../classdlaf_1_1comm_1_1_communicator.html#a415f5d36c3033320074df329163c3127',1,'dlaf::comm::Communicator::size()']]],
-  ['size2d_412',['Size2D',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common::Size2D&lt; IndexT, Tag &gt;'],['../communicator__grid_8h.html#a1af44f2ea119a10f873e64cf048ba94a',1,'dlaf::comm::Size2D()']]],
-  ['size2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_413',['Size2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_414',['Size2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_415',['Size2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocalelement_5ftag_20_3e_416',['Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_417',['Size2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_418',['Size2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['solver_2eh_419',['solver.h',['../solver_8h.html',1,'']]],
-  ['source_5flocation_420',['source_location',['../structdlaf_1_1common_1_1internal_1_1source__location.html',1,'dlaf::common::internal']]],
-  ['source_5flocation_421',['SOURCE_LOCATION',['../source__location_8h.html#aa6e6fc9684bd84ce7b72da6a2eef668f',1,'source_location.h']]],
-  ['source_5flocation_2eh_422',['source_location.h',['../source__location_8h.html',1,'']]],
-  ['splittile_423',['splitTile',['../matrix_2tile_8h.html#ae5697bd5c424a95890978dfdc4739bf6',1,'dlaf::matrix::splitTile(ReadWriteTileSender&lt; T, D &gt; &amp;&amp;tile, const SubTileSpec &amp;spec)'],['../matrix_2tile_8h.html#a7a2383f364417fce38d6e7038cb18bd1',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const std::vector&lt; SubTileSpec &gt; &amp;specs)'],['../matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const SubTileSpec &amp;spec)']]],
-  ['splittiledisjoint_424',['splitTileDisjoint',['../matrix_2tile_8h.html#a4c15e2e57d6336347e6e19d945bd650e',1,'dlaf::matrix']]],
-  ['square_5fblocksize_425',['square_blocksize',['../util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b',1,'dlaf::matrix']]],
-  ['square_5fsize_426',['square_size',['../util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0',1,'dlaf::matrix::square_size()'],['../util__tile_8h.html#adfd1e0b37d590f9f6b56cdb276688f0f',1,'dlaf::tile::square_size()']]],
-  ['start_5f_427',['start_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ac49583acc02b6ba394d9b4e3b7450e53',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['start_5foffset_5f_428',['start_offset_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a8603ffce77527952a466a9630d98cd5c',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['stedc_429',['stedc',['../lapack_2tile_8h.html#a68163899b7b15f447fdbb05e475d9cc6',1,'dlaf::tile']]],
-  ['stride_430',['stride',['../structdlaf_1_1common_1_1_data_descriptor.html#ab4c4694a381e4cfb44d304cf150743f9',1,'dlaf::common::DataDescriptor']]],
-  ['submatrixview_431',['SubMatrixView',['../structdlaf_1_1matrix_1_1_sub_matrix_view.html',1,'dlaf::matrix::SubMatrixView'],['../structdlaf_1_1matrix_1_1_sub_matrix_view.html#a7c7cde76a018f82ab23c749de90fe46d',1,'dlaf::matrix::SubMatrixView::SubMatrixView()']]],
-  ['subpanelview_432',['SubPanelView',['../structdlaf_1_1matrix_1_1_sub_panel_view.html',1,'dlaf::matrix::SubPanelView'],['../structdlaf_1_1matrix_1_1_sub_panel_view.html#a556b70975f5928ca81f2196d549be232',1,'dlaf::matrix::SubPanelView::SubPanelView()']]],
-  ['subpipelinetag_433',['SubPipelineTag',['../structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
-  ['subtilereference_434',['subTileReference',['../classdlaf_1_1matrix_1_1_tile.html#a670161e49f6a18b5979e9938e4e7e867',1,'dlaf::matrix::Tile::subTileReference()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a4adf525073d06baaa47b06886272da41',1,'dlaf::matrix::Tile&lt; const T, D &gt;::subTileReference()']]],
-  ['subtilespec_435',['SubTileSpec',['../structdlaf_1_1matrix_1_1_sub_tile_spec.html',1,'dlaf::matrix']]],
-  ['sum_436',['sum',['../util__math_8h.html#afa826e9affbc0fc9e9dbe24d233a9ffb',1,'dlaf::util::size_t::sum()'],['../util__math_8h.html#ae1dbf257cc807e5bdba5a63087e3a2bc',1,'dlaf::util::ptrdiff_t::sum()']]],
-  ['sweepworker_437',['SweepWorker',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker.html',1,'dlaf::eigensolver::internal']]],
-  ['sweepworkerdist_438',['SweepWorkerDist',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker_dist.html',1,'dlaf::eigensolver::internal']]]
+  ['samesign_375',['sameSign',['../util__math_8h.html#a0922553e7cd5d09cc857bb33e8a1b91b',1,'dlaf::util']]],
+  ['scal_2eh_376',['scal.h',['../scal_8h.html',1,'']]],
+  ['scheduleallreduce_377',['scheduleAllReduce',['../kernels_2all__reduce_8h.html#a8cb64ca1859aef0b95cdcfa8a1f05297',1,'dlaf::comm']]],
+  ['scheduleallreduceinplace_378',['scheduleAllReduceInPlace',['../kernels_2all__reduce_8h.html#a689b3d06eea6e5d2c9899521e970ecb0',1,'dlaf::comm']]],
+  ['scheduleallsump2p_379',['scheduleAllSumP2P',['../p2p__allsum_8h.html#ac786ec776d72b61529c8a79c5baffff4',1,'dlaf::comm']]],
+  ['schedulerecvbcast_380',['scheduleRecvBcast',['../kernels_2broadcast_8h.html#a3645d0cfc3caad43c37c355896a7215f',1,'dlaf::comm']]],
+  ['schedulereducerecvinplace_381',['scheduleReduceRecvInPlace',['../kernels_2reduce_8h.html#a89af8ab199d6ba8902cc962122477f00',1,'dlaf::comm']]],
+  ['schedulereducesend_382',['scheduleReduceSend',['../kernels_2reduce_8h.html#a60899e3a349b0defe79b1561045a373a',1,'dlaf::comm']]],
+  ['schedulers_2eh_383',['schedulers.h',['../schedulers_8h.html',1,'']]],
+  ['schedulesendbcast_384',['scheduleSendBcast',['../kernels_2broadcast_8h.html#a98b583f24caaccdf37f3db1f3b46b457',1,'dlaf::comm']]],
+  ['scopedinitializer_385',['ScopedInitializer',['../structdlaf_1_1_scoped_initializer.html',1,'dlaf']]],
+  ['select_386',['select',['../matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab',1,'dlaf::matrix']]],
+  ['selectgeneric_387',['selectGeneric',['../matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1',1,'dlaf::matrix::internal']]],
+  ['selectread_388',['selectRead',['../matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20',1,'dlaf::matrix']]],
+  ['send_389',['send',['../sync_2broadcast_8h.html#a313a9dc3d212f70d7af273fa0c681aee',1,'dlaf::comm::sync::broadcast']]],
+  ['send_5fto_390',['send_to',['../basic_8h.html#adfd3205605f800afb2208146565a3bd4',1,'dlaf::comm::sync']]],
+  ['sendersinglevaluetypeimpl_391',['SenderSingleValueTypeImpl',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3aread_20_3e_20_3e_20_3e_20_3e_392',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::read &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_356df456d49829a554002eacb85cc5b7.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3areadwrite_20_3e_20_3e_20_3e_20_3e_393',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::readwrite &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_3535bbe9d77284105a6158ec315ee38c.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_20_3e_20_3e_394',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; std::reference_wrapper&lt; T &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01std_1b569951bd408b620bb545799a6089d25.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20t_20_3e_20_3e_20_3e_395',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; T &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01_t_01_4_01_4_01_4.html',1,'dlaf::internal']]],
+  ['set_396',['set',['../util__matrix_8h.html#af07478cd4a633a1422e160863d3d8510',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f, const blas::Op op)'],['../util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f)']]],
+  ['set0_397',['set0',['../lapack_2tile_8h.html#ab094eeac6052422b50a298b42a947251',1,'dlaf::tile::set0()'],['../util__matrix_8h.html#a79688b3669b67c143114cf2eef3ba69b',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, Panel&lt; axis, T, D, storage &gt; &amp;panel)'],['../util__matrix_8h.html#a6cdf6afc18a6456ed68b3fd1dffa9c39',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, LocalTileIndex begin, LocalTileSize sz, Matrix&lt; T, D &gt; &amp;matrix)']]],
+  ['set_5frandom_398',['set_random',['../util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0',1,'dlaf::matrix::util']]],
+  ['set_5frandom_5fhermitian_399',['set_random_hermitian',['../util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476',1,'dlaf::matrix::util']]],
+  ['set_5frandom_5fhermitian_5fpositive_5fdefinite_400',['set_random_hermitian_positive_definite',['../util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58',1,'dlaf::matrix::util']]],
+  ['set_5frandom_5fhermitian_5fwith_5foffset_401',['set_random_hermitian_with_offset',['../util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133',1,'dlaf::matrix::util::internal']]],
+  ['setheight_402',['setHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a5ffd11dcc29ca2731c0cf232cb599d8e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setrange_403',['setRange',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a88f387bed0a5cf8dabd5f6c5b3d2c3b0',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setrangeend_404',['setRangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a542319871ee2379e84651d7dd91f0749',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setrangestart_405',['setRangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a621d6ffd26cb962792c4087159df2769',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['settile_406',['setTile',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa9c0ce49a7829488736d99011c5ac6c9',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setupinternalmatrix_407',['setupInternalMatrix',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a11f5026c35f76adb7c99c725dc969c44',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setwidth_408',['setWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a74e5d5d87edfb1d2de8a54cfa812bd04',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['sharereadwritetile_409',['shareReadWriteTile',['../matrix_2tile_8h.html#aa8e4a64946c725cef06834fb80b75276',1,'dlaf::matrix']]],
+  ['single_5fthreaded_5fblas_2eh_410',['single_threaded_blas.h',['../single__threaded__blas_8h.html',1,'']]],
+  ['single_5ftile_5fper_5fblock_411',['single_tile_per_block',['../util__matrix_8h.html#a4e47364118c7bc9bb3d038ae4ec8a35c',1,'dlaf::matrix']]],
+  ['singlethreadedblasscope_412',['SingleThreadedBlasScope',['../classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html',1,'dlaf::common::internal']]],
+  ['size_413',['size',['../classdlaf_1_1memory_1_1_memory_chunk.html#a886c87812f0a8eb9071c70477ac9f042',1,'dlaf::memory::MemoryChunk::size()'],['../classdlaf_1_1comm_1_1_communicator.html#a415f5d36c3033320074df329163c3127',1,'dlaf::comm::Communicator::size()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77',1,'dlaf::comm::CommunicatorGrid::size()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805',1,'dlaf::matrix::internal::MatrixBase::size()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7ef713ad7d24caccfc0863ab4b8481f2',1,'dlaf::matrix::Tile&lt; const T, D &gt;::size()'],['../classdlaf_1_1memory_1_1_memory_view.html#a5ae9491601035e4f2fd87352916f84c2',1,'dlaf::memory::MemoryView::size()']]],
+  ['size2d_414',['Size2D',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common::Size2D&lt; IndexT, Tag &gt;'],['../communicator__grid_8h.html#a1af44f2ea119a10f873e64cf048ba94a',1,'dlaf::comm::Size2D()']]],
+  ['size2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_415',['Size2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_416',['Size2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_417',['Size2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocalelement_5ftag_20_3e_418',['Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_419',['Size2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_420',['Size2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['solver_2eh_421',['solver.h',['../solver_8h.html',1,'']]],
+  ['source_5flocation_422',['source_location',['../structdlaf_1_1common_1_1internal_1_1source__location.html',1,'dlaf::common::internal']]],
+  ['source_5flocation_423',['SOURCE_LOCATION',['../source__location_8h.html#aa6e6fc9684bd84ce7b72da6a2eef668f',1,'source_location.h']]],
+  ['source_5flocation_2eh_424',['source_location.h',['../source__location_8h.html',1,'']]],
+  ['splittile_425',['splitTile',['../matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const SubTileSpec &amp;spec)'],['../matrix_2tile_8h.html#a7a2383f364417fce38d6e7038cb18bd1',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const std::vector&lt; SubTileSpec &gt; &amp;specs)'],['../matrix_2tile_8h.html#ae5697bd5c424a95890978dfdc4739bf6',1,'dlaf::matrix::splitTile(ReadWriteTileSender&lt; T, D &gt; &amp;&amp;tile, const SubTileSpec &amp;spec)']]],
+  ['splittiledisjoint_426',['splitTileDisjoint',['../matrix_2tile_8h.html#a4c15e2e57d6336347e6e19d945bd650e',1,'dlaf::matrix']]],
+  ['square_5fblocksize_427',['square_blocksize',['../util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b',1,'dlaf::matrix']]],
+  ['square_5fsize_428',['square_size',['../util__tile_8h.html#adfd1e0b37d590f9f6b56cdb276688f0f',1,'dlaf::tile::square_size()'],['../util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0',1,'dlaf::matrix::square_size()']]],
+  ['start_5f_429',['start_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ac49583acc02b6ba394d9b4e3b7450e53',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['start_5foffset_5f_430',['start_offset_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a8603ffce77527952a466a9630d98cd5c',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['stedc_431',['stedc',['../lapack_2tile_8h.html#a68163899b7b15f447fdbb05e475d9cc6',1,'dlaf::tile']]],
+  ['stride_432',['stride',['../structdlaf_1_1common_1_1_data_descriptor.html#ab4c4694a381e4cfb44d304cf150743f9',1,'dlaf::common::DataDescriptor']]],
+  ['submatrixview_433',['SubMatrixView',['../structdlaf_1_1matrix_1_1_sub_matrix_view.html',1,'dlaf::matrix::SubMatrixView'],['../structdlaf_1_1matrix_1_1_sub_matrix_view.html#a7c7cde76a018f82ab23c749de90fe46d',1,'dlaf::matrix::SubMatrixView::SubMatrixView()']]],
+  ['subpanelview_434',['SubPanelView',['../structdlaf_1_1matrix_1_1_sub_panel_view.html',1,'dlaf::matrix::SubPanelView'],['../structdlaf_1_1matrix_1_1_sub_panel_view.html#a556b70975f5928ca81f2196d549be232',1,'dlaf::matrix::SubPanelView::SubPanelView()']]],
+  ['subpipeline_435',['subPipeline',['../classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23',1,'dlaf::matrix::Matrix']]],
+  ['subpipelineconst_436',['subPipelineConst',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['subpipelinetag_437',['SubPipelineTag',['../structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['subtilereference_438',['subTileReference',['../classdlaf_1_1matrix_1_1_tile.html#a670161e49f6a18b5979e9938e4e7e867',1,'dlaf::matrix::Tile::subTileReference()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a4adf525073d06baaa47b06886272da41',1,'dlaf::matrix::Tile&lt; const T, D &gt;::subTileReference()']]],
+  ['subtilespec_439',['SubTileSpec',['../structdlaf_1_1matrix_1_1_sub_tile_spec.html',1,'dlaf::matrix']]],
+  ['sum_440',['sum',['../util__math_8h.html#afa826e9affbc0fc9e9dbe24d233a9ffb',1,'dlaf::util::size_t::sum()'],['../util__math_8h.html#ae1dbf257cc807e5bdba5a63087e3a2bc',1,'dlaf::util::ptrdiff_t::sum()']]],
+  ['sweepworker_441',['SweepWorker',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker.html',1,'dlaf::eigensolver::internal']]],
+  ['sweepworkerdist_442',['SweepWorkerDist',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker_dist.html',1,'dlaf::eigensolver::internal']]]
 ];
diff --git a/master/search/all_12.js b/master/search/all_12.js
index 2422ee6c35..cf59bed300 100644
--- a/master/search/all_12.js
+++ b/master/search/all_12.js
@@ -1,55 +1,55 @@
 var searchData=
 [
-  ['tile_439',['Tile',['../classdlaf_1_1matrix_1_1_tile.html',1,'dlaf::matrix::Tile&lt; T, D &gt;'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a38b4f570cc1ccedb8880d469d353414e',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile()=default'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a73f2bfb1856011bce752fca6582ba584',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile(const TileElementSize &amp;size, memory::MemoryView&lt; ElementType, D &gt; &amp;&amp;memory_view, SizeType ld) noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#af4bddf624138747a5089071f1f57eee4',1,'dlaf::matrix::Tile::Tile()=default'],['../classdlaf_1_1matrix_1_1_tile.html#a4c7d7a75afcd2cc6911b40643f4f095f',1,'dlaf::matrix::Tile::Tile(const TileElementSize &amp;size, memory::MemoryView&lt; ElementType, D &gt; &amp;&amp;memory_view, SizeType ld) noexcept']]],
-  ['tile_2eh_440',['tile.h',['../blas_2tile_8h.html',1,'(Global Namespace)'],['../lapack_2tile_8h.html',1,'(Global Namespace)'],['../matrix_2tile_8h.html',1,'(Global Namespace)']]],
-  ['tile_3c_20const_20t_2c_20d_20_3e_441',['Tile&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
-  ['tile_5fextensions_2eh_442',['tile_extensions.h',['../tile__extensions_8h.html',1,'']]],
-  ['tileaccesshelper_443',['TileAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['tilecollector_444',['TileCollector',['../classdlaf_1_1eigensolver_1_1internal_1_1_tile_collector.html',1,'dlaf::eigensolver::internal']]],
-  ['tiledata_445',['TileData',['../classdlaf_1_1matrix_1_1internal_1_1_tile_data.html',1,'dlaf::matrix::internal']]],
-  ['tileelementfromelement_446',['tileElementFromElement',['../util__distribution_8h.html#a77c1788e03f30e7d9511a7e90a89a494',1,'dlaf::util::matrix']]],
-  ['tileelementfromglobalelement_447',['tileElementFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#afe2b66a02c3a1a78bfac1bb2f20f2864',1,'dlaf::matrix::Distribution']]],
-  ['tileelementindex_448',['tileElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a71ad776a93750b9c6d1ebfa2d36e28db',1,'dlaf::matrix::Distribution']]],
-  ['tilefromelement_449',['tileFromElement',['../util__distribution_8h.html#a8876d879740e8f24112ca972961e11c7',1,'dlaf::util::matrix']]],
-  ['tilelayout_450',['tileLayout',['../layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col)'],['../layout__info_8h.html#a970afb0f1a7abc87e507e6c4d35f442a',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution, SizeType ld_tile, SizeType tiles_per_col)'],['../layout__info_8h.html#a254e1e0948e647642b0f2615aeaa0ea2',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)'],['../layout__info_8h.html#a873adaaaa2e661caed98af371fbb1943',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution)']]],
-  ['tilelinearindex_451',['tileLinearIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['tileoffset_452',['tileOffset',['../classdlaf_1_1matrix_1_1_layout_info.html#ad03e1291efd2ed416ace133a24a30ac4',1,'dlaf::matrix::LayoutInfo']]],
-  ['tilepipeline_453',['TilePipeline',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html',1,'dlaf::matrix::internal']]],
-  ['tilesize_454',['tileSize',['../classdlaf_1_1matrix_1_1_layout_info.html#a62e3619b9016e9c827c120fce629d08e',1,'dlaf::matrix::LayoutInfo::tileSize()'],['../classdlaf_1_1matrix_1_1_distribution.html#a4cec137b1316902f68b63148d282be62',1,'dlaf::matrix::Distribution::tileSize()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5',1,'dlaf::matrix::internal::MatrixBase::tileSize()']]],
-  ['tilesizefromglobalelement_455',['tileSizeFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a3dd77d459960a11b56fc1e7fb27932f7',1,'dlaf::matrix::Distribution']]],
-  ['timer_456',['Timer',['../classdlaf_1_1common_1_1_timer.html',1,'dlaf::common']]],
-  ['timer_2eh_457',['timer.h',['../timer_8h.html',1,'']]],
-  ['to_5fint_458',['to_int',['../types_8h.html#af90e7fd5acadf5987b7199b0bd44deea',1,'dlaf']]],
-  ['to_5fsigned_459',['to_signed',['../types_8h.html#a2246feaf3c49f3f3ae5928082363f7d3',1,'dlaf::to_signed(const SB value)'],['../types_8h.html#aa39d2d6e54b007c18e1c57ff380c73cd',1,'dlaf::to_signed(const U unsigned_value)']]],
-  ['to_5fsizet_460',['to_sizet',['../types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1',1,'dlaf']]],
-  ['to_5fsizetype_461',['to_SizeType',['../types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9',1,'dlaf']]],
-  ['to_5fuint_462',['to_uint',['../types_8h.html#a4543febf91f08c23fd8a6eeca8f49d82',1,'dlaf']]],
-  ['to_5funsigned_463',['to_unsigned',['../types_8h.html#ae9973646cf4ce493ed1831a5bdbf7500',1,'dlaf::to_unsigned(const UB unsigned_value)'],['../types_8h.html#afeb5db746331f9ca3a669373e1af84ba',1,'dlaf::to_unsigned(const S signed_value)']]],
-  ['total_5fops_464',['total_ops',['../types_8h.html#a831d9cfa2a32641121185df5d9d70cdc',1,'dlaf']]],
-  ['traits_2eh_465',['traits.h',['../traits_8h.html',1,'']]],
-  ['transformpack_466',['TransformPack',['../structdlaf_1_1internal_1_1_transform_pack.html',1,'dlaf::internal']]],
-  ['transformpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20transformer_20_3e_467',['TransformPack&lt; Pack&lt; Ts... &gt;, Transformer &gt;',['../structdlaf_1_1internal_1_1_transform_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_transformer_01_4.html',1,'dlaf::internal']]],
-  ['transpose_468',['transpose',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a98f8b3b0cd7b4c1fa62b40b9de0041bb',1,'dlaf::common::internal::basic_coords']]],
-  ['transposed_469',['transposed',['../index2d_8h.html#a024753ac73fbefa174548c575327862b',1,'dlaf::common']]],
-  ['triangular_470',['Triangular',['../structdlaf_1_1multiplication_1_1internal_1_1_triangular.html',1,'dlaf::multiplication::internal::Triangular&lt; backend, device, T &gt;'],['../structdlaf_1_1solver_1_1internal_1_1_triangular.html',1,'dlaf::solver::internal::Triangular&lt; backend, device, T &gt;']]],
-  ['triangular_471',['triangular',['../multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51',1,'dlaf::multiplication::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../multiplication_2triangular_8h.html#ad4de985e76a6c12c487b36fa773b870b',1,'dlaf::multiplication::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a9d48ec5978acfd3714a66613678a1afd',1,'dlaf::solver::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a3ff8022461abe72c4197e34601d592a9',1,'dlaf::solver::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
-  ['triangular_2eh_472',['triangular.h',['../solver_2triangular_8h.html',1,'(Global Namespace)'],['../multiplication_2triangular_8h.html',1,'(Global Namespace)']]],
-  ['tridiag_5fsolver_2eh_473',['tridiag_solver.h',['../tridiag__solver_8h.html',1,'']]],
-  ['tridiagresult_474',['TridiagResult',['../structdlaf_1_1eigensolver_1_1_tridiag_result.html',1,'dlaf::eigensolver']]],
-  ['tridiagsolver_475',['TridiagSolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html',1,'dlaf::eigensolver::internal']]],
-  ['tridiagsolver_476',['tridiagSolver',['../tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a',1,'dlaf::eigensolver::tridiagSolver(Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, device &gt; &amp;evals, Matrix&lt; T, device &gt; &amp;evecs)'],['../tridiag__solver_8h.html#a0cfeab14e9e1dc7a2fb703006cd7e957',1,'dlaf::eigensolver::tridiagSolver(comm::CommunicatorGrid grid, Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;evals, Matrix&lt; T, D &gt; &amp;evecs)']]],
-  ['trmm_477',['trmm',['../blas_2tile_8h.html#a61397e6748a24f13ee6ad7f23e5339f7',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)'],['../blas_2tile_8h.html#a185aa2ac627de6e9e393240cda2b5f4c',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a383ebe00fbfd1f328dd0378b8aa42b89',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['trmm3_478',['trmm3',['../blas_2tile_8h.html#aebff48d52916dafd14479dc3b1e04e8e',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#a9906093b08eefa0a5341b140ce6100a3',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#a0cdf7b22f8a310978252ff7a0c456b98',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)']]],
-  ['trmmsizes_479',['trmmSizes',['../structdlaf_1_1tile_1_1internal_1_1trmm_sizes.html',1,'dlaf::tile::internal']]],
-  ['trsm_480',['trsm',['../blas_2tile_8h.html#a2fe48f2d3a3a7515a99805d135c5b2ce',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)'],['../blas_2tile_8h.html#a1b11d671c920bf9dce76092e6d1aaa8c',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a23eb607d942637d4e14331a2f0f253f7',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['trsmsizes_481',['trsmSizes',['../structdlaf_1_1tile_1_1internal_1_1trsm_sizes.html',1,'dlaf::tile::internal']]],
-  ['tune_2eh_482',['tune.h',['../tune_8h.html',1,'']]],
-  ['tuneparameters_483',['TuneParameters',['../structdlaf_1_1_tune_parameters.html',1,'dlaf']]],
-  ['type_5fhandler_484',['type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html',1,'dlaf::comm::internal::type_handler&lt; T &gt;'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa9eebfb39b8aabe2344f61a7bf26ee40',1,'dlaf::comm::internal::type_handler::type_handler(SizeType nblocks, SizeType block_size, SizeType stride)'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa71d40004e1c645161b1d00b511ad9ee',1,'dlaf::comm::internal::type_handler::type_handler() noexcept=default']]],
-  ['type_5fhandler_2eh_485',['type_handler.h',['../type__handler_8h.html',1,'']]],
-  ['typeinfo_486',['TypeInfo',['../structdlaf_1_1_type_info.html',1,'dlaf']]],
-  ['typeinfo_3c_20const_20t_20_3e_487',['TypeInfo&lt; const T &gt;',['../structdlaf_1_1_type_info_3_01const_01_t_01_4.html',1,'dlaf']]],
-  ['typeinfo_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_488',['TypeInfo&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1_type_info_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf']]],
-  ['typelist_489',['TypeList',['../structdlaf_1_1internal_1_1_type_list.html',1,'dlaf::internal']]],
-  ['types_2eh_490',['types.h',['../types_8h.html',1,'']]]
+  ['tile_443',['Tile',['../classdlaf_1_1matrix_1_1_tile.html',1,'dlaf::matrix::Tile&lt; T, D &gt;'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a38b4f570cc1ccedb8880d469d353414e',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile()=default'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a73f2bfb1856011bce752fca6582ba584',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile(const TileElementSize &amp;size, memory::MemoryView&lt; ElementType, D &gt; &amp;&amp;memory_view, SizeType ld) noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#af4bddf624138747a5089071f1f57eee4',1,'dlaf::matrix::Tile::Tile()=default'],['../classdlaf_1_1matrix_1_1_tile.html#a4c7d7a75afcd2cc6911b40643f4f095f',1,'dlaf::matrix::Tile::Tile(const TileElementSize &amp;size, memory::MemoryView&lt; ElementType, D &gt; &amp;&amp;memory_view, SizeType ld) noexcept']]],
+  ['tile_2eh_444',['tile.h',['../blas_2tile_8h.html',1,'(Global Namespace)'],['../lapack_2tile_8h.html',1,'(Global Namespace)'],['../matrix_2tile_8h.html',1,'(Global Namespace)']]],
+  ['tile_3c_20const_20t_2c_20d_20_3e_445',['Tile&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
+  ['tile_5fextensions_2eh_446',['tile_extensions.h',['../tile__extensions_8h.html',1,'']]],
+  ['tileaccesshelper_447',['TileAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['tilecollector_448',['TileCollector',['../classdlaf_1_1eigensolver_1_1internal_1_1_tile_collector.html',1,'dlaf::eigensolver::internal']]],
+  ['tiledata_449',['TileData',['../classdlaf_1_1matrix_1_1internal_1_1_tile_data.html',1,'dlaf::matrix::internal']]],
+  ['tileelementfromelement_450',['tileElementFromElement',['../util__distribution_8h.html#a77c1788e03f30e7d9511a7e90a89a494',1,'dlaf::util::matrix']]],
+  ['tileelementfromglobalelement_451',['tileElementFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#afe2b66a02c3a1a78bfac1bb2f20f2864',1,'dlaf::matrix::Distribution']]],
+  ['tileelementindex_452',['tileElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a71ad776a93750b9c6d1ebfa2d36e28db',1,'dlaf::matrix::Distribution']]],
+  ['tilefromelement_453',['tileFromElement',['../util__distribution_8h.html#a8876d879740e8f24112ca972961e11c7',1,'dlaf::util::matrix']]],
+  ['tilelayout_454',['tileLayout',['../layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col)'],['../layout__info_8h.html#a970afb0f1a7abc87e507e6c4d35f442a',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution, SizeType ld_tile, SizeType tiles_per_col)'],['../layout__info_8h.html#a254e1e0948e647642b0f2615aeaa0ea2',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)'],['../layout__info_8h.html#a873adaaaa2e661caed98af371fbb1943',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution)']]],
+  ['tilelinearindex_455',['tileLinearIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['tileoffset_456',['tileOffset',['../classdlaf_1_1matrix_1_1_layout_info.html#ad03e1291efd2ed416ace133a24a30ac4',1,'dlaf::matrix::LayoutInfo']]],
+  ['tilepipeline_457',['TilePipeline',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html',1,'dlaf::matrix::internal']]],
+  ['tilesize_458',['tileSize',['../classdlaf_1_1matrix_1_1_layout_info.html#a62e3619b9016e9c827c120fce629d08e',1,'dlaf::matrix::LayoutInfo::tileSize()'],['../classdlaf_1_1matrix_1_1_distribution.html#a4cec137b1316902f68b63148d282be62',1,'dlaf::matrix::Distribution::tileSize()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5',1,'dlaf::matrix::internal::MatrixBase::tileSize()']]],
+  ['tilesizefromglobalelement_459',['tileSizeFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a3dd77d459960a11b56fc1e7fb27932f7',1,'dlaf::matrix::Distribution']]],
+  ['timer_460',['Timer',['../classdlaf_1_1common_1_1_timer.html',1,'dlaf::common']]],
+  ['timer_2eh_461',['timer.h',['../timer_8h.html',1,'']]],
+  ['to_5fint_462',['to_int',['../types_8h.html#af90e7fd5acadf5987b7199b0bd44deea',1,'dlaf']]],
+  ['to_5fsigned_463',['to_signed',['../types_8h.html#a2246feaf3c49f3f3ae5928082363f7d3',1,'dlaf::to_signed(const SB value)'],['../types_8h.html#aa39d2d6e54b007c18e1c57ff380c73cd',1,'dlaf::to_signed(const U unsigned_value)']]],
+  ['to_5fsizet_464',['to_sizet',['../types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1',1,'dlaf']]],
+  ['to_5fsizetype_465',['to_SizeType',['../types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9',1,'dlaf']]],
+  ['to_5fuint_466',['to_uint',['../types_8h.html#a4543febf91f08c23fd8a6eeca8f49d82',1,'dlaf']]],
+  ['to_5funsigned_467',['to_unsigned',['../types_8h.html#ae9973646cf4ce493ed1831a5bdbf7500',1,'dlaf::to_unsigned(const UB unsigned_value)'],['../types_8h.html#afeb5db746331f9ca3a669373e1af84ba',1,'dlaf::to_unsigned(const S signed_value)']]],
+  ['total_5fops_468',['total_ops',['../types_8h.html#a831d9cfa2a32641121185df5d9d70cdc',1,'dlaf']]],
+  ['traits_2eh_469',['traits.h',['../traits_8h.html',1,'']]],
+  ['transformpack_470',['TransformPack',['../structdlaf_1_1internal_1_1_transform_pack.html',1,'dlaf::internal']]],
+  ['transformpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20transformer_20_3e_471',['TransformPack&lt; Pack&lt; Ts... &gt;, Transformer &gt;',['../structdlaf_1_1internal_1_1_transform_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_transformer_01_4.html',1,'dlaf::internal']]],
+  ['transpose_472',['transpose',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a98f8b3b0cd7b4c1fa62b40b9de0041bb',1,'dlaf::common::internal::basic_coords']]],
+  ['transposed_473',['transposed',['../index2d_8h.html#a024753ac73fbefa174548c575327862b',1,'dlaf::common']]],
+  ['triangular_474',['Triangular',['../structdlaf_1_1multiplication_1_1internal_1_1_triangular.html',1,'dlaf::multiplication::internal::Triangular&lt; backend, device, T &gt;'],['../structdlaf_1_1solver_1_1internal_1_1_triangular.html',1,'dlaf::solver::internal::Triangular&lt; backend, device, T &gt;']]],
+  ['triangular_475',['triangular',['../multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51',1,'dlaf::multiplication::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../multiplication_2triangular_8h.html#ad4de985e76a6c12c487b36fa773b870b',1,'dlaf::multiplication::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a9d48ec5978acfd3714a66613678a1afd',1,'dlaf::solver::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a3ff8022461abe72c4197e34601d592a9',1,'dlaf::solver::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
+  ['triangular_2eh_476',['triangular.h',['../solver_2triangular_8h.html',1,'(Global Namespace)'],['../multiplication_2triangular_8h.html',1,'(Global Namespace)']]],
+  ['tridiag_5fsolver_2eh_477',['tridiag_solver.h',['../tridiag__solver_8h.html',1,'']]],
+  ['tridiagresult_478',['TridiagResult',['../structdlaf_1_1eigensolver_1_1_tridiag_result.html',1,'dlaf::eigensolver']]],
+  ['tridiagsolver_479',['TridiagSolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html',1,'dlaf::eigensolver::internal']]],
+  ['tridiagsolver_480',['tridiagSolver',['../tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a',1,'dlaf::eigensolver::tridiagSolver(Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, device &gt; &amp;evals, Matrix&lt; T, device &gt; &amp;evecs)'],['../tridiag__solver_8h.html#a0cfeab14e9e1dc7a2fb703006cd7e957',1,'dlaf::eigensolver::tridiagSolver(comm::CommunicatorGrid grid, Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;evals, Matrix&lt; T, D &gt; &amp;evecs)']]],
+  ['trmm_481',['trmm',['../blas_2tile_8h.html#a61397e6748a24f13ee6ad7f23e5339f7',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)'],['../blas_2tile_8h.html#a185aa2ac627de6e9e393240cda2b5f4c',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a383ebe00fbfd1f328dd0378b8aa42b89',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['trmm3_482',['trmm3',['../blas_2tile_8h.html#aebff48d52916dafd14479dc3b1e04e8e',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#a9906093b08eefa0a5341b140ce6100a3',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#a0cdf7b22f8a310978252ff7a0c456b98',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)']]],
+  ['trmmsizes_483',['trmmSizes',['../structdlaf_1_1tile_1_1internal_1_1trmm_sizes.html',1,'dlaf::tile::internal']]],
+  ['trsm_484',['trsm',['../blas_2tile_8h.html#a2fe48f2d3a3a7515a99805d135c5b2ce',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)'],['../blas_2tile_8h.html#a1b11d671c920bf9dce76092e6d1aaa8c',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a23eb607d942637d4e14331a2f0f253f7',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['trsmsizes_485',['trsmSizes',['../structdlaf_1_1tile_1_1internal_1_1trsm_sizes.html',1,'dlaf::tile::internal']]],
+  ['tune_2eh_486',['tune.h',['../tune_8h.html',1,'']]],
+  ['tuneparameters_487',['TuneParameters',['../structdlaf_1_1_tune_parameters.html',1,'dlaf']]],
+  ['type_5fhandler_488',['type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html',1,'dlaf::comm::internal::type_handler&lt; T &gt;'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa9eebfb39b8aabe2344f61a7bf26ee40',1,'dlaf::comm::internal::type_handler::type_handler(SizeType nblocks, SizeType block_size, SizeType stride)'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa71d40004e1c645161b1d00b511ad9ee',1,'dlaf::comm::internal::type_handler::type_handler() noexcept=default']]],
+  ['type_5fhandler_2eh_489',['type_handler.h',['../type__handler_8h.html',1,'']]],
+  ['typeinfo_490',['TypeInfo',['../structdlaf_1_1_type_info.html',1,'dlaf']]],
+  ['typeinfo_3c_20const_20t_20_3e_491',['TypeInfo&lt; const T &gt;',['../structdlaf_1_1_type_info_3_01const_01_t_01_4.html',1,'dlaf']]],
+  ['typeinfo_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_492',['TypeInfo&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1_type_info_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf']]],
+  ['typelist_493',['TypeList',['../structdlaf_1_1internal_1_1_type_list.html',1,'dlaf::internal']]],
+  ['types_2eh_494',['types.h',['../types_8h.html',1,'']]]
 ];
diff --git a/master/search/all_13.js b/master/search/all_13.js
index 152dc03654..65b5c7a8ef 100644
--- a/master/search/all_13.js
+++ b/master/search/all_13.js
@@ -1,27 +1,27 @@
 var searchData=
 [
-  ['unique_491',['Unique',['../structdlaf_1_1internal_1_1_unique.html',1,'dlaf::internal']]],
-  ['unique_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_492',['Unique&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquehelper_493',['UniqueHelper',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
-  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_494',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_495',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquehelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_496',['UniqueHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
-  ['uniquepack_497',['UniquePack',['../structdlaf_1_1internal_1_1_unique_pack.html',1,'dlaf::internal']]],
-  ['uniquepack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_498',['UniquePack&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_499',['UniquePackHelper',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_500',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_501',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_502',['UniquePackHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
-  ['unwrap_503',['unwrap',['../unwrap_8h.html#a8da70a5535ac987a8f6ca7f8b195547d',1,'dlaf::common::internal']]],
-  ['unwrap_2eh_504',['unwrap.h',['../unwrap_8h.html',1,'']]],
-  ['unwrapper_505',['Unwrapper',['../structdlaf_1_1common_1_1internal_1_1_unwrapper.html',1,'dlaf::common::internal']]],
-  ['unwrapper_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20t1_2c_20t2_2c_20at_20_3e_20_3e_506',['Unwrapper&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; T1, T2, at &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01pika_1_1execution_1_1experimental_1_1async__r5be7b0afcb71e6df73ebcc954d80821d.html',1,'dlaf::common::internal']]],
-  ['unwrapper_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_507',['Unwrapper&lt; std::reference_wrapper&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01std_1_1reference__wrapper_3_01_t_01_4_01_4.html',1,'dlaf::common::internal']]],
-  ['unwrapping_508',['Unwrapping',['../structdlaf_1_1common_1_1internal_1_1_unwrapping.html',1,'dlaf::common::internal']]],
-  ['util_5fblas_2eh_509',['util_blas.h',['../util__blas_8h.html',1,'']]],
-  ['util_5fdistribution_2eh_510',['util_distribution.h',['../util__distribution_8h.html',1,'']]],
-  ['util_5flapack_2eh_511',['util_lapack.h',['../util__lapack_8h.html',1,'']]],
-  ['util_5fmath_2eh_512',['util_math.h',['../util__math_8h.html',1,'']]],
-  ['util_5fmatrix_2eh_513',['util_matrix.h',['../util__matrix_8h.html',1,'']]],
-  ['util_5ftile_2eh_514',['util_tile.h',['../util__tile_8h.html',1,'']]]
+  ['unique_495',['Unique',['../structdlaf_1_1internal_1_1_unique.html',1,'dlaf::internal']]],
+  ['unique_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_496',['Unique&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquehelper_497',['UniqueHelper',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
+  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_498',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_499',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquehelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_500',['UniqueHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
+  ['uniquepack_501',['UniquePack',['../structdlaf_1_1internal_1_1_unique_pack.html',1,'dlaf::internal']]],
+  ['uniquepack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_502',['UniquePack&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_503',['UniquePackHelper',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_504',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_505',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_506',['UniquePackHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
+  ['unwrap_507',['unwrap',['../unwrap_8h.html#a8da70a5535ac987a8f6ca7f8b195547d',1,'dlaf::common::internal']]],
+  ['unwrap_2eh_508',['unwrap.h',['../unwrap_8h.html',1,'']]],
+  ['unwrapper_509',['Unwrapper',['../structdlaf_1_1common_1_1internal_1_1_unwrapper.html',1,'dlaf::common::internal']]],
+  ['unwrapper_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20t1_2c_20t2_2c_20at_20_3e_20_3e_510',['Unwrapper&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; T1, T2, at &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01pika_1_1execution_1_1experimental_1_1async__r5be7b0afcb71e6df73ebcc954d80821d.html',1,'dlaf::common::internal']]],
+  ['unwrapper_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_511',['Unwrapper&lt; std::reference_wrapper&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01std_1_1reference__wrapper_3_01_t_01_4_01_4.html',1,'dlaf::common::internal']]],
+  ['unwrapping_512',['Unwrapping',['../structdlaf_1_1common_1_1internal_1_1_unwrapping.html',1,'dlaf::common::internal']]],
+  ['util_5fblas_2eh_513',['util_blas.h',['../util__blas_8h.html',1,'']]],
+  ['util_5fdistribution_2eh_514',['util_distribution.h',['../util__distribution_8h.html',1,'']]],
+  ['util_5flapack_2eh_515',['util_lapack.h',['../util__lapack_8h.html',1,'']]],
+  ['util_5fmath_2eh_516',['util_math.h',['../util__math_8h.html',1,'']]],
+  ['util_5fmatrix_2eh_517',['util_matrix.h',['../util__matrix_8h.html',1,'']]],
+  ['util_5ftile_2eh_518',['util_tile.h',['../util__tile_8h.html',1,'']]]
 ];
diff --git a/master/search/all_14.js b/master/search/all_14.js
index f3fc61255a..e55e969d87 100644
--- a/master/search/all_14.js
+++ b/master/search/all_14.js
@@ -1,10 +1,10 @@
 var searchData=
 [
-  ['vaccesshelper_515',['VAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1_v_access_helper.html',1,'dlaf::eigensolver::internal']]],
-  ['valid_516',['valid',['../classdlaf_1_1common_1_1_pipeline.html#affda528ea4c5e0e54f8fca4250b53af5',1,'dlaf::common::Pipeline::valid()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a3e3096bb1ef85b6017bd8c42c9617586',1,'dlaf::matrix::internal::TilePipeline::valid()']]],
-  ['vector_517',['vector',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
-  ['vector_2eh_518',['vector.h',['../vector_8h.html',1,'']]],
-  ['vector_3c_20readonlysendertype_20_3e_519',['vector&lt; ReadOnlySenderType &gt;',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
-  ['view_520',['View',['../structdlaf_1_1matrix_1_1internal_1_1_view.html',1,'dlaf::matrix::internal::View'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a3635af3164815f905a9fd33979a14a34',1,'dlaf::matrix::internal::View::View()']]],
-  ['views_2eh_521',['views.h',['../views_8h.html',1,'']]]
+  ['vaccesshelper_519',['VAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1_v_access_helper.html',1,'dlaf::eigensolver::internal']]],
+  ['valid_520',['valid',['../classdlaf_1_1common_1_1_pipeline.html#affda528ea4c5e0e54f8fca4250b53af5',1,'dlaf::common::Pipeline::valid()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a3e3096bb1ef85b6017bd8c42c9617586',1,'dlaf::matrix::internal::TilePipeline::valid()']]],
+  ['vector_521',['vector',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
+  ['vector_2eh_522',['vector.h',['../vector_8h.html',1,'']]],
+  ['vector_3c_20readonlysendertype_20_3e_523',['vector&lt; ReadOnlySenderType &gt;',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
+  ['view_524',['View',['../structdlaf_1_1matrix_1_1internal_1_1_view.html',1,'dlaf::matrix::internal::View'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a3635af3164815f905a9fd33979a14a34',1,'dlaf::matrix::internal::View::View()']]],
+  ['views_2eh_525',['views.h',['../views_8h.html',1,'']]]
 ];
diff --git a/master/search/all_15.js b/master/search/all_15.js
index ca9111353f..3701bc81d5 100644
--- a/master/search/all_15.js
+++ b/master/search/all_15.js
@@ -1,7 +1,7 @@
 var searchData=
 [
-  ['waitlocaltiles_522',['waitLocalTiles',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::waitLocalTiles()'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0',1,'dlaf::matrix::RetiledMatrix::waitLocalTiles()']]],
-  ['workspace_523',['WorkSpace',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space.html',1,'dlaf::eigensolver::internal']]],
-  ['workspacehost_524',['WorkSpaceHost',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host.html',1,'dlaf::eigensolver::internal']]],
-  ['workspacehostmirror_525',['WorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]]
+  ['waitlocaltiles_526',['waitLocalTiles',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['workspace_527',['WorkSpace',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space.html',1,'dlaf::eigensolver::internal']]],
+  ['workspacehost_528',['WorkSpaceHost',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host.html',1,'dlaf::eigensolver::internal']]],
+  ['workspacehostmirror_529',['WorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]]
 ];
diff --git a/master/search/all_16.js b/master/search/all_16.js
index 8d7a8e4270..75f0deea6c 100644
--- a/master/search/all_16.js
+++ b/master/search/all_16.js
@@ -1,9 +1,9 @@
 var searchData=
 [
-  ['_7ematrixmirror_526',['~MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a2eeef61985e20a9218d55e76548acfb5',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::~MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ae24915137508619315773c7a416f902f',1,'dlaf::matrix::MatrixMirror::~MatrixMirror()']]],
-  ['_7ememorychunk_527',['~MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html#a597aa1c075db44808f7e14c9ec03e50b',1,'dlaf::memory::MemoryChunk']]],
-  ['_7empi_5finit_528',['~mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html#a2413c9dc23983c5790cd0ebb3bb9e057',1,'dlaf::comm::mpi_init']]],
-  ['_7epanel_529',['~Panel',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adab53d11d9904715b775df7c23ba6682',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['_7etile_530',['~Tile',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a66f6b8ef0f4d9168c12715d0fc1b16dc',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
-  ['_7etype_5fhandler_531',['~type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8fab81a168aa4f3441deb1a01f4a5171',1,'dlaf::comm::internal::type_handler']]]
+  ['_7ematrixmirror_530',['~MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a2eeef61985e20a9218d55e76548acfb5',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::~MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ae24915137508619315773c7a416f902f',1,'dlaf::matrix::MatrixMirror::~MatrixMirror()']]],
+  ['_7ememorychunk_531',['~MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html#a597aa1c075db44808f7e14c9ec03e50b',1,'dlaf::memory::MemoryChunk']]],
+  ['_7empi_5finit_532',['~mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html#a2413c9dc23983c5790cd0ebb3bb9e057',1,'dlaf::comm::mpi_init']]],
+  ['_7epanel_533',['~Panel',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adab53d11d9904715b775df7c23ba6682',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['_7etile_534',['~Tile',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a66f6b8ef0f4d9168c12715d0fc1b16dc',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
+  ['_7etype_5fhandler_535',['~type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8fab81a168aa4f3441deb1a01f4a5171',1,'dlaf::comm::internal::type_handler']]]
 ];
diff --git a/master/search/all_3.js b/master/search/all_3.js
index 1ac20e1cbb..1b3ce8f659 100644
--- a/master/search/all_3.js
+++ b/master/search/all_3.js
@@ -1,8 +1,8 @@
 var searchData=
 [
-  ['data_97',['data',['../classdlaf_1_1comm_1_1_message.html#a3684d7d2edac45401785fa9e8561eb73',1,'dlaf::comm::Message::data()'],['../structdlaf_1_1common_1_1_data_descriptor.html#a6f93fef2051c96e6b0100bcb50c280e2',1,'dlaf::common::DataDescriptor::data()']]],
+  ['data_97',['data',['../structdlaf_1_1common_1_1_data_descriptor.html#a6f93fef2051c96e6b0100bcb50c280e2',1,'dlaf::common::DataDescriptor::data()'],['../classdlaf_1_1comm_1_1_message.html#a3684d7d2edac45401785fa9e8561eb73',1,'dlaf::comm::Message::data()']]],
   ['data_2eh_98',['data.h',['../data_8h.html',1,'']]],
-  ['data_5f_99',['data_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a0aadac7bac5b0878d00305d21666c342',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::data_()'],['../classdlaf_1_1comm_1_1_message.html#a93caa3c42cfc16e9a27c65c37fa42c72',1,'dlaf::comm::Message::data_()']]],
+  ['data_5f_99',['data_',['../classdlaf_1_1comm_1_1_message.html#a93caa3c42cfc16e9a27c65c37fa42c72',1,'dlaf::comm::Message::data_()'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a0aadac7bac5b0878d00305d21666c342',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::data_()']]],
   ['data_5fblocksize_100',['data_blocksize',['../data_8h.html#aee766fd59c4a4d3c428082b37b54ea81',1,'dlaf::common']]],
   ['data_5fcount_101',['data_count',['../data_8h.html#a4b0d72a2fdf94917b5641c25c86bcf18',1,'dlaf::common']]],
   ['data_5fdescriptor_2eh_102',['data_descriptor.h',['../data__descriptor_8h.html',1,'']]],
@@ -14,7 +14,7 @@ var searchData=
   ['data_5ftraits_3c_20buffer_3c_20t_20_3e_20_3e_108',['data_traits&lt; Buffer&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_buffer_3_01_t_01_4_01_4.html',1,'dlaf::common']]],
   ['data_5ftraits_3c_20datadescriptor_3c_20t_20_3e_20_3e_109',['data_traits&lt; DataDescriptor&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_data_descriptor_3_01_t_01_4_01_4.html',1,'dlaf::common']]],
   ['data_5ftraits_3c_20datadescriptor_3c_20t_5bn_5d_3e_20_3e_110',['data_traits&lt; DataDescriptor&lt; T[N]&gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_data_descriptor_3_01_t_0f_n_0e_4_01_4.html',1,'dlaf::common']]],
-  ['datadescriptor_111',['DataDescriptor',['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html#acef674017777de4a735258a476e95e47',1,'dlaf::common::DataDescriptor&lt; T[N]&gt;::DataDescriptor()'],['../structdlaf_1_1common_1_1_data_descriptor.html#acb58ba4559ea0a6022a45bb781dccc6c',1,'dlaf::common::DataDescriptor::DataDescriptor(const Data &amp;data)'],['../structdlaf_1_1common_1_1_data_descriptor.html#acd73354fd77df45c9b70ab034fc1cd61',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType num_blocks, SizeType blocksize, SizeType stride) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#a8c969a23a32e1cf2ae19a7811ae394e4',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType n) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#a87ca3689fd590f74e636317987af17bd',1,'dlaf::common::DataDescriptor::DataDescriptor()'],['../structdlaf_1_1common_1_1_data_descriptor.html',1,'dlaf::common::DataDescriptor&lt; T &gt;']]],
+  ['datadescriptor_111',['DataDescriptor',['../structdlaf_1_1common_1_1_data_descriptor.html#a8c969a23a32e1cf2ae19a7811ae394e4',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType n) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#acd73354fd77df45c9b70ab034fc1cd61',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType num_blocks, SizeType blocksize, SizeType stride) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#acb58ba4559ea0a6022a45bb781dccc6c',1,'dlaf::common::DataDescriptor::DataDescriptor(const Data &amp;data)'],['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html#acef674017777de4a735258a476e95e47',1,'dlaf::common::DataDescriptor&lt; T[N]&gt;::DataDescriptor()'],['../structdlaf_1_1common_1_1_data_descriptor.html#a87ca3689fd590f74e636317987af17bd',1,'dlaf::common::DataDescriptor::DataDescriptor()'],['../structdlaf_1_1common_1_1_data_descriptor.html',1,'dlaf::common::DataDescriptor&lt; T &gt;']]],
   ['datadescriptor_3c_20t_5bn_5d_3e_112',['DataDescriptor&lt; T[N]&gt;',['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html',1,'dlaf::common']]],
   ['datatypes_2eh_113',['datatypes.h',['../datatypes_8h.html',1,'']]],
   ['defaultbackend_114',['DefaultBackend',['../structdlaf_1_1_default_backend.html',1,'dlaf']]],
@@ -27,12 +27,13 @@ var searchData=
   ['dist_5fmatrix_5f_121',['dist_matrix_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ab991456b59d36ac84dd9277edefc42ac',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
   ['distancetoadjacenttile_122',['distanceToAdjacentTile',['../classdlaf_1_1matrix_1_1_distribution.html#aa0b67d70b8b3e6f74c53d1062546b8ed',1,'dlaf::matrix::Distribution']]],
   ['distindexing_123',['DistIndexing',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['distribution_124',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html#a97b363d57f32add582ce1774a6b9a147',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a47b322556c713fd38223538f50f58e14',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a51c38487398212457417f784dd3d2594',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a012f931d7acdf168a42445bcbbce5dd3',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})']]],
+  ['distribution_124',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html#a97b363d57f32add582ce1774a6b9a147',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a012f931d7acdf168a42445bcbbce5dd3',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a51c38487398212457417f784dd3d2594',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a47b322556c713fd38223538f50f58e14',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a146465cb553b8a9d9f32bf63ff7e7375',1,'dlaf::matrix::Distribution::Distribution(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#aacf1f8d3d02d9c70bf0bffe0725b5d92',1,'dlaf::matrix::Distribution::Distribution() noexcept']]],
   ['distribution_125',['distribution',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['distribution_126',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html#a146465cb553b8a9d9f32bf63ff7e7375',1,'dlaf::matrix::Distribution::Distribution(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#aacf1f8d3d02d9c70bf0bffe0725b5d92',1,'dlaf::matrix::Distribution::Distribution() noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html',1,'dlaf::matrix::Distribution']]],
+  ['distribution_126',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html',1,'dlaf::matrix']]],
   ['distribution_2eh_127',['distribution.h',['../distribution_8h.html',1,'']]],
   ['distworkspacehostmirror_128',['DistWorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_dist_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]],
   ['dlaf_5fmake_5fcallable_5fobject_129',['DLAF_MAKE_CALLABLE_OBJECT',['../callable__object_8h.html#a5aafa5a9c65ad07da48410427f4825b2',1,'callable_object.h']]],
   ['dlaf_5fmake_5fsender_5falgorithm_5foverloads_130',['DLAF_MAKE_SENDER_ALGORITHM_OVERLOADS',['../copy__tile_8h.html#a57758eefb97e5d9fef7405d84c90d867',1,'dlaf::matrix']]],
-  ['duplicatenocopy_131',['DuplicateNoCopy',['../structdlaf_1_1matrix_1_1_duplicate_no_copy.html',1,'dlaf::matrix']]]
+  ['done_131',['done',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::done(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::done(const GlobalTileIndex &amp;index) noexcept']]],
+  ['duplicatenocopy_132',['DuplicateNoCopy',['../structdlaf_1_1matrix_1_1_duplicate_no_copy.html',1,'dlaf::matrix']]]
 ];
diff --git a/master/search/all_4.js b/master/search/all_4.js
index c3913f62c4..a314b6685e 100644
--- a/master/search/all_4.js
+++ b/master/search/all_4.js
@@ -1,19 +1,19 @@
 var searchData=
 [
-  ['eigensolver_132',['Eigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html',1,'dlaf::eigensolver::internal']]],
-  ['eigensolver_133',['eigensolver',['../eigensolver_2eigensolver_8h.html#ad43e9ff356aafef70396fdc6b6d3a1f2',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)'],['../eigensolver_2eigensolver_8h.html#a2b99692c7224f63a547cc6686d732490',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../eigensolver_2eigensolver_8h.html#a94fb08e9087b48ae5fe19b59c9e28db8',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)'],['../eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)']]],
-  ['eigensolver_2eh_134',['eigensolver.h',['../eigensolver_2eigensolver_8h.html',1,'(Global Namespace)'],['../eigensolver_8h.html',1,'(Global Namespace)']]],
-  ['eigensolverresult_135',['EigensolverResult',['../structdlaf_1_1eigensolver_1_1_eigensolver_result.html',1,'dlaf::eigensolver']]],
-  ['elementfromtileandtileelement_136',['elementFromTileAndTileElement',['../util__distribution_8h.html#a9eab8f0da313765c25ddd2eec12665e0',1,'dlaf::util::matrix']]],
-  ['emptyenv_137',['EmptyEnv',['../structdlaf_1_1internal_1_1_empty_env.html',1,'dlaf::internal']]],
-  ['enable_5fif_5fconvertible_5ft_138',['enable_if_convertible_t',['../traits_8h.html#a234bd5c290fe869e9856e7e2d3667baf',1,'dlaf']]],
-  ['enable_5fif_5fsignature_5ft_139',['enable_if_signature_t',['../traits_8h.html#ada84be4e014ed8f3d91175b3856104e5',1,'dlaf']]],
-  ['end_5f_140',['end_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a6d52e171776a86d6a42b2e0cc7a26e7b',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['enum_5foutput_2eh_141',['enum_output.h',['../blas_2enum__output_8h.html',1,'']]],
-  ['equal_5fblocksize_142',['equal_blocksize',['../util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe',1,'dlaf::matrix']]],
-  ['equal_5fdistributions_143',['equal_distributions',['../util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2',1,'dlaf::matrix']]],
-  ['equal_5fprocess_5fgrid_144',['equal_process_grid',['../util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c',1,'dlaf::matrix']]],
-  ['equal_5fsize_145',['equal_size',['../util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302',1,'dlaf::matrix']]],
-  ['error_2eh_146',['error.h',['../communication_2error_8h.html',1,'']]],
-  ['external_5f_147',['external_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a785fd3e6c916a2ae30efb17f3449c230',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['eigensolver_133',['Eigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html',1,'dlaf::eigensolver::internal']]],
+  ['eigensolver_134',['eigensolver',['../eigensolver_2eigensolver_8h.html#ad43e9ff356aafef70396fdc6b6d3a1f2',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)'],['../eigensolver_2eigensolver_8h.html#a2b99692c7224f63a547cc6686d732490',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../eigensolver_2eigensolver_8h.html#a94fb08e9087b48ae5fe19b59c9e28db8',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)'],['../eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)']]],
+  ['eigensolver_2eh_135',['eigensolver.h',['../eigensolver_2eigensolver_8h.html',1,'(Global Namespace)'],['../eigensolver_8h.html',1,'(Global Namespace)']]],
+  ['eigensolverresult_136',['EigensolverResult',['../structdlaf_1_1eigensolver_1_1_eigensolver_result.html',1,'dlaf::eigensolver']]],
+  ['elementfromtileandtileelement_137',['elementFromTileAndTileElement',['../util__distribution_8h.html#a9eab8f0da313765c25ddd2eec12665e0',1,'dlaf::util::matrix']]],
+  ['emptyenv_138',['EmptyEnv',['../structdlaf_1_1internal_1_1_empty_env.html',1,'dlaf::internal']]],
+  ['enable_5fif_5fconvertible_5ft_139',['enable_if_convertible_t',['../traits_8h.html#a234bd5c290fe869e9856e7e2d3667baf',1,'dlaf']]],
+  ['enable_5fif_5fsignature_5ft_140',['enable_if_signature_t',['../traits_8h.html#ada84be4e014ed8f3d91175b3856104e5',1,'dlaf']]],
+  ['end_5f_141',['end_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a6d52e171776a86d6a42b2e0cc7a26e7b',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['enum_5foutput_2eh_142',['enum_output.h',['../blas_2enum__output_8h.html',1,'']]],
+  ['equal_5fblocksize_143',['equal_blocksize',['../util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe',1,'dlaf::matrix']]],
+  ['equal_5fdistributions_144',['equal_distributions',['../util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2',1,'dlaf::matrix']]],
+  ['equal_5fprocess_5fgrid_145',['equal_process_grid',['../util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c',1,'dlaf::matrix']]],
+  ['equal_5fsize_146',['equal_size',['../util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302',1,'dlaf::matrix']]],
+  ['error_2eh_147',['error.h',['../communication_2error_8h.html',1,'']]],
+  ['external_5f_148',['external_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a785fd3e6c916a2ae30efb17f3449c230',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/search/all_5.js b/master/search/all_5.js
index 9b674bf340..fdaf360602 100644
--- a/master/search/all_5.js
+++ b/master/search/all_5.js
@@ -1,10 +1,10 @@
 var searchData=
 [
-  ['factorization_2eh_148',['factorization.h',['../factorization_8h.html',1,'']]],
-  ['finalize_149',['finalize',['../init_8h.html#abf5448f6d8cff5d741a7680123a7082c',1,'dlaf']]],
-  ['format_5fshort_2eh_150',['format_short.h',['../format__short_8h.html',1,'']]],
-  ['formatshort_151',['FormatShort',['../structdlaf_1_1internal_1_1_format_short.html',1,'dlaf::internal']]],
-  ['fullcommunicator_152',['fullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#a1cb5842312d3e88e298819ea192d286d',1,'dlaf::comm::CommunicatorGrid']]],
-  ['fullindex_153',['fullIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a709e5ba882750052d23a5a8eb1eff21a',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['functions_5fsync_2eh_154',['functions_sync.h',['../functions__sync_8h.html',1,'']]]
+  ['factorization_2eh_149',['factorization.h',['../factorization_8h.html',1,'']]],
+  ['finalize_150',['finalize',['../init_8h.html#abf5448f6d8cff5d741a7680123a7082c',1,'dlaf']]],
+  ['format_5fshort_2eh_151',['format_short.h',['../format__short_8h.html',1,'']]],
+  ['formatshort_152',['FormatShort',['../structdlaf_1_1internal_1_1_format_short.html',1,'dlaf::internal']]],
+  ['fullcommunicator_153',['fullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#a1cb5842312d3e88e298819ea192d286d',1,'dlaf::comm::CommunicatorGrid']]],
+  ['fullindex_154',['fullIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a709e5ba882750052d23a5a8eb1eff21a',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['functions_5fsync_2eh_155',['functions_sync.h',['../functions__sync_8h.html',1,'']]]
 ];
diff --git a/master/search/all_6.js b/master/search/all_6.js
index 249715a933..20bade51eb 100644
--- a/master/search/all_6.js
+++ b/master/search/all_6.js
@@ -1,31 +1,31 @@
 var searchData=
 [
-  ['gemm_155',['gemm',['../blas_2tile_8h.html#a8e495a0a86ddf2f997ca8a7c33d106a2',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#afed112b0e26de470da2469d43866918d',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a1de961c6e1c01ee6a5f0039ecf51b162',1,'dlaf::tile::gemm(const blas::Op op_a, const blas::Op op_b, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)']]],
-  ['gemmsizes_156',['gemmSizes',['../structdlaf_1_1tile_1_1internal_1_1gemm_sizes.html',1,'dlaf::tile::internal']]],
-  ['gen_5feigensolver_2eh_157',['gen_eigensolver.h',['../gen__eigensolver_8h.html',1,'']]],
-  ['gen_5fto_5fstd_2eh_158',['gen_to_std.h',['../gen__to__std_8h.html',1,'']]],
-  ['geneigensolver_159',['GenEigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html',1,'dlaf::eigensolver::internal']]],
-  ['geneigensolver_160',['genEigensolver',['../gen__eigensolver_8h.html#ad60b7fb5135b8ea685d781e4e4165c47',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)'],['../gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../gen__eigensolver_8h.html#a9d80f2453da0de6a6ad73c55165f7f52',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../gen__eigensolver_8h.html#a7578fbe49ba90d7ef916ac81860c3858',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)']]],
-  ['general_2eh_161',['general.h',['../multiplication_2general_8h.html',1,'(Global Namespace)'],['../permutations_2general_8h.html',1,'(Global Namespace)']]],
-  ['generalsub_162',['GeneralSub',['../structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html',1,'dlaf::multiplication::internal']]],
-  ['generalsubmatrix_163',['generalSubMatrix',['../multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93',1,'dlaf::multiplication::generalSubMatrix(const SizeType a, const SizeType b, const blas::Op opA, const blas::Op opB, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../multiplication_2general_8h.html#a0aa788470aca6ca60202513251578a36',1,'dlaf::multiplication::generalSubMatrix([[maybe_unused]] comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;row_task_chain, common::Pipeline&lt; comm::Communicator &gt; &amp;col_task_chain, const SizeType a, const SizeType b, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]],
-  ['generic_5finteger_5fop_164',['generic_integer_op',['../util__math_8h.html#a4a1c1045d16c92d7fef9c553ae8e6c90',1,'dlaf::util::internal']]],
-  ['gentostd_165',['GenToStd',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html',1,'dlaf::eigensolver::internal']]],
-  ['gentostd_166',['genToStd',['../gen__to__std_8h.html#a1c178c1c870afbc1c4928a4dbe078aa4',1,'dlaf::eigensolver::genToStd(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f',1,'dlaf::eigensolver::genToStd(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
-  ['get_167',['get',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#a8b053672d5ecf63c2af3a3c23677278b',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#ad2cba1bf3133441bc31d960d2681cf11',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#aa0d470acb7c2f97a7192c06fceef7b32',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ad5eaeb945174c2c237a672dd4191582a',1,'dlaf::matrix::MatrixMirror::get()'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a23701a66458fad55204f90b84674a8e2',1,'dlaf::common::internal::basic_coords::get()']]],
-  ['getheight_168',['getHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad59bcb70b44cf2a4a61119d8ce4eb5db',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['getoptionsdescription_169',['getOptionsDescription',['../init_8h.html#a6f4711b407727e4b9317d252b451bd89',1,'dlaf']]],
-  ['getsource_170',['getSource',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a2fb277eb0664e0e6ed0e8a011416c7c7',1,'dlaf::matrix::MatrixMirror::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a424e6b85bb0167015efbb7522a31d7fa',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a348f9f6d9af5df67ef6179e4f600850e',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#af6ab705620e03736d36433f0846470fc',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::getSource()']]],
-  ['getter_5frandom_171',['getter_random',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html',1,'dlaf::matrix::util::internal']]],
-  ['getter_5frandom_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_172',['getter_random&lt; std::complex&lt; T &gt; &gt;',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::util::internal']]],
-  ['getwidth_173',['getWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa34a2e93ba64d958df32428f3928ccba',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['givensrotation_174',['GivensRotation',['../structdlaf_1_1eigensolver_1_1internal_1_1_givens_rotation.html',1,'dlaf::eigensolver::internal']]],
-  ['globalelementfromglobaltileandtileelement_175',['globalElementFromGlobalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#aed7a91383a0146b02008c6d6bfed2850',1,'dlaf::matrix::Distribution']]],
-  ['globalelementfromlocaltileandtileelement_176',['globalElementFromLocalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#a36c1a5962e433c773a924d8b5bdda594',1,'dlaf::matrix::Distribution']]],
-  ['globalelementindex_177',['globalElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5',1,'dlaf::matrix::Distribution']]],
-  ['globaltileelementdistance_178',['globalTileElementDistance',['../classdlaf_1_1matrix_1_1_distribution.html#a9f57d9074212c024d39f0e971bc9e5db',1,'dlaf::matrix::Distribution']]],
-  ['globaltilefromglobalelement_179',['globalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d',1,'dlaf::matrix::Distribution']]],
-  ['globaltilefromlocaltile_180',['globalTileFromLocalTile',['../classdlaf_1_1matrix_1_1_distribution.html#add4b487f6603fb6099dce376ee2e8c3c',1,'dlaf::matrix::Distribution::globalTileFromLocalTile()'],['../util__distribution_8h.html#a3fa80781a6b118e00015b9751e2f6ead',1,'dlaf::util::matrix::globalTileFromLocalTile()']]],
-  ['globaltileindex_181',['globalTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a7a0027799c7c187d8f7135a1242ca3f5',1,'dlaf::matrix::Distribution::globalTileIndex(const LocalTileIndex &amp;local_tile) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299',1,'dlaf::matrix::Distribution::globalTileIndex(const GlobalElementIndex &amp;global_element) const noexcept']]],
-  ['globaltilelinearindex_182',['globalTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a0b174a696d5fe710ecb2bc081081c137',1,'dlaf::matrix::Distribution']]]
+  ['gemm_156',['gemm',['../blas_2tile_8h.html#a8e495a0a86ddf2f997ca8a7c33d106a2',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#afed112b0e26de470da2469d43866918d',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a1de961c6e1c01ee6a5f0039ecf51b162',1,'dlaf::tile::gemm(const blas::Op op_a, const blas::Op op_b, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)']]],
+  ['gemmsizes_157',['gemmSizes',['../structdlaf_1_1tile_1_1internal_1_1gemm_sizes.html',1,'dlaf::tile::internal']]],
+  ['gen_5feigensolver_2eh_158',['gen_eigensolver.h',['../gen__eigensolver_8h.html',1,'']]],
+  ['gen_5fto_5fstd_2eh_159',['gen_to_std.h',['../gen__to__std_8h.html',1,'']]],
+  ['geneigensolver_160',['GenEigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html',1,'dlaf::eigensolver::internal']]],
+  ['geneigensolver_161',['genEigensolver',['../gen__eigensolver_8h.html#ad60b7fb5135b8ea685d781e4e4165c47',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)'],['../gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../gen__eigensolver_8h.html#a9d80f2453da0de6a6ad73c55165f7f52',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../gen__eigensolver_8h.html#a7578fbe49ba90d7ef916ac81860c3858',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)']]],
+  ['general_2eh_162',['general.h',['../multiplication_2general_8h.html',1,'(Global Namespace)'],['../permutations_2general_8h.html',1,'(Global Namespace)']]],
+  ['generalsub_163',['GeneralSub',['../structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html',1,'dlaf::multiplication::internal']]],
+  ['generalsubmatrix_164',['generalSubMatrix',['../multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93',1,'dlaf::multiplication::generalSubMatrix(const SizeType a, const SizeType b, const blas::Op opA, const blas::Op opB, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../multiplication_2general_8h.html#a0aa788470aca6ca60202513251578a36',1,'dlaf::multiplication::generalSubMatrix([[maybe_unused]] comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;row_task_chain, common::Pipeline&lt; comm::Communicator &gt; &amp;col_task_chain, const SizeType a, const SizeType b, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]],
+  ['generic_5finteger_5fop_165',['generic_integer_op',['../util__math_8h.html#a4a1c1045d16c92d7fef9c553ae8e6c90',1,'dlaf::util::internal']]],
+  ['gentostd_166',['GenToStd',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html',1,'dlaf::eigensolver::internal']]],
+  ['gentostd_167',['genToStd',['../gen__to__std_8h.html#a1c178c1c870afbc1c4928a4dbe078aa4',1,'dlaf::eigensolver::genToStd(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f',1,'dlaf::eigensolver::genToStd(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
+  ['get_168',['get',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#a8b053672d5ecf63c2af3a3c23677278b',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#ad2cba1bf3133441bc31d960d2681cf11',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#aa0d470acb7c2f97a7192c06fceef7b32',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ad5eaeb945174c2c237a672dd4191582a',1,'dlaf::matrix::MatrixMirror::get()'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a23701a66458fad55204f90b84674a8e2',1,'dlaf::common::internal::basic_coords::get()']]],
+  ['getheight_169',['getHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad59bcb70b44cf2a4a61119d8ce4eb5db',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['getoptionsdescription_170',['getOptionsDescription',['../init_8h.html#a6f4711b407727e4b9317d252b451bd89',1,'dlaf']]],
+  ['getsource_171',['getSource',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a2fb277eb0664e0e6ed0e8a011416c7c7',1,'dlaf::matrix::MatrixMirror::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a424e6b85bb0167015efbb7522a31d7fa',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a348f9f6d9af5df67ef6179e4f600850e',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#af6ab705620e03736d36433f0846470fc',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::getSource()']]],
+  ['getter_5frandom_172',['getter_random',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html',1,'dlaf::matrix::util::internal']]],
+  ['getter_5frandom_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_173',['getter_random&lt; std::complex&lt; T &gt; &gt;',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::util::internal']]],
+  ['getwidth_174',['getWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa34a2e93ba64d958df32428f3928ccba',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['givensrotation_175',['GivensRotation',['../structdlaf_1_1eigensolver_1_1internal_1_1_givens_rotation.html',1,'dlaf::eigensolver::internal']]],
+  ['globalelementfromglobaltileandtileelement_176',['globalElementFromGlobalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#aed7a91383a0146b02008c6d6bfed2850',1,'dlaf::matrix::Distribution']]],
+  ['globalelementfromlocaltileandtileelement_177',['globalElementFromLocalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#a36c1a5962e433c773a924d8b5bdda594',1,'dlaf::matrix::Distribution']]],
+  ['globalelementindex_178',['globalElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5',1,'dlaf::matrix::Distribution']]],
+  ['globaltileelementdistance_179',['globalTileElementDistance',['../classdlaf_1_1matrix_1_1_distribution.html#a9f57d9074212c024d39f0e971bc9e5db',1,'dlaf::matrix::Distribution']]],
+  ['globaltilefromglobalelement_180',['globalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d',1,'dlaf::matrix::Distribution']]],
+  ['globaltilefromlocaltile_181',['globalTileFromLocalTile',['../classdlaf_1_1matrix_1_1_distribution.html#add4b487f6603fb6099dce376ee2e8c3c',1,'dlaf::matrix::Distribution::globalTileFromLocalTile()'],['../util__distribution_8h.html#a3fa80781a6b118e00015b9751e2f6ead',1,'dlaf::util::matrix::globalTileFromLocalTile()']]],
+  ['globaltileindex_182',['globalTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a7a0027799c7c187d8f7135a1242ca3f5',1,'dlaf::matrix::Distribution::globalTileIndex(const LocalTileIndex &amp;local_tile) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299',1,'dlaf::matrix::Distribution::globalTileIndex(const GlobalElementIndex &amp;global_element) const noexcept']]],
+  ['globaltilelinearindex_183',['globalTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a0b174a696d5fe710ecb2bc081081c137',1,'dlaf::matrix::Distribution']]]
 ];
diff --git a/master/search/all_7.js b/master/search/all_7.js
index e2e4ab3a7c..a2bc68adcb 100644
--- a/master/search/all_7.js
+++ b/master/search/all_7.js
@@ -1,21 +1,21 @@
 var searchData=
 [
-  ['hegst_183',['hegst',['../lapack_2tile_8h.html#aaf274e91e36453e7994dd1f2a2813681',1,'dlaf::tile']]],
-  ['helpers_184',['Helpers',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers.html',1,'dlaf::eigensolver::internal::bt_red_band::Helpers&lt; B &gt;'],['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers.html',1,'dlaf::factorization::internal::tfactor_l::Helpers&lt; backend, device, T &gt;']]],
-  ['helpers_3c_20backend_3a_3agpu_20_3e_185',['Helpers&lt; Backend::GPU &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_g_p_u_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
-  ['helpers_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_186',['Helpers&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
-  ['helpers_3c_20backend_3a_3amc_20_3e_187',['Helpers&lt; Backend::MC &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_m_c_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
-  ['helpers_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_188',['Helpers&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
-  ['hemm_189',['hemm',['../blas_2tile_8h.html#a8887bb899e49f4ea3acce81474f5965d',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#ab7031513f6c7338a1f3cea71784d0e9a',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#aeec422be0ef5abea8ab6f1a8ae40c8ef',1,'dlaf::tile::hemm(const blas::Side side, const blas::Uplo uplo, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)']]],
-  ['hemmsizes_190',['hemmSizes',['../structdlaf_1_1tile_1_1internal_1_1hemm_sizes.html',1,'dlaf::tile::internal']]],
-  ['her2k_191',['her2k',['../blas_2tile_8h.html#a45e96a215d6f3a7f64ccf05d108087e7',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#aafcb69907e7154cb12e0e3121534310a',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a36642d0aeb16e71f10fd289985f4a03f',1,'dlaf::tile::her2k(const blas::Uplo uplo, const blas::Op op, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)']]],
-  ['her2ksizes_192',['her2kSizes',['../structdlaf_1_1tile_1_1internal_1_1her2k_sizes.html',1,'dlaf::tile::internal']]],
-  ['herk_193',['herk',['../blas_2tile_8h.html#a72ab20a0ba5ba199c1ec18f8a31ee2eb',1,'dlaf::tile::herk(const blas::Uplo uplo, const blas::Op op, const BaseType&lt; T &gt; alpha, const Tile&lt; const T, D &gt; &amp;a, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#a8a4f39f0b26f02bc094e531add909e6e',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#aa8fd52359e36023fb6418834d4b27fcd',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['herksizes_194',['herkSizes',['../structdlaf_1_1tile_1_1internal_1_1herk_sizes.html',1,'dlaf::tile::internal']]],
-  ['hermitian_195',['Hermitian',['../structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html',1,'dlaf::multiplication::internal']]],
-  ['hermitian_196',['hermitian',['../hermitian_8h.html#a117a0b955e26513fecdc562da0f96922',1,'dlaf::multiplication::hermitian(blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../hermitian_8h.html#a3a63ff51bec2e9383f3dfd8b2914673e',1,'dlaf::multiplication::hermitian(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]],
-  ['hermitian_2eh_197',['hermitian.h',['../hermitian_8h.html',1,'']]],
-  ['hhmanager_198',['HHManager',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['hhmanager_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_199',['HHManager&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['hhmanager_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_200',['HHManager&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]]
+  ['hegst_184',['hegst',['../lapack_2tile_8h.html#aaf274e91e36453e7994dd1f2a2813681',1,'dlaf::tile']]],
+  ['helpers_185',['Helpers',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers.html',1,'dlaf::eigensolver::internal::bt_red_band::Helpers&lt; B &gt;'],['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers.html',1,'dlaf::factorization::internal::tfactor_l::Helpers&lt; backend, device, T &gt;']]],
+  ['helpers_3c_20backend_3a_3agpu_20_3e_186',['Helpers&lt; Backend::GPU &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_g_p_u_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
+  ['helpers_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_187',['Helpers&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
+  ['helpers_3c_20backend_3a_3amc_20_3e_188',['Helpers&lt; Backend::MC &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_m_c_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
+  ['helpers_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_189',['Helpers&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
+  ['hemm_190',['hemm',['../blas_2tile_8h.html#a8887bb899e49f4ea3acce81474f5965d',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#ab7031513f6c7338a1f3cea71784d0e9a',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#aeec422be0ef5abea8ab6f1a8ae40c8ef',1,'dlaf::tile::hemm(const blas::Side side, const blas::Uplo uplo, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)']]],
+  ['hemmsizes_191',['hemmSizes',['../structdlaf_1_1tile_1_1internal_1_1hemm_sizes.html',1,'dlaf::tile::internal']]],
+  ['her2k_192',['her2k',['../blas_2tile_8h.html#a45e96a215d6f3a7f64ccf05d108087e7',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#aafcb69907e7154cb12e0e3121534310a',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a36642d0aeb16e71f10fd289985f4a03f',1,'dlaf::tile::her2k(const blas::Uplo uplo, const blas::Op op, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)']]],
+  ['her2ksizes_193',['her2kSizes',['../structdlaf_1_1tile_1_1internal_1_1her2k_sizes.html',1,'dlaf::tile::internal']]],
+  ['herk_194',['herk',['../blas_2tile_8h.html#a72ab20a0ba5ba199c1ec18f8a31ee2eb',1,'dlaf::tile::herk(const blas::Uplo uplo, const blas::Op op, const BaseType&lt; T &gt; alpha, const Tile&lt; const T, D &gt; &amp;a, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#a8a4f39f0b26f02bc094e531add909e6e',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#aa8fd52359e36023fb6418834d4b27fcd',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['herksizes_195',['herkSizes',['../structdlaf_1_1tile_1_1internal_1_1herk_sizes.html',1,'dlaf::tile::internal']]],
+  ['hermitian_196',['Hermitian',['../structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html',1,'dlaf::multiplication::internal']]],
+  ['hermitian_197',['hermitian',['../hermitian_8h.html#a117a0b955e26513fecdc562da0f96922',1,'dlaf::multiplication::hermitian(blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../hermitian_8h.html#a3a63ff51bec2e9383f3dfd8b2914673e',1,'dlaf::multiplication::hermitian(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]],
+  ['hermitian_2eh_198',['hermitian.h',['../hermitian_8h.html',1,'']]],
+  ['hhmanager_199',['HHManager',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['hhmanager_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_200',['HHManager&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['hhmanager_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_201',['HHManager&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]]
 ];
diff --git a/master/search/all_8.js b/master/search/all_8.js
index c9ccfcc131..1cad0ff5e2 100644
--- a/master/search/all_8.js
+++ b/master/search/all_8.js
@@ -1,34 +1,34 @@
 var searchData=
 [
-  ['index_2eh_201',['index.h',['../index_8h.html',1,'']]],
-  ['index2d_202',['Index2D',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common::Index2D&lt; IndexT, Tag &gt;'],['../communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e',1,'dlaf::comm::Index2D()'],['../classdlaf_1_1common_1_1_index2_d.html#ae959b1b0c405d3480f9d4960946b5b2e',1,'dlaf::common::Index2D::Index2D(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#a940432586f1b501b8dda46355999335d',1,'dlaf::common::Index2D::Index2D() noexcept']]],
-  ['index2d_2eh_203',['index2d.h',['../index2d_8h.html',1,'']]],
-  ['index2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_204',['Index2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_205',['Index2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_206',['Index2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_207',['Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_208',['Index2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['indext_5fmpi_209',['IndexT_MPI',['../communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9',1,'dlaf::comm']]],
-  ['init_2eh_210',['init.h',['../communication_2init_8h.html',1,'(Global Namespace)'],['../init_8h.html',1,'(Global Namespace)']]],
-  ['initialize_211',['initialize',['../init_8h.html#a94175c61baedbcc0bf6bd53e0f57380f',1,'dlaf::initialize(int argc, const char *const argv[], const configuration &amp;user_cfg={})'],['../init_8h.html#a100757e13ff576c8a93dd7aed3ca7ec4',1,'dlaf::initialize(const pika::program_options::variables_map &amp;vm, const configuration &amp;user_cfg={})']]],
-  ['initresourcepartitionerhandler_212',['initResourcePartitionerHandler',['../init_8h.html#a3685b1a9ef2da35287ae3b03ea3b62e6',1,'dlaf']]],
-  ['internal_5f_213',['internal_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adf84f8c3806212547305082bf21ac006',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['is_5fcontiguous_214',['is_contiguous',['../structdlaf_1_1common_1_1_data_descriptor.html#ad73cebe7217dd9f3ad68190dc09bce9e',1,'dlaf::common::DataDescriptor']]],
-  ['is_5fcoord_215',['is_coord',['../structdlaf_1_1common_1_1internal_1_1is__coord.html',1,'dlaf::common::internal']]],
-  ['is_5fcoord_3c_20index2d_3c_20t_2c_20tag_20_3e_20_3e_216',['is_coord&lt; Index2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_index2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
-  ['is_5fcoord_3c_20size2d_3c_20t_2c_20tag_20_3e_20_3e_217',['is_coord&lt; Size2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_size2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
-  ['is_5fdata_218',['is_data',['../structdlaf_1_1common_1_1is__data.html',1,'dlaf::common']]],
-  ['isempty_219',['isEmpty',['../classdlaf_1_1common_1_1_size2_d.html#afe5870841ddc785db5d4c81cc22aeb93',1,'dlaf::common::Size2D']]],
-  ['isexternal_220',['isExternal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa77cf35507fc6a6291e9197996034db8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['isfalse_221',['IsFalse',['../structdlaf_1_1internal_1_1_is_false.html',1,'dlaf::internal']]],
-  ['isfloatingpointorcomplex_222',['IsFloatingPointOrComplex',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex.html',1,'dlaf::internal']]],
-  ['isfloatingpointorcomplex_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_223',['IsFloatingPointOrComplex&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::internal']]],
-  ['isin_224',['isIn',['../classdlaf_1_1common_1_1_index2_d.html#a5f174cc234af20d79923b31d7fa90b19',1,'dlaf::common::Index2D']]],
-  ['isindexinrange_225',['isIndexInRange',['../classdlaf_1_1common_1_1_iterable_range2_d.html#a833f81c7ed8c08d0e995d9c97e8aa935',1,'dlaf::common::IterableRange2D']]],
-  ['isinoron_226',['isInOrOn',['../classdlaf_1_1common_1_1_index2_d.html#ab230f7ada23f15ffd3b3d0a3921f1685',1,'dlaf::common::Index2D']]],
-  ['isvalid_227',['isValid',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a380f1ac07da35bc014bcbfff908eb0a9',1,'dlaf::common::internal::basic_coords']]],
-  ['iterablerange2d_228',['IterableRange2D',['../classdlaf_1_1common_1_1_iterable_range2_d.html',1,'dlaf::common']]],
-  ['iterate_5frange2d_229',['iterate_range2d',['../range2d_8h.html#adcdcf40345b7f03cf52e871a2420057b',1,'dlaf::common']]],
-  ['iteratorlocal_230',['iteratorLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a79626e0d68d508aca69d1114cedc38a7',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::iteratorLocal()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad',1,'dlaf::matrix::internal::View::iteratorLocal()']]],
-  ['iteratorrange2d_231',['IteratorRange2D',['../structdlaf_1_1common_1_1_iterator_range2_d.html',1,'dlaf::common']]]
+  ['index_2eh_202',['index.h',['../index_8h.html',1,'']]],
+  ['index2d_203',['Index2D',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common::Index2D&lt; IndexT, Tag &gt;'],['../communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e',1,'dlaf::comm::Index2D()'],['../classdlaf_1_1common_1_1_index2_d.html#ae959b1b0c405d3480f9d4960946b5b2e',1,'dlaf::common::Index2D::Index2D(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#a940432586f1b501b8dda46355999335d',1,'dlaf::common::Index2D::Index2D() noexcept']]],
+  ['index2d_2eh_204',['index2d.h',['../index2d_8h.html',1,'']]],
+  ['index2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_205',['Index2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_206',['Index2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_207',['Index2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_208',['Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_209',['Index2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['indext_5fmpi_210',['IndexT_MPI',['../communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9',1,'dlaf::comm']]],
+  ['init_2eh_211',['init.h',['../communication_2init_8h.html',1,'(Global Namespace)'],['../init_8h.html',1,'(Global Namespace)']]],
+  ['initialize_212',['initialize',['../init_8h.html#a94175c61baedbcc0bf6bd53e0f57380f',1,'dlaf::initialize(int argc, const char *const argv[], const configuration &amp;user_cfg={})'],['../init_8h.html#a100757e13ff576c8a93dd7aed3ca7ec4',1,'dlaf::initialize(const pika::program_options::variables_map &amp;vm, const configuration &amp;user_cfg={})']]],
+  ['initresourcepartitionerhandler_213',['initResourcePartitionerHandler',['../init_8h.html#a3685b1a9ef2da35287ae3b03ea3b62e6',1,'dlaf']]],
+  ['internal_5f_214',['internal_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adf84f8c3806212547305082bf21ac006',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['is_5fcontiguous_215',['is_contiguous',['../structdlaf_1_1common_1_1_data_descriptor.html#ad73cebe7217dd9f3ad68190dc09bce9e',1,'dlaf::common::DataDescriptor']]],
+  ['is_5fcoord_216',['is_coord',['../structdlaf_1_1common_1_1internal_1_1is__coord.html',1,'dlaf::common::internal']]],
+  ['is_5fcoord_3c_20index2d_3c_20t_2c_20tag_20_3e_20_3e_217',['is_coord&lt; Index2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_index2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
+  ['is_5fcoord_3c_20size2d_3c_20t_2c_20tag_20_3e_20_3e_218',['is_coord&lt; Size2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_size2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
+  ['is_5fdata_219',['is_data',['../structdlaf_1_1common_1_1is__data.html',1,'dlaf::common']]],
+  ['isempty_220',['isEmpty',['../classdlaf_1_1common_1_1_size2_d.html#afe5870841ddc785db5d4c81cc22aeb93',1,'dlaf::common::Size2D']]],
+  ['isexternal_221',['isExternal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa77cf35507fc6a6291e9197996034db8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['isfalse_222',['IsFalse',['../structdlaf_1_1internal_1_1_is_false.html',1,'dlaf::internal']]],
+  ['isfloatingpointorcomplex_223',['IsFloatingPointOrComplex',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex.html',1,'dlaf::internal']]],
+  ['isfloatingpointorcomplex_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_224',['IsFloatingPointOrComplex&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::internal']]],
+  ['isin_225',['isIn',['../classdlaf_1_1common_1_1_index2_d.html#a5f174cc234af20d79923b31d7fa90b19',1,'dlaf::common::Index2D']]],
+  ['isindexinrange_226',['isIndexInRange',['../classdlaf_1_1common_1_1_iterable_range2_d.html#a833f81c7ed8c08d0e995d9c97e8aa935',1,'dlaf::common::IterableRange2D']]],
+  ['isinoron_227',['isInOrOn',['../classdlaf_1_1common_1_1_index2_d.html#ab230f7ada23f15ffd3b3d0a3921f1685',1,'dlaf::common::Index2D']]],
+  ['isvalid_228',['isValid',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a380f1ac07da35bc014bcbfff908eb0a9',1,'dlaf::common::internal::basic_coords']]],
+  ['iterablerange2d_229',['IterableRange2D',['../classdlaf_1_1common_1_1_iterable_range2_d.html',1,'dlaf::common']]],
+  ['iterate_5frange2d_230',['iterate_range2d',['../range2d_8h.html#adcdcf40345b7f03cf52e871a2420057b',1,'dlaf::common']]],
+  ['iteratorlocal_231',['iteratorLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a79626e0d68d508aca69d1114cedc38a7',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::iteratorLocal()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad',1,'dlaf::matrix::internal::View::iteratorLocal()']]],
+  ['iteratorrange2d_232',['IteratorRange2D',['../structdlaf_1_1common_1_1_iterator_range2_d.html',1,'dlaf::common']]]
 ];
diff --git a/master/search/all_9.js b/master/search/all_9.js
index 24868e3d80..0215e5606b 100644
--- a/master/search/all_9.js
+++ b/master/search/all_9.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['kernels_2eh_232',['kernels.h',['../communication_2kernels_8h.html',1,'']]]
+  ['kernels_2eh_233',['kernels.h',['../communication_2kernels_8h.html',1,'']]]
 ];
diff --git a/master/search/all_a.js b/master/search/all_a.js
index 16075dbf41..3b05723af7 100644
--- a/master/search/all_a.js
+++ b/master/search/all_a.js
@@ -1,19 +1,19 @@
 var searchData=
 [
-  ['lacpy_233',['lacpy',['../util__lapack_8h.html#a2a62e0ec6768b42ae19efff5ea5e4331',1,'lapack::lacpy()'],['../lapack_2tile_8h.html#a1bbf24144aebc55d9d50bb3b53ae38f7',1,'dlaf::tile::lacpy(TileElementSize region, TileElementIndex in_idx, const Tile&lt; const T, Device::CPU &gt; &amp;in, TileElementIndex out_idx, const Tile&lt; T, Device::CPU &gt; &amp;out)'],['../lapack_2tile_8h.html#adba78fac5535c410d8bd2e6c53ff8c7d',1,'dlaf::tile::lacpy(const Tile&lt; const T, Device::CPU &gt; &amp;a, const Tile&lt; T, Device::CPU &gt; &amp;b)']]],
-  ['lange_234',['lange',['../lapack_2tile_8h.html#a839d86dad6ce772207964d76b3ad07fa',1,'dlaf::tile']]],
-  ['lantr_235',['lantr',['../lapack_2tile_8h.html#a22be986552edcbdc4a3785a72620d0ca',1,'dlaf::tile']]],
-  ['laset_236',['laset',['../lapack_2tile_8h.html#a19439efac55cc846b684ed2c6f78eb33',1,'dlaf::tile::laset()'],['../util__lapack_8h.html#a653b4d466d700c7d6d3befb51c8ca9d8',1,'lapack::laset()']]],
-  ['layout_5finfo_2eh_237',['layout_info.h',['../layout__info_8h.html',1,'']]],
-  ['layoutinfo_238',['LayoutInfo',['../classdlaf_1_1matrix_1_1_layout_info.html',1,'dlaf::matrix::LayoutInfo'],['../classdlaf_1_1matrix_1_1_layout_info.html#a8c41196b99f84410426dfdd62609b982',1,'dlaf::matrix::LayoutInfo::LayoutInfo()']]],
-  ['ld_239',['ld',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a44282c10a5112a78c95c557538f13a74',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
-  ['linearindex_240',['linearIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a1d863b84e40d0567f731413ff788a1a6',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['local_5fmatrix_241',['local_matrix',['../util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921',1,'dlaf::matrix']]],
-  ['localelementdistancefromglobaltile_242',['localElementDistanceFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#a532cc910ad683b4bf2154e5b01540e61',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(GlobalTileIndex begin, GlobalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ac0eef1aae43a7fc895cd280cac21eaa7',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(SizeType i_begin, SizeType i_end) const noexcept']]],
-  ['localelementdistancefromlocaltile_243',['localElementDistanceFromLocalTile',['../classdlaf_1_1matrix_1_1_distribution.html#ab590472ea7c2132b30b725954f8ea3c0',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(LocalTileIndex begin, LocalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#a757d638249f12dd13ffbaa95a9aba21a',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(SizeType i_loc_begin, SizeType i_loc_end) const noexcept']]],
-  ['localnrtiles_244',['localNrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34',1,'dlaf::matrix::Distribution']]],
-  ['localtilefromglobalelement_245',['localTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae812ba2b5ba6b753d733abb48acc5d72',1,'dlaf::matrix::Distribution']]],
-  ['localtilefromglobaltile_246',['localTileFromGlobalTile',['../util__distribution_8h.html#a235a8d1c90d534e32f93f2ce0e364700',1,'dlaf::util::matrix::localTileFromGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811',1,'dlaf::matrix::Distribution::localTileFromGlobalTile(SizeType global_tile) const noexcept']]],
-  ['localtileindex_247',['localTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a77f2413076c87fee45f6afb6e6e1baae',1,'dlaf::matrix::Distribution']]],
-  ['localtilelinearindex_248',['localTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a22259431b76866f2f6acfe1a47ab3ace',1,'dlaf::matrix::Distribution']]]
+  ['lacpy_234',['lacpy',['../util__lapack_8h.html#a2a62e0ec6768b42ae19efff5ea5e4331',1,'lapack::lacpy()'],['../lapack_2tile_8h.html#a1bbf24144aebc55d9d50bb3b53ae38f7',1,'dlaf::tile::lacpy(TileElementSize region, TileElementIndex in_idx, const Tile&lt; const T, Device::CPU &gt; &amp;in, TileElementIndex out_idx, const Tile&lt; T, Device::CPU &gt; &amp;out)'],['../lapack_2tile_8h.html#adba78fac5535c410d8bd2e6c53ff8c7d',1,'dlaf::tile::lacpy(const Tile&lt; const T, Device::CPU &gt; &amp;a, const Tile&lt; T, Device::CPU &gt; &amp;b)']]],
+  ['lange_235',['lange',['../lapack_2tile_8h.html#a839d86dad6ce772207964d76b3ad07fa',1,'dlaf::tile']]],
+  ['lantr_236',['lantr',['../lapack_2tile_8h.html#a22be986552edcbdc4a3785a72620d0ca',1,'dlaf::tile']]],
+  ['laset_237',['laset',['../lapack_2tile_8h.html#a19439efac55cc846b684ed2c6f78eb33',1,'dlaf::tile::laset()'],['../util__lapack_8h.html#a653b4d466d700c7d6d3befb51c8ca9d8',1,'lapack::laset()']]],
+  ['layout_5finfo_2eh_238',['layout_info.h',['../layout__info_8h.html',1,'']]],
+  ['layoutinfo_239',['LayoutInfo',['../classdlaf_1_1matrix_1_1_layout_info.html',1,'dlaf::matrix::LayoutInfo'],['../classdlaf_1_1matrix_1_1_layout_info.html#a8c41196b99f84410426dfdd62609b982',1,'dlaf::matrix::LayoutInfo::LayoutInfo()']]],
+  ['ld_240',['ld',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a44282c10a5112a78c95c557538f13a74',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
+  ['linearindex_241',['linearIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a1d863b84e40d0567f731413ff788a1a6',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['local_5fmatrix_242',['local_matrix',['../util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921',1,'dlaf::matrix']]],
+  ['localelementdistancefromglobaltile_243',['localElementDistanceFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#a532cc910ad683b4bf2154e5b01540e61',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(GlobalTileIndex begin, GlobalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ac0eef1aae43a7fc895cd280cac21eaa7',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(SizeType i_begin, SizeType i_end) const noexcept']]],
+  ['localelementdistancefromlocaltile_244',['localElementDistanceFromLocalTile',['../classdlaf_1_1matrix_1_1_distribution.html#ab590472ea7c2132b30b725954f8ea3c0',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(LocalTileIndex begin, LocalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#a757d638249f12dd13ffbaa95a9aba21a',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(SizeType i_loc_begin, SizeType i_loc_end) const noexcept']]],
+  ['localnrtiles_245',['localNrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34',1,'dlaf::matrix::Distribution']]],
+  ['localtilefromglobalelement_246',['localTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae812ba2b5ba6b753d733abb48acc5d72',1,'dlaf::matrix::Distribution']]],
+  ['localtilefromglobaltile_247',['localTileFromGlobalTile',['../util__distribution_8h.html#a235a8d1c90d534e32f93f2ce0e364700',1,'dlaf::util::matrix::localTileFromGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811',1,'dlaf::matrix::Distribution::localTileFromGlobalTile(SizeType global_tile) const noexcept']]],
+  ['localtileindex_248',['localTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a77f2413076c87fee45f6afb6e6e1baae',1,'dlaf::matrix::Distribution']]],
+  ['localtilelinearindex_249',['localTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a22259431b76866f2f6acfe1a47ab3ace',1,'dlaf::matrix::Distribution']]]
 ];
diff --git a/master/search/all_b.js b/master/search/all_b.js
index 97eab69e49..812b891d72 100644
--- a/master/search/all_b.js
+++ b/master/search/all_b.js
@@ -1,41 +1,41 @@
 var searchData=
 [
-  ['make_5fcommunicator_5fmanaged_249',['make_communicator_managed',['../communicator_8h.html#a8b7bf4fa5dfb408439c9c93ce3ebb216',1,'dlaf::comm::make_communicator_managed()'],['../classdlaf_1_1comm_1_1_communicator.html#ada042e7529d465519d9fb98e004d6a55',1,'dlaf::comm::Communicator::make_communicator_managed()']]],
-  ['make_5fcontiguous_250',['make_contiguous',['../data__descriptor_8h.html#a96a67d2223bad7ea28fcca7041877560',1,'dlaf::common']]],
-  ['make_5fdata_251',['make_data',['../data_8h.html#aa3aa1962f3a8382cbf457db22c8ca48f',1,'dlaf::common::make_data(T &amp;&amp;data, Ts &amp;&amp;... args) noexcept'],['../data_8h.html#ae8a4cf6d87f0a72e5daad8a35478f051',1,'dlaf::common::make_data(Data &amp;&amp;data) noexcept']]],
-  ['make_5fmessage_252',['make_message',['../message_8h.html#a256282d96e42c4ff2e6353ae28263422',1,'dlaf::comm']]],
-  ['matrix_253',['Matrix',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix::Matrix&lt; T, D &gt;'],['../classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout, ElementType *ptr) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49',1,'dlaf::matrix::Matrix::Matrix(const LayoutInfo &amp;layout, ElementType *ptr)'],['../classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution)'],['../classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023',1,'dlaf::matrix::Matrix::Matrix(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm)'],['../classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779',1,'dlaf::matrix::Matrix::Matrix(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)']]],
-  ['matrix_2eh_254',['matrix.h',['../matrix_8h.html',1,'']]],
-  ['matrix_3c_20const_20t_2c_20d_20_3e_255',['Matrix&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20const_20t_2c_20source_20_3e_256',['Matrix&lt; const T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20const_20t_2c_20sourcetarget_20_3e_257',['Matrix&lt; const T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20t_2c_20source_20_3e_258',['Matrix&lt; T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20t_2c_20sourcetarget_20_3e_259',['Matrix&lt; T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20t_2c_20target_20_3e_260',['Matrix&lt; T, Target &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_5fbase_2eh_261',['matrix_base.h',['../matrix__base_8h.html',1,'']]],
-  ['matrix_5fmirror_2eh_262',['matrix_mirror.h',['../matrix__mirror_8h.html',1,'']]],
-  ['matrixbase_263',['MatrixBase',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html',1,'dlaf::matrix::internal']]],
-  ['matrixmirror_264',['MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror.html',1,'dlaf::matrix::MatrixMirror&lt; T, Target, Source &gt;'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#ab4b4d7a17b5f0ae45d301ef415f41b29',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a66b7ac6e591f693cd7bb8119955055fc',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#ac9dfb2578a5c94b8cf6bf0d5b3186979',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a355ab06273bb75ba0fb40119829d2aa0',1,'dlaf::matrix::MatrixMirror::MatrixMirror()']]],
-  ['matrixmirror_3c_20const_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_265',['MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
-  ['matrixmirror_3c_20const_20t_2c_20target_2c_20source_20_3e_266',['MatrixMirror&lt; const T, Target, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html',1,'dlaf::matrix']]],
-  ['matrixmirror_3c_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_267',['MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
-  ['memory_5fchunk_2eh_268',['memory_chunk.h',['../memory__chunk_8h.html',1,'']]],
-  ['memory_5fview_2eh_269',['memory_view.h',['../memory__view_8h.html',1,'']]],
-  ['memorychunk_270',['MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html',1,'dlaf::memory::MemoryChunk&lt; T, D &gt;'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ab7a334b89c214fe25ffde4bf0fd4e802',1,'dlaf::memory::MemoryChunk::MemoryChunk(MemoryChunk &amp;&amp;rhs) noexcept'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a8855d0d0e0c35c83394ce82cd14ea36d',1,'dlaf::memory::MemoryChunk::MemoryChunk(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a53cffddd0ddfd2e1e0db839157a58913',1,'dlaf::memory::MemoryChunk::MemoryChunk(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a4059fde641a91f8cac05721fb54c749b',1,'dlaf::memory::MemoryChunk::MemoryChunk()']]],
-  ['memoryview_271',['MemoryView',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory::MemoryView&lt; T, D &gt;'],['../classdlaf_1_1memory_1_1_memory_view.html#aa0752bb38aa279bd6260e2d440b8ca7d',1,'dlaf::memory::MemoryView::MemoryView()'],['../classdlaf_1_1memory_1_1_memory_view.html#a0650b61938741469c7583d671240619d',1,'dlaf::memory::MemoryView::MemoryView(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a0835f719277ae4f7b97c68d097a07071',1,'dlaf::memory::MemoryView::MemoryView(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a76c5e9d28626abb2991dd6ad1ce460c7',1,'dlaf::memory::MemoryView::MemoryView(const MemoryView &amp;memory_view, SizeType offset, SizeType size)']]],
-  ['memoryview_3c_20t_2c_20device_3a_3acpu_20_3e_272',['MemoryView&lt; T, Device::CPU &gt;',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory']]],
-  ['message_273',['Message',['../classdlaf_1_1comm_1_1_message.html',1,'dlaf::comm::Message&lt; Data &gt;'],['../classdlaf_1_1comm_1_1_message.html#aa0a15382490f3f628d14f734aeddf285',1,'dlaf::comm::Message::Message()']]],
-  ['message_2eh_274',['message.h',['../message_8h.html',1,'']]],
-  ['minmemsize_275',['minMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#ad51fa263d160dce4f4db2943720d2506',1,'dlaf::matrix::LayoutInfo']]],
-  ['mintilememsize_276',['minTileMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#a90af3a4b4a456d3107dec3eb4c207c29',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const LocalTileIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_layout_info.html#aa13f1acc6c4df1d0e0c11204d3c81ba0',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const TileElementSize &amp;tile_size) const noexcept']]],
-  ['movenonconsttile_277',['moveNonConstTile',['../structdlaf_1_1internal_1_1move_non_const_tile.html',1,'dlaf::internal']]],
-  ['mpi_5fcall_278',['mpi_call',['../communication_2error_8h.html#aa640fad0edb091d239f68708fbe00103',1,'dlaf::internal']]],
-  ['mpi_5fdatatype_279',['mpi_datatype',['../structdlaf_1_1comm_1_1mpi__datatype.html',1,'dlaf::comm']]],
-  ['mpi_5fdatatype_3c_20const_20t_20_3e_280',['mpi_datatype&lt; const T &gt;',['../structdlaf_1_1comm_1_1mpi__datatype_3_01const_01_t_01_4.html',1,'dlaf::comm']]],
-  ['mpi_5finit_281',['mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html',1,'dlaf::comm::mpi_init'],['../structdlaf_1_1comm_1_1mpi__init.html#a415e55c02e205e6f782ff7000755c842',1,'dlaf::comm::mpi_init::mpi_init()']]],
-  ['mpi_5ftype_282',['mpi_type',['../classdlaf_1_1comm_1_1_message.html#ac9fa892f3513f9b60ad178d1f788f0af',1,'dlaf::comm::Message']]],
-  ['mpicallhelper_283',['MPICallHelper',['../structdlaf_1_1comm_1_1internal_1_1_m_p_i_call_helper.html',1,'dlaf::comm::internal']]],
-  ['mul_284',['mul',['../util__math_8h.html#a77a106250e33d119c5415546f6b74544',1,'dlaf::util::size_t::mul()'],['../util__math_8h.html#a090c5b89334c2c21574610d8f0881b67',1,'dlaf::util::ptrdiff_t::mul()']]],
-  ['multipliable_285',['multipliable',['../util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86',1,'dlaf::matrix']]],
-  ['multipliable_5fsizes_286',['multipliable_sizes',['../util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400',1,'dlaf::matrix']]]
+  ['make_5fcommunicator_5fmanaged_250',['make_communicator_managed',['../communicator_8h.html#a8b7bf4fa5dfb408439c9c93ce3ebb216',1,'dlaf::comm::make_communicator_managed()'],['../classdlaf_1_1comm_1_1_communicator.html#ada042e7529d465519d9fb98e004d6a55',1,'dlaf::comm::Communicator::make_communicator_managed()']]],
+  ['make_5fcontiguous_251',['make_contiguous',['../data__descriptor_8h.html#a96a67d2223bad7ea28fcca7041877560',1,'dlaf::common']]],
+  ['make_5fdata_252',['make_data',['../data_8h.html#aa3aa1962f3a8382cbf457db22c8ca48f',1,'dlaf::common::make_data(T &amp;&amp;data, Ts &amp;&amp;... args) noexcept'],['../data_8h.html#ae8a4cf6d87f0a72e5daad8a35478f051',1,'dlaf::common::make_data(Data &amp;&amp;data) noexcept']]],
+  ['make_5fmessage_253',['make_message',['../message_8h.html#a256282d96e42c4ff2e6353ae28263422',1,'dlaf::comm']]],
+  ['matrix_254',['Matrix',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix::Matrix&lt; T, D &gt;'],['../classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout, ElementType *ptr) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49',1,'dlaf::matrix::Matrix::Matrix(const LayoutInfo &amp;layout, ElementType *ptr)'],['../classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution)'],['../classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023',1,'dlaf::matrix::Matrix::Matrix(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm)'],['../classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779',1,'dlaf::matrix::Matrix::Matrix(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)']]],
+  ['matrix_2eh_255',['matrix.h',['../matrix_8h.html',1,'']]],
+  ['matrix_3c_20const_20t_2c_20d_20_3e_256',['Matrix&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20const_20t_2c_20source_20_3e_257',['Matrix&lt; const T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20const_20t_2c_20sourcetarget_20_3e_258',['Matrix&lt; const T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20t_2c_20source_20_3e_259',['Matrix&lt; T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20t_2c_20sourcetarget_20_3e_260',['Matrix&lt; T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20t_2c_20target_20_3e_261',['Matrix&lt; T, Target &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_5fbase_2eh_262',['matrix_base.h',['../matrix__base_8h.html',1,'']]],
+  ['matrix_5fmirror_2eh_263',['matrix_mirror.h',['../matrix__mirror_8h.html',1,'']]],
+  ['matrixbase_264',['MatrixBase',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html',1,'dlaf::matrix::internal']]],
+  ['matrixmirror_265',['MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror.html',1,'dlaf::matrix::MatrixMirror&lt; T, Target, Source &gt;'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#ab4b4d7a17b5f0ae45d301ef415f41b29',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a66b7ac6e591f693cd7bb8119955055fc',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#ac9dfb2578a5c94b8cf6bf0d5b3186979',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a355ab06273bb75ba0fb40119829d2aa0',1,'dlaf::matrix::MatrixMirror::MatrixMirror()']]],
+  ['matrixmirror_3c_20const_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_266',['MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
+  ['matrixmirror_3c_20const_20t_2c_20target_2c_20source_20_3e_267',['MatrixMirror&lt; const T, Target, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html',1,'dlaf::matrix']]],
+  ['matrixmirror_3c_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_268',['MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
+  ['memory_5fchunk_2eh_269',['memory_chunk.h',['../memory__chunk_8h.html',1,'']]],
+  ['memory_5fview_2eh_270',['memory_view.h',['../memory__view_8h.html',1,'']]],
+  ['memorychunk_271',['MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html',1,'dlaf::memory::MemoryChunk&lt; T, D &gt;'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ab7a334b89c214fe25ffde4bf0fd4e802',1,'dlaf::memory::MemoryChunk::MemoryChunk(MemoryChunk &amp;&amp;rhs) noexcept'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a8855d0d0e0c35c83394ce82cd14ea36d',1,'dlaf::memory::MemoryChunk::MemoryChunk(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a53cffddd0ddfd2e1e0db839157a58913',1,'dlaf::memory::MemoryChunk::MemoryChunk(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a4059fde641a91f8cac05721fb54c749b',1,'dlaf::memory::MemoryChunk::MemoryChunk()']]],
+  ['memoryview_272',['MemoryView',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory::MemoryView&lt; T, D &gt;'],['../classdlaf_1_1memory_1_1_memory_view.html#aa0752bb38aa279bd6260e2d440b8ca7d',1,'dlaf::memory::MemoryView::MemoryView()'],['../classdlaf_1_1memory_1_1_memory_view.html#a0650b61938741469c7583d671240619d',1,'dlaf::memory::MemoryView::MemoryView(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a0835f719277ae4f7b97c68d097a07071',1,'dlaf::memory::MemoryView::MemoryView(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a76c5e9d28626abb2991dd6ad1ce460c7',1,'dlaf::memory::MemoryView::MemoryView(const MemoryView &amp;memory_view, SizeType offset, SizeType size)']]],
+  ['memoryview_3c_20t_2c_20device_3a_3acpu_20_3e_273',['MemoryView&lt; T, Device::CPU &gt;',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory']]],
+  ['message_274',['Message',['../classdlaf_1_1comm_1_1_message.html',1,'dlaf::comm::Message&lt; Data &gt;'],['../classdlaf_1_1comm_1_1_message.html#aa0a15382490f3f628d14f734aeddf285',1,'dlaf::comm::Message::Message()']]],
+  ['message_2eh_275',['message.h',['../message_8h.html',1,'']]],
+  ['minmemsize_276',['minMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#ad51fa263d160dce4f4db2943720d2506',1,'dlaf::matrix::LayoutInfo']]],
+  ['mintilememsize_277',['minTileMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#a90af3a4b4a456d3107dec3eb4c207c29',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const LocalTileIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_layout_info.html#aa13f1acc6c4df1d0e0c11204d3c81ba0',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const TileElementSize &amp;tile_size) const noexcept']]],
+  ['movenonconsttile_278',['moveNonConstTile',['../structdlaf_1_1internal_1_1move_non_const_tile.html',1,'dlaf::internal']]],
+  ['mpi_5fcall_279',['mpi_call',['../communication_2error_8h.html#aa640fad0edb091d239f68708fbe00103',1,'dlaf::internal']]],
+  ['mpi_5fdatatype_280',['mpi_datatype',['../structdlaf_1_1comm_1_1mpi__datatype.html',1,'dlaf::comm']]],
+  ['mpi_5fdatatype_3c_20const_20t_20_3e_281',['mpi_datatype&lt; const T &gt;',['../structdlaf_1_1comm_1_1mpi__datatype_3_01const_01_t_01_4.html',1,'dlaf::comm']]],
+  ['mpi_5finit_282',['mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html',1,'dlaf::comm::mpi_init'],['../structdlaf_1_1comm_1_1mpi__init.html#a415e55c02e205e6f782ff7000755c842',1,'dlaf::comm::mpi_init::mpi_init()']]],
+  ['mpi_5ftype_283',['mpi_type',['../classdlaf_1_1comm_1_1_message.html#ac9fa892f3513f9b60ad178d1f788f0af',1,'dlaf::comm::Message']]],
+  ['mpicallhelper_284',['MPICallHelper',['../structdlaf_1_1comm_1_1internal_1_1_m_p_i_call_helper.html',1,'dlaf::comm::internal']]],
+  ['mul_285',['mul',['../util__math_8h.html#a77a106250e33d119c5415546f6b74544',1,'dlaf::util::size_t::mul()'],['../util__math_8h.html#a090c5b89334c2c21574610d8f0881b67',1,'dlaf::util::ptrdiff_t::mul()']]],
+  ['multipliable_286',['multipliable',['../util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86',1,'dlaf::matrix']]],
+  ['multipliable_5fsizes_287',['multipliable_sizes',['../util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400',1,'dlaf::matrix']]]
 ];
diff --git a/master/search/all_c.js b/master/search/all_c.js
index 596e3c1074..72f8b04d0a 100644
--- a/master/search/all_c.js
+++ b/master/search/all_c.js
@@ -1,14 +1,14 @@
 var searchData=
 [
-  ['nblocks_287',['nblocks',['../structdlaf_1_1common_1_1_data_descriptor.html#a583161cb3c61e3af88fe66552a123866',1,'dlaf::common::DataDescriptor']]],
-  ['nextlocaltilefromglobalelement_288',['nextLocalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a559caf9af0f658507a6a8fe949e09a93',1,'dlaf::matrix::Distribution']]],
-  ['nextlocaltilefromglobaltile_289',['nextLocalTileFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#afcd76386ddd1319978242aaf54412825',1,'dlaf::matrix::Distribution::nextLocalTileFromGlobalTile()'],['../util__distribution_8h.html#ad6d38066f4c7c00e41fc2d8830efb77f',1,'dlaf::util::matrix::nextLocalTileFromGlobalTile()']]],
-  ['norm_290',['Norm',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm.html',1,'dlaf::auxiliary::internal']]],
-  ['norm_291',['norm',['../norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839',1,'dlaf::auxiliary']]],
-  ['norm_2eh_292',['norm.h',['../norm_8h.html',1,'']]],
-  ['norm_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_293',['Norm&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::auxiliary::internal']]],
-  ['nrtiles_294',['nrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516',1,'dlaf::matrix::Distribution::nrTiles()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d',1,'dlaf::matrix::internal::MatrixBase::nrTiles()']]],
-  ['numpy_295',['numpy',['../structdlaf_1_1format_1_1numpy.html',1,'dlaf::format']]],
-  ['numpy_5fdatatype_296',['numpy_datatype',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype.html',1,'dlaf::matrix::internal']]],
-  ['numpy_5fdatatype_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_297',['numpy_datatype&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::internal']]]
+  ['nblocks_288',['nblocks',['../structdlaf_1_1common_1_1_data_descriptor.html#a583161cb3c61e3af88fe66552a123866',1,'dlaf::common::DataDescriptor']]],
+  ['nextlocaltilefromglobalelement_289',['nextLocalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a559caf9af0f658507a6a8fe949e09a93',1,'dlaf::matrix::Distribution']]],
+  ['nextlocaltilefromglobaltile_290',['nextLocalTileFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#afcd76386ddd1319978242aaf54412825',1,'dlaf::matrix::Distribution::nextLocalTileFromGlobalTile()'],['../util__distribution_8h.html#ad6d38066f4c7c00e41fc2d8830efb77f',1,'dlaf::util::matrix::nextLocalTileFromGlobalTile()']]],
+  ['norm_291',['Norm',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm.html',1,'dlaf::auxiliary::internal']]],
+  ['norm_292',['norm',['../norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839',1,'dlaf::auxiliary']]],
+  ['norm_2eh_293',['norm.h',['../norm_8h.html',1,'']]],
+  ['norm_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_294',['Norm&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::auxiliary::internal']]],
+  ['nrtiles_295',['nrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516',1,'dlaf::matrix::Distribution::nrTiles()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d',1,'dlaf::matrix::internal::MatrixBase::nrTiles()']]],
+  ['numpy_296',['numpy',['../structdlaf_1_1format_1_1numpy.html',1,'dlaf::format']]],
+  ['numpy_5fdatatype_297',['numpy_datatype',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype.html',1,'dlaf::matrix::internal']]],
+  ['numpy_5fdatatype_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_298',['numpy_datatype&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::internal']]]
 ];
diff --git a/master/search/all_d.js b/master/search/all_d.js
index b2d4f3f8c7..4a75d4dcf9 100644
--- a/master/search/all_d.js
+++ b/master/search/all_d.js
@@ -1,17 +1,17 @@
 var searchData=
 [
-  ['offset_298',['offset',['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7229ff87452798d32b7195fe684fff7a',1,'dlaf::matrix::internal::View']]],
-  ['offsetelement_299',['offsetElement',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a398b31442f71b68e39a3ecbb2762203e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::offsetElement()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7164cccc46c63cc96661288809a37f5f',1,'dlaf::matrix::internal::View::offsetElement()']]],
-  ['operator_20bool_300',['operator bool',['../structdlaf_1_1common_1_1_buffer.html#ae57231c34ebf6f79da4d1e6e1c75cf0a',1,'dlaf::common::Buffer::operator bool()'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8f6d65a5adc84620ed33a7de52bac602',1,'dlaf::comm::internal::type_handler::operator bool()']]],
-  ['operator_20mpi_5fcomm_301',['operator MPI_Comm',['../classdlaf_1_1comm_1_1_communicator.html#a5be809bbc2d038669e31a9de501a2070',1,'dlaf::comm::Communicator']]],
-  ['operator_20mpi_5fdatatype_302',['operator MPI_Datatype',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a2247361b0d7dd77039860c0cd21a13e3',1,'dlaf::comm::internal::type_handler']]],
-  ['operator_21_3d_303',['operator!=',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#abf2886043fbe929f1e1f0eff5e20935d',1,'dlaf::common::internal::basic_coords::operator!=()'],['../classdlaf_1_1common_1_1_size2_d.html#a1a6822fefe13303612ce0ddf44f260ea',1,'dlaf::common::Size2D::operator!=()'],['../classdlaf_1_1common_1_1_index2_d.html#ae2e28cf6eab4febd97d6c46d23c6096d',1,'dlaf::common::Index2D::operator!=()']]],
-  ['operator_26_304',['operator&amp;',['../classdlaf_1_1comm_1_1_communicator.html#ace61947783c442bf684c2f035093acf2',1,'dlaf::comm::Communicator']]],
-  ['operator_28_29_305',['operator()',['../classdlaf_1_1memory_1_1_memory_chunk.html#a1720c41c3c3cbad2e198e7cedbfa84de',1,'dlaf::memory::MemoryChunk::operator()()'],['../classdlaf_1_1memory_1_1_memory_view.html#aad118548f59d6c8021eb4fbe816a1561',1,'dlaf::memory::MemoryView::operator()() const'],['../classdlaf_1_1memory_1_1_memory_view.html#a6f9c8123e686e2f2122ec988ca0b9725',1,'dlaf::memory::MemoryView::operator()(SizeType index) const'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ac0325c028366b219597dde97814e9a7a',1,'dlaf::memory::MemoryChunk::operator()()'],['../classdlaf_1_1matrix_1_1_tile.html#a5641fc26b7eb759a31ddc24975393ce7',1,'dlaf::matrix::Tile::operator()()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#ac22706782f9864d6357df2f48f15ee74',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator()()'],['../classdlaf_1_1common_1_1_pipeline.html#a388b1fe53e84dde5b0f026e7b334902d',1,'dlaf::common::Pipeline::operator()()']]],
-  ['operator_2b_306',['operator+',['../index2d_8h.html#a2ed7f0c019788f600bc067956646bf75',1,'dlaf::common']]],
-  ['operator_3c_3c_307',['operator&lt;&lt;',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a9a65958ab367757d900bd588a405df77',1,'dlaf::common::internal::basic_coords::operator&lt;&lt;()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#ac215ee8142401d06aba72494c8aa8b9f',1,'dlaf::comm::CommunicatorGrid::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a054e897882d7ab913c1b63af96e87fec',1,'dlaf::matrix::internal::MatrixBase::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a45b5556596386e6bb46e0dc61b838811',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator&lt;&lt;()'],['../index2d_8h.html#a352cdd70886a2a2ace1abd246951c538',1,'dlaf::common::operator&lt;&lt;()']]],
-  ['operator_3d_308',['operator=',['../classdlaf_1_1memory_1_1_memory_chunk.html#a0c03f967f09e963519dae5e235da66e1',1,'dlaf::memory::MemoryChunk']]],
-  ['operator_3d_3d_309',['operator==',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a95e16def9c322ee963d123635c2c875b',1,'dlaf::common::internal::basic_coords::operator==()'],['../classdlaf_1_1common_1_1_size2_d.html#a83385feaa5e14b4291c6267bc68fbe51',1,'dlaf::common::Size2D::operator==()'],['../classdlaf_1_1common_1_1_index2_d.html#a4724fdad093b5d189c5f5e0b1ac5e305',1,'dlaf::common::Index2D::operator==()']]],
-  ['ordering_310',['Ordering',['../index2d_8h.html#a02419996f0ffc187079c310f0175ce76',1,'dlaf::common']]],
-  ['orthogonal_311',['orthogonal',['../index2d_8h.html#a9b3be798b052f32def2a280a80e2295c',1,'dlaf']]]
+  ['offset_299',['offset',['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7229ff87452798d32b7195fe684fff7a',1,'dlaf::matrix::internal::View']]],
+  ['offsetelement_300',['offsetElement',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a398b31442f71b68e39a3ecbb2762203e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::offsetElement()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7164cccc46c63cc96661288809a37f5f',1,'dlaf::matrix::internal::View::offsetElement()']]],
+  ['operator_20bool_301',['operator bool',['../structdlaf_1_1common_1_1_buffer.html#ae57231c34ebf6f79da4d1e6e1c75cf0a',1,'dlaf::common::Buffer::operator bool()'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8f6d65a5adc84620ed33a7de52bac602',1,'dlaf::comm::internal::type_handler::operator bool()']]],
+  ['operator_20mpi_5fcomm_302',['operator MPI_Comm',['../classdlaf_1_1comm_1_1_communicator.html#a5be809bbc2d038669e31a9de501a2070',1,'dlaf::comm::Communicator']]],
+  ['operator_20mpi_5fdatatype_303',['operator MPI_Datatype',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a2247361b0d7dd77039860c0cd21a13e3',1,'dlaf::comm::internal::type_handler']]],
+  ['operator_21_3d_304',['operator!=',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#abf2886043fbe929f1e1f0eff5e20935d',1,'dlaf::common::internal::basic_coords::operator!=()'],['../classdlaf_1_1common_1_1_size2_d.html#a1a6822fefe13303612ce0ddf44f260ea',1,'dlaf::common::Size2D::operator!=()'],['../classdlaf_1_1common_1_1_index2_d.html#ae2e28cf6eab4febd97d6c46d23c6096d',1,'dlaf::common::Index2D::operator!=()']]],
+  ['operator_26_305',['operator&amp;',['../classdlaf_1_1comm_1_1_communicator.html#ace61947783c442bf684c2f035093acf2',1,'dlaf::comm::Communicator']]],
+  ['operator_28_29_306',['operator()',['../classdlaf_1_1memory_1_1_memory_chunk.html#a1720c41c3c3cbad2e198e7cedbfa84de',1,'dlaf::memory::MemoryChunk::operator()()'],['../classdlaf_1_1memory_1_1_memory_view.html#aad118548f59d6c8021eb4fbe816a1561',1,'dlaf::memory::MemoryView::operator()() const'],['../classdlaf_1_1memory_1_1_memory_view.html#a6f9c8123e686e2f2122ec988ca0b9725',1,'dlaf::memory::MemoryView::operator()(SizeType index) const'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ac0325c028366b219597dde97814e9a7a',1,'dlaf::memory::MemoryChunk::operator()()'],['../classdlaf_1_1matrix_1_1_tile.html#a5641fc26b7eb759a31ddc24975393ce7',1,'dlaf::matrix::Tile::operator()()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#ac22706782f9864d6357df2f48f15ee74',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator()()'],['../classdlaf_1_1common_1_1_pipeline.html#a388b1fe53e84dde5b0f026e7b334902d',1,'dlaf::common::Pipeline::operator()()']]],
+  ['operator_2b_307',['operator+',['../index2d_8h.html#a2ed7f0c019788f600bc067956646bf75',1,'dlaf::common']]],
+  ['operator_3c_3c_308',['operator&lt;&lt;',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a9a65958ab367757d900bd588a405df77',1,'dlaf::common::internal::basic_coords::operator&lt;&lt;()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#ac215ee8142401d06aba72494c8aa8b9f',1,'dlaf::comm::CommunicatorGrid::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a054e897882d7ab913c1b63af96e87fec',1,'dlaf::matrix::internal::MatrixBase::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a45b5556596386e6bb46e0dc61b838811',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator&lt;&lt;()'],['../index2d_8h.html#a352cdd70886a2a2ace1abd246951c538',1,'dlaf::common::operator&lt;&lt;()']]],
+  ['operator_3d_309',['operator=',['../classdlaf_1_1memory_1_1_memory_chunk.html#a0c03f967f09e963519dae5e235da66e1',1,'dlaf::memory::MemoryChunk']]],
+  ['operator_3d_3d_310',['operator==',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a95e16def9c322ee963d123635c2c875b',1,'dlaf::common::internal::basic_coords::operator==()'],['../classdlaf_1_1common_1_1_size2_d.html#a83385feaa5e14b4291c6267bc68fbe51',1,'dlaf::common::Size2D::operator==()'],['../classdlaf_1_1common_1_1_index2_d.html#a4724fdad093b5d189c5f5e0b1ac5e305',1,'dlaf::common::Index2D::operator==()']]],
+  ['ordering_311',['Ordering',['../index2d_8h.html#a02419996f0ffc187079c310f0175ce76',1,'dlaf::common']]],
+  ['orthogonal_312',['orthogonal',['../index2d_8h.html#a9b3be798b052f32def2a280a80e2295c',1,'dlaf']]]
 ];
diff --git a/master/search/all_e.js b/master/search/all_e.js
index d95147e7a3..ac8ff9778e 100644
--- a/master/search/all_e.js
+++ b/master/search/all_e.js
@@ -1,31 +1,31 @@
 var searchData=
 [
-  ['p2p_2eh_312',['p2p.h',['../p2p_8h.html',1,'']]],
-  ['p2p_5fallsum_2eh_313',['p2p_allsum.h',['../p2p__allsum_8h.html',1,'']]],
-  ['panel_314',['Panel',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix::Panel&lt; axis, T, D, Storage &gt;'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad63a4d555cea1fdf2f6d5745125fe3cb',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::Panel()']]],
-  ['panel_2eh_315',['panel.h',['../panel_8h.html',1,'']]],
-  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_316',['Panel&lt; axis, const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html',1,'dlaf::matrix']]],
-  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ayes_20_3e_317',['Panel&lt; axis, const T, D, StoreTransposed::Yes &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_yes_01_4.html',1,'dlaf::matrix']]],
-  ['panel_3c_20orthogonal_28axis_29_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_318',['Panel&lt; orthogonal(axis), const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix']]],
-  ['parentdistribution_319',['parentDistribution',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a66c9a42baab1741e5b562ddac6c716b2',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['partialtransform_320',['PartialTransform',['../classdlaf_1_1internal_1_1_partial_transform.html',1,'dlaf::internal']]],
-  ['partialtransformbase_321',['PartialTransformBase',['../structdlaf_1_1internal_1_1_partial_transform_base.html',1,'dlaf::internal']]],
-  ['partialtransformdetach_322',['PartialTransformDetach',['../classdlaf_1_1internal_1_1_partial_transform_detach.html',1,'dlaf::internal']]],
-  ['partialtransformmpi_323',['PartialTransformMPI',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i.html',1,'dlaf::comm::internal']]],
-  ['partialtransformmpibase_324',['PartialTransformMPIBase',['../structdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_base.html',1,'dlaf::comm::internal']]],
-  ['partialtransformmpidetach_325',['PartialTransformMPIDetach',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_detach.html',1,'dlaf::comm::internal']]],
-  ['permutations_326',['Permutations',['../structdlaf_1_1permutations_1_1internal_1_1_permutations.html',1,'dlaf::permutations::internal']]],
-  ['permute_327',['permute',['../permutations_2general_8h.html#af301d1e323dbafdc8503756ccd42edcd',1,'dlaf::permutations::permute(SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)'],['../permutations_2general_8h.html#a9dbcd748dd76ddf1b2dfef0d08bba03c',1,'dlaf::permutations::permute(comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;sub_task_chain, SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)']]],
-  ['pipeline_328',['Pipeline',['../classdlaf_1_1common_1_1_pipeline.html',1,'dlaf::common::Pipeline&lt; T &gt;'],['../classdlaf_1_1common_1_1_pipeline.html#a6379e14f25ed8d98d3b3434ec0d54a62',1,'dlaf::common::Pipeline::Pipeline()']]],
-  ['pipeline_2eh_329',['pipeline.h',['../pipeline_8h.html',1,'']]],
-  ['policy_330',['Policy',['../classdlaf_1_1internal_1_1_policy.html',1,'dlaf::internal']]],
-  ['potrf_331',['potrf',['../lapack_2tile_8h.html#aab0795227301a9e8e63232028e331fe0',1,'dlaf::tile']]],
-  ['potrfinfo_332',['potrfInfo',['../lapack_2tile_8h.html#aa917a1efbd53213821776d7d632ee41c',1,'dlaf::tile']]],
-  ['prependpack_333',['PrependPack',['../structdlaf_1_1internal_1_1_prepend_pack.html',1,'dlaf::internal']]],
-  ['prependpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20t_20_3e_334',['PrependPack&lt; Pack&lt; Ts... &gt;, T &gt;',['../structdlaf_1_1internal_1_1_prepend_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_t_01_4.html',1,'dlaf::internal']]],
-  ['print_335',['print',['../print__csv_8h.html#ace48c87b6c1d3dc59bf005fb943c0629',1,'dlaf::matrix::print(format::csv, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)'],['../print__numpy_8h.html#ab467c4a97112f7b1d2cffe3acbb41643',1,'dlaf::matrix::print(format::numpy, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)'],['../print__csv_8h.html#ae6a4db345c18954cc7d83022a1a848d6',1,'dlaf::matrix::print(format::csv, std::string sym, Matrix&lt; const T, Device::CPU &gt; &amp;mat, std::ostream &amp;os=std::cout)'],['../print__gpu_8h.html#aa0268964c774b355f5513ae93a23b258',1,'dlaf::matrix::print(Format format, const Tile&lt; const T, Device::GPU &gt; &amp;tile, std::ostream &amp;os, whip::stream_t stream)']]],
-  ['print_5fcsv_2eh_336',['print_csv.h',['../print__csv_8h.html',1,'']]],
-  ['print_5fgpu_2eh_337',['print_gpu.h',['../print__gpu_8h.html',1,'']]],
-  ['print_5fnumpy_2eh_338',['print_numpy.h',['../print__numpy_8h.html',1,'']]],
-  ['ptr_339',['ptr',['../classdlaf_1_1matrix_1_1_tile.html#a9d16161523f90ce0f432af6e3eacb9f2',1,'dlaf::matrix::Tile::ptr(const TileElementIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#ad14d471389721941e830f73d7ae0716d',1,'dlaf::matrix::Tile::ptr() const noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7b8f0d5579d0f38743f123046780e860',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr(const TileElementIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a018a34c9be26937cbb0c6dbb727c69ce',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr() const noexcept']]]
+  ['p2p_2eh_313',['p2p.h',['../p2p_8h.html',1,'']]],
+  ['p2p_5fallsum_2eh_314',['p2p_allsum.h',['../p2p__allsum_8h.html',1,'']]],
+  ['panel_315',['Panel',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix::Panel&lt; axis, T, D, Storage &gt;'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad63a4d555cea1fdf2f6d5745125fe3cb',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::Panel()']]],
+  ['panel_2eh_316',['panel.h',['../panel_8h.html',1,'']]],
+  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_317',['Panel&lt; axis, const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html',1,'dlaf::matrix']]],
+  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ayes_20_3e_318',['Panel&lt; axis, const T, D, StoreTransposed::Yes &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_yes_01_4.html',1,'dlaf::matrix']]],
+  ['panel_3c_20orthogonal_28axis_29_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_319',['Panel&lt; orthogonal(axis), const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix']]],
+  ['parentdistribution_320',['parentDistribution',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a66c9a42baab1741e5b562ddac6c716b2',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['partialtransform_321',['PartialTransform',['../classdlaf_1_1internal_1_1_partial_transform.html',1,'dlaf::internal']]],
+  ['partialtransformbase_322',['PartialTransformBase',['../structdlaf_1_1internal_1_1_partial_transform_base.html',1,'dlaf::internal']]],
+  ['partialtransformdetach_323',['PartialTransformDetach',['../classdlaf_1_1internal_1_1_partial_transform_detach.html',1,'dlaf::internal']]],
+  ['partialtransformmpi_324',['PartialTransformMPI',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i.html',1,'dlaf::comm::internal']]],
+  ['partialtransformmpibase_325',['PartialTransformMPIBase',['../structdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_base.html',1,'dlaf::comm::internal']]],
+  ['partialtransformmpidetach_326',['PartialTransformMPIDetach',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_detach.html',1,'dlaf::comm::internal']]],
+  ['permutations_327',['Permutations',['../structdlaf_1_1permutations_1_1internal_1_1_permutations.html',1,'dlaf::permutations::internal']]],
+  ['permute_328',['permute',['../permutations_2general_8h.html#af301d1e323dbafdc8503756ccd42edcd',1,'dlaf::permutations::permute(SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)'],['../permutations_2general_8h.html#a9dbcd748dd76ddf1b2dfef0d08bba03c',1,'dlaf::permutations::permute(comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;sub_task_chain, SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)']]],
+  ['pipeline_329',['Pipeline',['../classdlaf_1_1common_1_1_pipeline.html',1,'dlaf::common::Pipeline&lt; T &gt;'],['../classdlaf_1_1common_1_1_pipeline.html#a6379e14f25ed8d98d3b3434ec0d54a62',1,'dlaf::common::Pipeline::Pipeline()']]],
+  ['pipeline_2eh_330',['pipeline.h',['../pipeline_8h.html',1,'']]],
+  ['policy_331',['Policy',['../classdlaf_1_1internal_1_1_policy.html',1,'dlaf::internal']]],
+  ['potrf_332',['potrf',['../lapack_2tile_8h.html#aab0795227301a9e8e63232028e331fe0',1,'dlaf::tile']]],
+  ['potrfinfo_333',['potrfInfo',['../lapack_2tile_8h.html#aa917a1efbd53213821776d7d632ee41c',1,'dlaf::tile']]],
+  ['prependpack_334',['PrependPack',['../structdlaf_1_1internal_1_1_prepend_pack.html',1,'dlaf::internal']]],
+  ['prependpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20t_20_3e_335',['PrependPack&lt; Pack&lt; Ts... &gt;, T &gt;',['../structdlaf_1_1internal_1_1_prepend_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_t_01_4.html',1,'dlaf::internal']]],
+  ['print_336',['print',['../print__csv_8h.html#ace48c87b6c1d3dc59bf005fb943c0629',1,'dlaf::matrix::print(format::csv, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)'],['../print__numpy_8h.html#ab467c4a97112f7b1d2cffe3acbb41643',1,'dlaf::matrix::print(format::numpy, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)'],['../print__csv_8h.html#ae6a4db345c18954cc7d83022a1a848d6',1,'dlaf::matrix::print(format::csv, std::string sym, Matrix&lt; const T, Device::CPU &gt; &amp;mat, std::ostream &amp;os=std::cout)'],['../print__gpu_8h.html#aa0268964c774b355f5513ae93a23b258',1,'dlaf::matrix::print(Format format, const Tile&lt; const T, Device::GPU &gt; &amp;tile, std::ostream &amp;os, whip::stream_t stream)']]],
+  ['print_5fcsv_2eh_337',['print_csv.h',['../print__csv_8h.html',1,'']]],
+  ['print_5fgpu_2eh_338',['print_gpu.h',['../print__gpu_8h.html',1,'']]],
+  ['print_5fnumpy_2eh_339',['print_numpy.h',['../print__numpy_8h.html',1,'']]],
+  ['ptr_340',['ptr',['../classdlaf_1_1matrix_1_1_tile.html#a9d16161523f90ce0f432af6e3eacb9f2',1,'dlaf::matrix::Tile::ptr(const TileElementIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#ad14d471389721941e830f73d7ae0716d',1,'dlaf::matrix::Tile::ptr() const noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7b8f0d5579d0f38743f123046780e860',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr(const TileElementIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a018a34c9be26937cbb0c6dbb727c69ce',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr() const noexcept']]]
 ];
diff --git a/master/search/all_f.js b/master/search/all_f.js
index cd4991cf9a..530c767b13 100644
--- a/master/search/all_f.js
+++ b/master/search/all_f.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['qr_340',['QR',['../structdlaf_1_1factorization_1_1internal_1_1_q_r.html',1,'dlaf::factorization::internal']]],
-  ['qr_2eh_341',['qr.h',['../qr_8h.html',1,'']]],
-  ['qr_5ftfactor_342',['QR_Tfactor',['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html',1,'dlaf::factorization::internal']]]
+  ['qr_341',['QR',['../structdlaf_1_1factorization_1_1internal_1_1_q_r.html',1,'dlaf::factorization::internal']]],
+  ['qr_2eh_342',['qr.h',['../qr_8h.html',1,'']]],
+  ['qr_5ftfactor_343',['QR_Tfactor',['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html',1,'dlaf::factorization::internal']]]
 ];
diff --git a/master/search/classes_0.js b/master/search/classes_0.js
index 8e0f647b5a..7bddff5f72 100644
--- a/master/search/classes_0.js
+++ b/master/search/classes_0.js
@@ -1,13 +1,13 @@
 var searchData=
 [
-  ['alwaysfalse_532',['AlwaysFalse',['../structdlaf_1_1internal_1_1_always_false.html',1,'dlaf::internal']]],
-  ['anyof_533',['AnyOf',['../structdlaf_1_1internal_1_1_any_of.html',1,'dlaf::internal']]],
-  ['anyof_3c_20std_3a_3ais_5fsame_3c_20t_2c_20ts_20_3e_2e_2e_2e_20_3e_534',['AnyOf&lt; std::is_same&lt; T, Ts &gt;... &gt;',['../structdlaf_1_1internal_1_1_any_of.html',1,'dlaf::internal']]],
-  ['anyof_3c_3e_535',['AnyOf&lt;&gt;',['../structdlaf_1_1internal_1_1_any_of_3_4.html',1,'dlaf::internal']]],
-  ['applyhhtodoubletilerow_536',['ApplyHHToDoubleTileRow',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['applyhhtodoubletilerow_3c_20backend_3a_3agpu_2c_20t_20_3e_537',['ApplyHHToDoubleTileRow&lt; Backend::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['applyhhtodoubletilerow_3c_20backend_3a_3amc_2c_20t_20_3e_538',['ApplyHHToDoubleTileRow&lt; Backend::MC, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['applyhhtosingletilerow_539',['ApplyHHToSingleTileRow',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['applyhhtosingletilerow_3c_20backend_3a_3agpu_2c_20t_20_3e_540',['ApplyHHToSingleTileRow&lt; Backend::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['applyhhtosingletilerow_3c_20backend_3a_3amc_2c_20t_20_3e_541',['ApplyHHToSingleTileRow&lt; Backend::MC, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]]
+  ['alwaysfalse_536',['AlwaysFalse',['../structdlaf_1_1internal_1_1_always_false.html',1,'dlaf::internal']]],
+  ['anyof_537',['AnyOf',['../structdlaf_1_1internal_1_1_any_of.html',1,'dlaf::internal']]],
+  ['anyof_3c_20std_3a_3ais_5fsame_3c_20t_2c_20ts_20_3e_2e_2e_2e_20_3e_538',['AnyOf&lt; std::is_same&lt; T, Ts &gt;... &gt;',['../structdlaf_1_1internal_1_1_any_of.html',1,'dlaf::internal']]],
+  ['anyof_3c_3e_539',['AnyOf&lt;&gt;',['../structdlaf_1_1internal_1_1_any_of_3_4.html',1,'dlaf::internal']]],
+  ['applyhhtodoubletilerow_540',['ApplyHHToDoubleTileRow',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['applyhhtodoubletilerow_3c_20backend_3a_3agpu_2c_20t_20_3e_541',['ApplyHHToDoubleTileRow&lt; Backend::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['applyhhtodoubletilerow_3c_20backend_3a_3amc_2c_20t_20_3e_542',['ApplyHHToDoubleTileRow&lt; Backend::MC, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_double_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['applyhhtosingletilerow_543',['ApplyHHToSingleTileRow',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['applyhhtosingletilerow_3c_20backend_3a_3agpu_2c_20t_20_3e_544',['ApplyHHToSingleTileRow&lt; Backend::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['applyhhtosingletilerow_3c_20backend_3a_3amc_2c_20t_20_3e_545',['ApplyHHToSingleTileRow&lt; Backend::MC, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_apply_h_h_to_single_tile_row_3_01_backend_1_1_m_c_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]]
 ];
diff --git a/master/search/classes_1.js b/master/search/classes_1.js
index 03e94f2746..b03fff3d12 100644
--- a/master/search/classes_1.js
+++ b/master/search/classes_1.js
@@ -1,10 +1,10 @@
 var searchData=
 [
-  ['backtransformationreductiontoband_542',['BackTransformationReductionToBand',['../structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_reduction_to_band.html',1,'dlaf::eigensolver::internal']]],
-  ['backtransformationt2b_543',['BackTransformationT2B',['../structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_t2_b.html',1,'dlaf::eigensolver::internal']]],
-  ['bandblock_544',['BandBlock',['../classdlaf_1_1eigensolver_1_1internal_1_1_band_block.html',1,'dlaf::eigensolver::internal']]],
-  ['bandtotridiag_545',['BandToTridiag',['../structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag.html',1,'dlaf::eigensolver::internal']]],
-  ['bandtotridiag_3c_20backend_3a_3amc_2c_20d_2c_20t_20_3e_546',['BandToTridiag&lt; Backend::MC, D, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag_3_01_backend_1_1_m_c_00_01_d_00_01_t_01_4.html',1,'dlaf::eigensolver::internal']]],
-  ['basic_5fcoords_547',['basic_coords',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html',1,'dlaf::common::internal']]],
-  ['buffer_548',['Buffer',['../structdlaf_1_1common_1_1_buffer.html',1,'dlaf::common']]]
+  ['backtransformationreductiontoband_546',['BackTransformationReductionToBand',['../structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_reduction_to_band.html',1,'dlaf::eigensolver::internal']]],
+  ['backtransformationt2b_547',['BackTransformationT2B',['../structdlaf_1_1eigensolver_1_1internal_1_1_back_transformation_t2_b.html',1,'dlaf::eigensolver::internal']]],
+  ['bandblock_548',['BandBlock',['../classdlaf_1_1eigensolver_1_1internal_1_1_band_block.html',1,'dlaf::eigensolver::internal']]],
+  ['bandtotridiag_549',['BandToTridiag',['../structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag.html',1,'dlaf::eigensolver::internal']]],
+  ['bandtotridiag_3c_20backend_3a_3amc_2c_20d_2c_20t_20_3e_550',['BandToTridiag&lt; Backend::MC, D, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1_band_to_tridiag_3_01_backend_1_1_m_c_00_01_d_00_01_t_01_4.html',1,'dlaf::eigensolver::internal']]],
+  ['basic_5fcoords_551',['basic_coords',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html',1,'dlaf::common::internal']]],
+  ['buffer_552',['Buffer',['../structdlaf_1_1common_1_1_buffer.html',1,'dlaf::common']]]
 ];
diff --git a/master/search/classes_10.js b/master/search/classes_10.js
index 692cecfae6..4f6c9d02fd 100644
--- a/master/search/classes_10.js
+++ b/master/search/classes_10.js
@@ -1,23 +1,23 @@
 var searchData=
 [
-  ['tile_702',['Tile',['../classdlaf_1_1matrix_1_1_tile.html',1,'dlaf::matrix']]],
-  ['tile_3c_20const_20t_2c_20d_20_3e_703',['Tile&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
-  ['tileaccesshelper_704',['TileAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['tilecollector_705',['TileCollector',['../classdlaf_1_1eigensolver_1_1internal_1_1_tile_collector.html',1,'dlaf::eigensolver::internal']]],
-  ['tiledata_706',['TileData',['../classdlaf_1_1matrix_1_1internal_1_1_tile_data.html',1,'dlaf::matrix::internal']]],
-  ['tilepipeline_707',['TilePipeline',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html',1,'dlaf::matrix::internal']]],
-  ['timer_708',['Timer',['../classdlaf_1_1common_1_1_timer.html',1,'dlaf::common']]],
-  ['transformpack_709',['TransformPack',['../structdlaf_1_1internal_1_1_transform_pack.html',1,'dlaf::internal']]],
-  ['transformpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20transformer_20_3e_710',['TransformPack&lt; Pack&lt; Ts... &gt;, Transformer &gt;',['../structdlaf_1_1internal_1_1_transform_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_transformer_01_4.html',1,'dlaf::internal']]],
-  ['triangular_711',['Triangular',['../structdlaf_1_1multiplication_1_1internal_1_1_triangular.html',1,'dlaf::multiplication::internal::Triangular&lt; backend, device, T &gt;'],['../structdlaf_1_1solver_1_1internal_1_1_triangular.html',1,'dlaf::solver::internal::Triangular&lt; backend, device, T &gt;']]],
-  ['tridiagresult_712',['TridiagResult',['../structdlaf_1_1eigensolver_1_1_tridiag_result.html',1,'dlaf::eigensolver']]],
-  ['tridiagsolver_713',['TridiagSolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html',1,'dlaf::eigensolver::internal']]],
-  ['trmmsizes_714',['trmmSizes',['../structdlaf_1_1tile_1_1internal_1_1trmm_sizes.html',1,'dlaf::tile::internal']]],
-  ['trsmsizes_715',['trsmSizes',['../structdlaf_1_1tile_1_1internal_1_1trsm_sizes.html',1,'dlaf::tile::internal']]],
-  ['tuneparameters_716',['TuneParameters',['../structdlaf_1_1_tune_parameters.html',1,'dlaf']]],
-  ['type_5fhandler_717',['type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html',1,'dlaf::comm::internal']]],
-  ['typeinfo_718',['TypeInfo',['../structdlaf_1_1_type_info.html',1,'dlaf']]],
-  ['typeinfo_3c_20const_20t_20_3e_719',['TypeInfo&lt; const T &gt;',['../structdlaf_1_1_type_info_3_01const_01_t_01_4.html',1,'dlaf']]],
-  ['typeinfo_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_720',['TypeInfo&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1_type_info_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf']]],
-  ['typelist_721',['TypeList',['../structdlaf_1_1internal_1_1_type_list.html',1,'dlaf::internal']]]
+  ['tile_705',['Tile',['../classdlaf_1_1matrix_1_1_tile.html',1,'dlaf::matrix']]],
+  ['tile_3c_20const_20t_2c_20d_20_3e_706',['Tile&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
+  ['tileaccesshelper_707',['TileAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_tile_access_helper.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['tilecollector_708',['TileCollector',['../classdlaf_1_1eigensolver_1_1internal_1_1_tile_collector.html',1,'dlaf::eigensolver::internal']]],
+  ['tiledata_709',['TileData',['../classdlaf_1_1matrix_1_1internal_1_1_tile_data.html',1,'dlaf::matrix::internal']]],
+  ['tilepipeline_710',['TilePipeline',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html',1,'dlaf::matrix::internal']]],
+  ['timer_711',['Timer',['../classdlaf_1_1common_1_1_timer.html',1,'dlaf::common']]],
+  ['transformpack_712',['TransformPack',['../structdlaf_1_1internal_1_1_transform_pack.html',1,'dlaf::internal']]],
+  ['transformpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20transformer_20_3e_713',['TransformPack&lt; Pack&lt; Ts... &gt;, Transformer &gt;',['../structdlaf_1_1internal_1_1_transform_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_transformer_01_4.html',1,'dlaf::internal']]],
+  ['triangular_714',['Triangular',['../structdlaf_1_1multiplication_1_1internal_1_1_triangular.html',1,'dlaf::multiplication::internal::Triangular&lt; backend, device, T &gt;'],['../structdlaf_1_1solver_1_1internal_1_1_triangular.html',1,'dlaf::solver::internal::Triangular&lt; backend, device, T &gt;']]],
+  ['tridiagresult_715',['TridiagResult',['../structdlaf_1_1eigensolver_1_1_tridiag_result.html',1,'dlaf::eigensolver']]],
+  ['tridiagsolver_716',['TridiagSolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html',1,'dlaf::eigensolver::internal']]],
+  ['trmmsizes_717',['trmmSizes',['../structdlaf_1_1tile_1_1internal_1_1trmm_sizes.html',1,'dlaf::tile::internal']]],
+  ['trsmsizes_718',['trsmSizes',['../structdlaf_1_1tile_1_1internal_1_1trsm_sizes.html',1,'dlaf::tile::internal']]],
+  ['tuneparameters_719',['TuneParameters',['../structdlaf_1_1_tune_parameters.html',1,'dlaf']]],
+  ['type_5fhandler_720',['type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html',1,'dlaf::comm::internal']]],
+  ['typeinfo_721',['TypeInfo',['../structdlaf_1_1_type_info.html',1,'dlaf']]],
+  ['typeinfo_3c_20const_20t_20_3e_722',['TypeInfo&lt; const T &gt;',['../structdlaf_1_1_type_info_3_01const_01_t_01_4.html',1,'dlaf']]],
+  ['typeinfo_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_723',['TypeInfo&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1_type_info_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf']]],
+  ['typelist_724',['TypeList',['../structdlaf_1_1internal_1_1_type_list.html',1,'dlaf::internal']]]
 ];
diff --git a/master/search/classes_11.js b/master/search/classes_11.js
index 48045b40a3..c9242da99e 100644
--- a/master/search/classes_11.js
+++ b/master/search/classes_11.js
@@ -1,19 +1,19 @@
 var searchData=
 [
-  ['unique_722',['Unique',['../structdlaf_1_1internal_1_1_unique.html',1,'dlaf::internal']]],
-  ['unique_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_723',['Unique&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquehelper_724',['UniqueHelper',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
-  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_725',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_726',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquehelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_727',['UniqueHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
-  ['uniquepack_728',['UniquePack',['../structdlaf_1_1internal_1_1_unique_pack.html',1,'dlaf::internal']]],
-  ['uniquepack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_729',['UniquePack&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_730',['UniquePackHelper',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_731',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_732',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
-  ['uniquepackhelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_733',['UniquePackHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
-  ['unwrapper_734',['Unwrapper',['../structdlaf_1_1common_1_1internal_1_1_unwrapper.html',1,'dlaf::common::internal']]],
-  ['unwrapper_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20t1_2c_20t2_2c_20at_20_3e_20_3e_735',['Unwrapper&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; T1, T2, at &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01pika_1_1execution_1_1experimental_1_1async__r5be7b0afcb71e6df73ebcc954d80821d.html',1,'dlaf::common::internal']]],
-  ['unwrapper_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_736',['Unwrapper&lt; std::reference_wrapper&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01std_1_1reference__wrapper_3_01_t_01_4_01_4.html',1,'dlaf::common::internal']]],
-  ['unwrapping_737',['Unwrapping',['../structdlaf_1_1common_1_1internal_1_1_unwrapping.html',1,'dlaf::common::internal']]]
+  ['unique_725',['Unique',['../structdlaf_1_1internal_1_1_unique.html',1,'dlaf::internal']]],
+  ['unique_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_726',['Unique&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquehelper_727',['UniqueHelper',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
+  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_728',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquehelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_729',['UniqueHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquehelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_730',['UniqueHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_helper.html',1,'dlaf::internal']]],
+  ['uniquepack_731',['UniquePack',['../structdlaf_1_1internal_1_1_unique_pack.html',1,'dlaf::internal']]],
+  ['uniquepack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_732',['UniquePack&lt; Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_3_01_pack_3_01_ts_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_733',['UniquePackHelper',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_20u_2c_20us_2e_2e_2e_20_3e_20_3e_734',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt; U, Us... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_01_u_00_01_us_8_8_8_01_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20pack_3c_3e_20_3e_735',['UniquePackHelper&lt; Pack&lt; Ts... &gt;, Pack&lt;&gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper_3_01_pack_3_01_ts_8_8_8_01_4_00_01_pack_3_4_01_4.html',1,'dlaf::internal']]],
+  ['uniquepackhelper_3c_20pack_3c_3e_2c_20pack_3c_20ts_2e_2e_2e_20_3e_20_3e_736',['UniquePackHelper&lt; Pack&lt;&gt;, Pack&lt; Ts... &gt; &gt;',['../structdlaf_1_1internal_1_1_unique_pack_helper.html',1,'dlaf::internal']]],
+  ['unwrapper_737',['Unwrapper',['../structdlaf_1_1common_1_1internal_1_1_unwrapper.html',1,'dlaf::common::internal']]],
+  ['unwrapper_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20t1_2c_20t2_2c_20at_20_3e_20_3e_738',['Unwrapper&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; T1, T2, at &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01pika_1_1execution_1_1experimental_1_1async__r5be7b0afcb71e6df73ebcc954d80821d.html',1,'dlaf::common::internal']]],
+  ['unwrapper_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_739',['Unwrapper&lt; std::reference_wrapper&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1_unwrapper_3_01std_1_1reference__wrapper_3_01_t_01_4_01_4.html',1,'dlaf::common::internal']]],
+  ['unwrapping_740',['Unwrapping',['../structdlaf_1_1common_1_1internal_1_1_unwrapping.html',1,'dlaf::common::internal']]]
 ];
diff --git a/master/search/classes_12.js b/master/search/classes_12.js
index 1087e89a4c..ed3bcf5e6b 100644
--- a/master/search/classes_12.js
+++ b/master/search/classes_12.js
@@ -1,7 +1,7 @@
 var searchData=
 [
-  ['vaccesshelper_738',['VAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1_v_access_helper.html',1,'dlaf::eigensolver::internal']]],
-  ['vector_739',['vector',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
-  ['vector_3c_20readonlysendertype_20_3e_740',['vector&lt; ReadOnlySenderType &gt;',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
-  ['view_741',['View',['../structdlaf_1_1matrix_1_1internal_1_1_view.html',1,'dlaf::matrix::internal']]]
+  ['vaccesshelper_741',['VAccessHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1_v_access_helper.html',1,'dlaf::eigensolver::internal']]],
+  ['vector_742',['vector',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
+  ['vector_3c_20readonlysendertype_20_3e_743',['vector&lt; ReadOnlySenderType &gt;',['../structdlaf_1_1common_1_1internal_1_1vector.html',1,'dlaf::common::internal']]],
+  ['view_744',['View',['../structdlaf_1_1matrix_1_1internal_1_1_view.html',1,'dlaf::matrix::internal']]]
 ];
diff --git a/master/search/classes_13.js b/master/search/classes_13.js
index b6be8a7824..0b08f1ea1f 100644
--- a/master/search/classes_13.js
+++ b/master/search/classes_13.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['workspace_742',['WorkSpace',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space.html',1,'dlaf::eigensolver::internal']]],
-  ['workspacehost_743',['WorkSpaceHost',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host.html',1,'dlaf::eigensolver::internal']]],
-  ['workspacehostmirror_744',['WorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]]
+  ['workspace_745',['WorkSpace',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space.html',1,'dlaf::eigensolver::internal']]],
+  ['workspacehost_746',['WorkSpaceHost',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host.html',1,'dlaf::eigensolver::internal']]],
+  ['workspacehostmirror_747',['WorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]]
 ];
diff --git a/master/search/classes_2.js b/master/search/classes_2.js
index e4bd5fede9..0f6c1a6b5f 100644
--- a/master/search/classes_2.js
+++ b/master/search/classes_2.js
@@ -1,33 +1,33 @@
 var searchData=
 [
-  ['cholesky_549',['Cholesky',['../structdlaf_1_1factorization_1_1internal_1_1_cholesky.html',1,'dlaf::factorization::internal']]],
-  ['communicationdevice_550',['CommunicationDevice',['../structdlaf_1_1comm_1_1_communication_device.html',1,'dlaf::comm']]],
-  ['communicationdevice_3c_20device_3a_3agpu_20_3e_551',['CommunicationDevice&lt; Device::GPU &gt;',['../structdlaf_1_1comm_1_1_communication_device_3_01_device_1_1_g_p_u_01_4.html',1,'dlaf::comm']]],
-  ['communicator_552',['Communicator',['../classdlaf_1_1comm_1_1_communicator.html',1,'dlaf::comm']]],
-  ['communicatorgrid_553',['CommunicatorGrid',['../classdlaf_1_1comm_1_1_communicator_grid.html',1,'dlaf::comm']]],
-  ['computepanelhelper_554',['ComputePanelHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html',1,'dlaf::eigensolver::internal::red2band']]],
-  ['computepanelhelper_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_555',['ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html',1,'dlaf::eigensolver::internal::red2band']]],
-  ['computepanelhelper_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_556',['ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html',1,'dlaf::eigensolver::internal::red2band']]],
-  ['configuration_557',['configuration',['../structdlaf_1_1configuration.html',1,'dlaf']]],
-  ['contains_558',['Contains',['../structdlaf_1_1internal_1_1_contains.html',1,'dlaf::internal']]],
-  ['contains_3c_20t_20_3e_559',['Contains&lt; T &gt;',['../structdlaf_1_1internal_1_1_contains_3_01_t_01_4.html',1,'dlaf::internal']]],
-  ['contains_3c_20t_2c_20t_2c_20ts_2e_2e_2e_20_3e_560',['Contains&lt; T, T, Ts... &gt;',['../structdlaf_1_1internal_1_1_contains_3_01_t_00_01_t_00_01_ts_8_8_8_01_4.html',1,'dlaf::internal']]],
-  ['contains_3c_20t_2c_20ts_2e_2e_2e_20_3e_561',['Contains&lt; T, Ts... &gt;',['../structdlaf_1_1internal_1_1_contains.html',1,'dlaf::internal']]],
-  ['contains_3c_20t_2c_20u_2c_20ts_2e_2e_2e_20_3e_562',['Contains&lt; T, U, Ts... &gt;',['../structdlaf_1_1internal_1_1_contains_3_01_t_00_01_u_00_01_ts_8_8_8_01_4.html',1,'dlaf::internal']]],
-  ['copybackend_563',['CopyBackend',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend.html',1,'dlaf::matrix::internal']]],
-  ['copybackend_3c_20device_3a_3acpu_2c_20device_3a_3acpu_20_3e_564',['CopyBackend&lt; Device::CPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_c_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copybackend_3c_20device_3a_3acpu_2c_20device_3a_3agpu_20_3e_565',['CopyBackend&lt; Device::CPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_c_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copybackend_3c_20device_3a_3agpu_2c_20device_3a_3acpu_20_3e_566',['CopyBackend&lt; Device::GPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_g_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copybackend_3c_20device_3a_3agpu_2c_20device_3a_3agpu_20_3e_567',['CopyBackend&lt; Device::GPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_g_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copytile_568',['CopyTile',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile.html',1,'dlaf::matrix::internal']]],
-  ['copytile_3c_20t_2c_20device_3a_3acpu_2c_20device_3a_3acpu_20_3e_569',['CopyTile&lt; T, Device::CPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_c_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copytile_3c_20t_2c_20device_3a_3acpu_2c_20device_3a_3agpu_20_3e_570',['CopyTile&lt; T, Device::CPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_c_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copytile_3c_20t_2c_20device_3a_3agpu_2c_20device_3a_3acpu_20_3e_571',['CopyTile&lt; T, Device::GPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_g_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['copytile_3c_20t_2c_20device_3a_3agpu_2c_20device_3a_3agpu_20_3e_572',['CopyTile&lt; T, Device::GPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_g_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
-  ['cpptocudatype_573',['CppToCudaType',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type.html',1,'dlaf::util::internal']]],
-  ['cpptocudatype_3c_20const_20t_20_3e_574',['CppToCudaType&lt; const T &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01const_01_t_01_4.html',1,'dlaf::util::internal']]],
-  ['cpptocudatype_3c_20std_3a_3acomplex_3c_20double_20_3e_20_3e_575',['CppToCudaType&lt; std::complex&lt; double &gt; &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01std_1_1complex_3_01double_01_4_01_4.html',1,'dlaf::util::internal']]],
-  ['cpptocudatype_3c_20std_3a_3acomplex_3c_20float_20_3e_20_3e_576',['CppToCudaType&lt; std::complex&lt; float &gt; &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01std_1_1complex_3_01float_01_4_01_4.html',1,'dlaf::util::internal']]],
-  ['cpptocudatype_3c_20t_20_2a_20_3e_577',['CppToCudaType&lt; T * &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01_t_01_5_01_4.html',1,'dlaf::util::internal']]],
-  ['csv_578',['csv',['../structdlaf_1_1format_1_1csv.html',1,'dlaf::format']]]
+  ['cholesky_553',['Cholesky',['../structdlaf_1_1factorization_1_1internal_1_1_cholesky.html',1,'dlaf::factorization::internal']]],
+  ['communicationdevice_554',['CommunicationDevice',['../structdlaf_1_1comm_1_1_communication_device.html',1,'dlaf::comm']]],
+  ['communicationdevice_3c_20device_3a_3agpu_20_3e_555',['CommunicationDevice&lt; Device::GPU &gt;',['../structdlaf_1_1comm_1_1_communication_device_3_01_device_1_1_g_p_u_01_4.html',1,'dlaf::comm']]],
+  ['communicator_556',['Communicator',['../classdlaf_1_1comm_1_1_communicator.html',1,'dlaf::comm']]],
+  ['communicatorgrid_557',['CommunicatorGrid',['../classdlaf_1_1comm_1_1_communicator_grid.html',1,'dlaf::comm']]],
+  ['computepanelhelper_558',['ComputePanelHelper',['../structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper.html',1,'dlaf::eigensolver::internal::red2band']]],
+  ['computepanelhelper_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_559',['ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html',1,'dlaf::eigensolver::internal::red2band']]],
+  ['computepanelhelper_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_560',['ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html',1,'dlaf::eigensolver::internal::red2band']]],
+  ['configuration_561',['configuration',['../structdlaf_1_1configuration.html',1,'dlaf']]],
+  ['contains_562',['Contains',['../structdlaf_1_1internal_1_1_contains.html',1,'dlaf::internal']]],
+  ['contains_3c_20t_20_3e_563',['Contains&lt; T &gt;',['../structdlaf_1_1internal_1_1_contains_3_01_t_01_4.html',1,'dlaf::internal']]],
+  ['contains_3c_20t_2c_20t_2c_20ts_2e_2e_2e_20_3e_564',['Contains&lt; T, T, Ts... &gt;',['../structdlaf_1_1internal_1_1_contains_3_01_t_00_01_t_00_01_ts_8_8_8_01_4.html',1,'dlaf::internal']]],
+  ['contains_3c_20t_2c_20ts_2e_2e_2e_20_3e_565',['Contains&lt; T, Ts... &gt;',['../structdlaf_1_1internal_1_1_contains.html',1,'dlaf::internal']]],
+  ['contains_3c_20t_2c_20u_2c_20ts_2e_2e_2e_20_3e_566',['Contains&lt; T, U, Ts... &gt;',['../structdlaf_1_1internal_1_1_contains_3_01_t_00_01_u_00_01_ts_8_8_8_01_4.html',1,'dlaf::internal']]],
+  ['copybackend_567',['CopyBackend',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend.html',1,'dlaf::matrix::internal']]],
+  ['copybackend_3c_20device_3a_3acpu_2c_20device_3a_3acpu_20_3e_568',['CopyBackend&lt; Device::CPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_c_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copybackend_3c_20device_3a_3acpu_2c_20device_3a_3agpu_20_3e_569',['CopyBackend&lt; Device::CPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_c_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copybackend_3c_20device_3a_3agpu_2c_20device_3a_3acpu_20_3e_570',['CopyBackend&lt; Device::GPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_g_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copybackend_3c_20device_3a_3agpu_2c_20device_3a_3agpu_20_3e_571',['CopyBackend&lt; Device::GPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_backend_3_01_device_1_1_g_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copytile_572',['CopyTile',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile.html',1,'dlaf::matrix::internal']]],
+  ['copytile_3c_20t_2c_20device_3a_3acpu_2c_20device_3a_3acpu_20_3e_573',['CopyTile&lt; T, Device::CPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_c_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copytile_3c_20t_2c_20device_3a_3acpu_2c_20device_3a_3agpu_20_3e_574',['CopyTile&lt; T, Device::CPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_c_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copytile_3c_20t_2c_20device_3a_3agpu_2c_20device_3a_3acpu_20_3e_575',['CopyTile&lt; T, Device::GPU, Device::CPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_g_p_u_00_01_device_1_1_c_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['copytile_3c_20t_2c_20device_3a_3agpu_2c_20device_3a_3agpu_20_3e_576',['CopyTile&lt; T, Device::GPU, Device::GPU &gt;',['../structdlaf_1_1matrix_1_1internal_1_1_copy_tile_3_01_t_00_01_device_1_1_g_p_u_00_01_device_1_1_g_p_u_01_4.html',1,'dlaf::matrix::internal']]],
+  ['cpptocudatype_577',['CppToCudaType',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type.html',1,'dlaf::util::internal']]],
+  ['cpptocudatype_3c_20const_20t_20_3e_578',['CppToCudaType&lt; const T &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01const_01_t_01_4.html',1,'dlaf::util::internal']]],
+  ['cpptocudatype_3c_20std_3a_3acomplex_3c_20double_20_3e_20_3e_579',['CppToCudaType&lt; std::complex&lt; double &gt; &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01std_1_1complex_3_01double_01_4_01_4.html',1,'dlaf::util::internal']]],
+  ['cpptocudatype_3c_20std_3a_3acomplex_3c_20float_20_3e_20_3e_580',['CppToCudaType&lt; std::complex&lt; float &gt; &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01std_1_1complex_3_01float_01_4_01_4.html',1,'dlaf::util::internal']]],
+  ['cpptocudatype_3c_20t_20_2a_20_3e_581',['CppToCudaType&lt; T * &gt;',['../structdlaf_1_1util_1_1internal_1_1_cpp_to_cuda_type_3_01_t_01_5_01_4.html',1,'dlaf::util::internal']]],
+  ['csv_582',['csv',['../structdlaf_1_1format_1_1csv.html',1,'dlaf::format']]]
 ];
diff --git a/master/search/classes_3.js b/master/search/classes_3.js
index c6af2f3597..bc8429b743 100644
--- a/master/search/classes_3.js
+++ b/master/search/classes_3.js
@@ -1,19 +1,19 @@
 var searchData=
 [
-  ['data_5ftraits_579',['data_traits',['../structdlaf_1_1common_1_1data__traits.html',1,'dlaf::common']]],
-  ['data_5ftraits_3c_20buffer_3c_20t_20_3e_20_3e_580',['data_traits&lt; Buffer&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_buffer_3_01_t_01_4_01_4.html',1,'dlaf::common']]],
-  ['data_5ftraits_3c_20datadescriptor_3c_20t_20_3e_20_3e_581',['data_traits&lt; DataDescriptor&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_data_descriptor_3_01_t_01_4_01_4.html',1,'dlaf::common']]],
-  ['data_5ftraits_3c_20datadescriptor_3c_20t_5bn_5d_3e_20_3e_582',['data_traits&lt; DataDescriptor&lt; T[N]&gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_data_descriptor_3_01_t_0f_n_0e_4_01_4.html',1,'dlaf::common']]],
-  ['datadescriptor_583',['DataDescriptor',['../structdlaf_1_1common_1_1_data_descriptor.html',1,'dlaf::common']]],
-  ['datadescriptor_3c_20t_5bn_5d_3e_584',['DataDescriptor&lt; T[N]&gt;',['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html',1,'dlaf::common']]],
-  ['defaultbackend_585',['DefaultBackend',['../structdlaf_1_1_default_backend.html',1,'dlaf']]],
-  ['defaultbackend_3c_20device_3a_3acpu_20_3e_586',['DefaultBackend&lt; Device::CPU &gt;',['../structdlaf_1_1_default_backend_3_01_device_1_1_c_p_u_01_4.html',1,'dlaf']]],
-  ['defaultbackend_3c_20device_3a_3agpu_20_3e_587',['DefaultBackend&lt; Device::GPU &gt;',['../structdlaf_1_1_default_backend_3_01_device_1_1_g_p_u_01_4.html',1,'dlaf']]],
-  ['defaultdevice_588',['DefaultDevice',['../structdlaf_1_1_default_device.html',1,'dlaf']]],
-  ['defaultdevice_3c_20backend_3a_3agpu_20_3e_589',['DefaultDevice&lt; Backend::GPU &gt;',['../structdlaf_1_1_default_device_3_01_backend_1_1_g_p_u_01_4.html',1,'dlaf']]],
-  ['defaultdevice_3c_20backend_3a_3amc_20_3e_590',['DefaultDevice&lt; Backend::MC &gt;',['../structdlaf_1_1_default_device_3_01_backend_1_1_m_c_01_4.html',1,'dlaf']]],
-  ['distindexing_591',['DistIndexing',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['distribution_592',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html',1,'dlaf::matrix']]],
-  ['distworkspacehostmirror_593',['DistWorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_dist_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]],
-  ['duplicatenocopy_594',['DuplicateNoCopy',['../structdlaf_1_1matrix_1_1_duplicate_no_copy.html',1,'dlaf::matrix']]]
+  ['data_5ftraits_583',['data_traits',['../structdlaf_1_1common_1_1data__traits.html',1,'dlaf::common']]],
+  ['data_5ftraits_3c_20buffer_3c_20t_20_3e_20_3e_584',['data_traits&lt; Buffer&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_buffer_3_01_t_01_4_01_4.html',1,'dlaf::common']]],
+  ['data_5ftraits_3c_20datadescriptor_3c_20t_20_3e_20_3e_585',['data_traits&lt; DataDescriptor&lt; T &gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_data_descriptor_3_01_t_01_4_01_4.html',1,'dlaf::common']]],
+  ['data_5ftraits_3c_20datadescriptor_3c_20t_5bn_5d_3e_20_3e_586',['data_traits&lt; DataDescriptor&lt; T[N]&gt; &gt;',['../structdlaf_1_1common_1_1data__traits_3_01_data_descriptor_3_01_t_0f_n_0e_4_01_4.html',1,'dlaf::common']]],
+  ['datadescriptor_587',['DataDescriptor',['../structdlaf_1_1common_1_1_data_descriptor.html',1,'dlaf::common']]],
+  ['datadescriptor_3c_20t_5bn_5d_3e_588',['DataDescriptor&lt; T[N]&gt;',['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html',1,'dlaf::common']]],
+  ['defaultbackend_589',['DefaultBackend',['../structdlaf_1_1_default_backend.html',1,'dlaf']]],
+  ['defaultbackend_3c_20device_3a_3acpu_20_3e_590',['DefaultBackend&lt; Device::CPU &gt;',['../structdlaf_1_1_default_backend_3_01_device_1_1_c_p_u_01_4.html',1,'dlaf']]],
+  ['defaultbackend_3c_20device_3a_3agpu_20_3e_591',['DefaultBackend&lt; Device::GPU &gt;',['../structdlaf_1_1_default_backend_3_01_device_1_1_g_p_u_01_4.html',1,'dlaf']]],
+  ['defaultdevice_592',['DefaultDevice',['../structdlaf_1_1_default_device.html',1,'dlaf']]],
+  ['defaultdevice_3c_20backend_3a_3agpu_20_3e_593',['DefaultDevice&lt; Backend::GPU &gt;',['../structdlaf_1_1_default_device_3_01_backend_1_1_g_p_u_01_4.html',1,'dlaf']]],
+  ['defaultdevice_3c_20backend_3a_3amc_20_3e_594',['DefaultDevice&lt; Backend::MC &gt;',['../structdlaf_1_1_default_device_3_01_backend_1_1_m_c_01_4.html',1,'dlaf']]],
+  ['distindexing_595',['DistIndexing',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_dist_indexing.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['distribution_596',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html',1,'dlaf::matrix']]],
+  ['distworkspacehostmirror_597',['DistWorkSpaceHostMirror',['../structdlaf_1_1eigensolver_1_1internal_1_1_dist_work_space_host_mirror.html',1,'dlaf::eigensolver::internal']]],
+  ['duplicatenocopy_598',['DuplicateNoCopy',['../structdlaf_1_1matrix_1_1_duplicate_no_copy.html',1,'dlaf::matrix']]]
 ];
diff --git a/master/search/classes_4.js b/master/search/classes_4.js
index dcbc09f793..4fb65aeac4 100644
--- a/master/search/classes_4.js
+++ b/master/search/classes_4.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['eigensolver_595',['Eigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html',1,'dlaf::eigensolver::internal']]],
-  ['eigensolverresult_596',['EigensolverResult',['../structdlaf_1_1eigensolver_1_1_eigensolver_result.html',1,'dlaf::eigensolver']]],
-  ['emptyenv_597',['EmptyEnv',['../structdlaf_1_1internal_1_1_empty_env.html',1,'dlaf::internal']]]
+  ['eigensolver_599',['Eigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_eigensolver.html',1,'dlaf::eigensolver::internal']]],
+  ['eigensolverresult_600',['EigensolverResult',['../structdlaf_1_1eigensolver_1_1_eigensolver_result.html',1,'dlaf::eigensolver']]],
+  ['emptyenv_601',['EmptyEnv',['../structdlaf_1_1internal_1_1_empty_env.html',1,'dlaf::internal']]]
 ];
diff --git a/master/search/classes_5.js b/master/search/classes_5.js
index 20c3abc411..b5d05ebcf6 100644
--- a/master/search/classes_5.js
+++ b/master/search/classes_5.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['formatshort_598',['FormatShort',['../structdlaf_1_1internal_1_1_format_short.html',1,'dlaf::internal']]]
+  ['formatshort_602',['FormatShort',['../structdlaf_1_1internal_1_1_format_short.html',1,'dlaf::internal']]]
 ];
diff --git a/master/search/classes_6.js b/master/search/classes_6.js
index bae08c3e91..f4042b192e 100644
--- a/master/search/classes_6.js
+++ b/master/search/classes_6.js
@@ -1,10 +1,10 @@
 var searchData=
 [
-  ['gemmsizes_599',['gemmSizes',['../structdlaf_1_1tile_1_1internal_1_1gemm_sizes.html',1,'dlaf::tile::internal']]],
-  ['geneigensolver_600',['GenEigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html',1,'dlaf::eigensolver::internal']]],
-  ['generalsub_601',['GeneralSub',['../structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html',1,'dlaf::multiplication::internal']]],
-  ['gentostd_602',['GenToStd',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html',1,'dlaf::eigensolver::internal']]],
-  ['getter_5frandom_603',['getter_random',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html',1,'dlaf::matrix::util::internal']]],
-  ['getter_5frandom_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_604',['getter_random&lt; std::complex&lt; T &gt; &gt;',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::util::internal']]],
-  ['givensrotation_605',['GivensRotation',['../structdlaf_1_1eigensolver_1_1internal_1_1_givens_rotation.html',1,'dlaf::eigensolver::internal']]]
+  ['gemmsizes_603',['gemmSizes',['../structdlaf_1_1tile_1_1internal_1_1gemm_sizes.html',1,'dlaf::tile::internal']]],
+  ['geneigensolver_604',['GenEigensolver',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_eigensolver.html',1,'dlaf::eigensolver::internal']]],
+  ['generalsub_605',['GeneralSub',['../structdlaf_1_1multiplication_1_1internal_1_1_general_sub.html',1,'dlaf::multiplication::internal']]],
+  ['gentostd_606',['GenToStd',['../structdlaf_1_1eigensolver_1_1internal_1_1_gen_to_std.html',1,'dlaf::eigensolver::internal']]],
+  ['getter_5frandom_607',['getter_random',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html',1,'dlaf::matrix::util::internal']]],
+  ['getter_5frandom_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_608',['getter_random&lt; std::complex&lt; T &gt; &gt;',['../classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::util::internal']]],
+  ['givensrotation_609',['GivensRotation',['../structdlaf_1_1eigensolver_1_1internal_1_1_givens_rotation.html',1,'dlaf::eigensolver::internal']]]
 ];
diff --git a/master/search/classes_7.js b/master/search/classes_7.js
index 57283c9ab7..0848569bec 100644
--- a/master/search/classes_7.js
+++ b/master/search/classes_7.js
@@ -1,15 +1,15 @@
 var searchData=
 [
-  ['helpers_606',['Helpers',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers.html',1,'dlaf::eigensolver::internal::bt_red_band::Helpers&lt; B &gt;'],['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers.html',1,'dlaf::factorization::internal::tfactor_l::Helpers&lt; backend, device, T &gt;']]],
-  ['helpers_3c_20backend_3a_3agpu_20_3e_607',['Helpers&lt; Backend::GPU &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_g_p_u_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
-  ['helpers_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_608',['Helpers&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
-  ['helpers_3c_20backend_3a_3amc_20_3e_609',['Helpers&lt; Backend::MC &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_m_c_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
-  ['helpers_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_610',['Helpers&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
-  ['hemmsizes_611',['hemmSizes',['../structdlaf_1_1tile_1_1internal_1_1hemm_sizes.html',1,'dlaf::tile::internal']]],
-  ['her2ksizes_612',['her2kSizes',['../structdlaf_1_1tile_1_1internal_1_1her2k_sizes.html',1,'dlaf::tile::internal']]],
-  ['herksizes_613',['herkSizes',['../structdlaf_1_1tile_1_1internal_1_1herk_sizes.html',1,'dlaf::tile::internal']]],
-  ['hermitian_614',['Hermitian',['../structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html',1,'dlaf::multiplication::internal']]],
-  ['hhmanager_615',['HHManager',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['hhmanager_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_616',['HHManager&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
-  ['hhmanager_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_617',['HHManager&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]]
+  ['helpers_610',['Helpers',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers.html',1,'dlaf::eigensolver::internal::bt_red_band::Helpers&lt; B &gt;'],['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers.html',1,'dlaf::factorization::internal::tfactor_l::Helpers&lt; backend, device, T &gt;']]],
+  ['helpers_3c_20backend_3a_3agpu_20_3e_611',['Helpers&lt; Backend::GPU &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_g_p_u_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
+  ['helpers_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_612',['Helpers&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
+  ['helpers_3c_20backend_3a_3amc_20_3e_613',['Helpers&lt; Backend::MC &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__red__band_1_1_helpers_3_01_backend_1_1_m_c_01_4.html',1,'dlaf::eigensolver::internal::bt_red_band']]],
+  ['helpers_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_614',['Helpers&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1factorization_1_1internal_1_1tfactor__l_1_1_helpers_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::factorization::internal::tfactor_l']]],
+  ['hemmsizes_615',['hemmSizes',['../structdlaf_1_1tile_1_1internal_1_1hemm_sizes.html',1,'dlaf::tile::internal']]],
+  ['her2ksizes_616',['her2kSizes',['../structdlaf_1_1tile_1_1internal_1_1her2k_sizes.html',1,'dlaf::tile::internal']]],
+  ['herksizes_617',['herkSizes',['../structdlaf_1_1tile_1_1internal_1_1herk_sizes.html',1,'dlaf::tile::internal']]],
+  ['hermitian_618',['Hermitian',['../structdlaf_1_1multiplication_1_1internal_1_1_hermitian.html',1,'dlaf::multiplication::internal']]],
+  ['hhmanager_619',['HHManager',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['hhmanager_3c_20backend_3a_3agpu_2c_20device_3a_3agpu_2c_20t_20_3e_620',['HHManager&lt; Backend::GPU, Device::GPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_g_p_u_00_01_device_1_1_g_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]],
+  ['hhmanager_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_621',['HHManager&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1eigensolver_1_1internal_1_1bt__tridiag_1_1_h_h_manager_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::eigensolver::internal::bt_tridiag']]]
 ];
diff --git a/master/search/classes_8.js b/master/search/classes_8.js
index 1ea701b7d2..052809a7da 100644
--- a/master/search/classes_8.js
+++ b/master/search/classes_8.js
@@ -1,18 +1,18 @@
 var searchData=
 [
-  ['index2d_618',['Index2D',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_619',['Index2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_620',['Index2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_621',['Index2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_622',['Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['index2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_623',['Index2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
-  ['is_5fcoord_624',['is_coord',['../structdlaf_1_1common_1_1internal_1_1is__coord.html',1,'dlaf::common::internal']]],
-  ['is_5fcoord_3c_20index2d_3c_20t_2c_20tag_20_3e_20_3e_625',['is_coord&lt; Index2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_index2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
-  ['is_5fcoord_3c_20size2d_3c_20t_2c_20tag_20_3e_20_3e_626',['is_coord&lt; Size2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_size2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
-  ['is_5fdata_627',['is_data',['../structdlaf_1_1common_1_1is__data.html',1,'dlaf::common']]],
-  ['isfalse_628',['IsFalse',['../structdlaf_1_1internal_1_1_is_false.html',1,'dlaf::internal']]],
-  ['isfloatingpointorcomplex_629',['IsFloatingPointOrComplex',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex.html',1,'dlaf::internal']]],
-  ['isfloatingpointorcomplex_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_630',['IsFloatingPointOrComplex&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::internal']]],
-  ['iterablerange2d_631',['IterableRange2D',['../classdlaf_1_1common_1_1_iterable_range2_d.html',1,'dlaf::common']]],
-  ['iteratorrange2d_632',['IteratorRange2D',['../structdlaf_1_1common_1_1_iterator_range2_d.html',1,'dlaf::common']]]
+  ['index2d_622',['Index2D',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_623',['Index2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_624',['Index2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_625',['Index2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_626',['Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['index2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_627',['Index2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_index2_d.html',1,'dlaf::common']]],
+  ['is_5fcoord_628',['is_coord',['../structdlaf_1_1common_1_1internal_1_1is__coord.html',1,'dlaf::common::internal']]],
+  ['is_5fcoord_3c_20index2d_3c_20t_2c_20tag_20_3e_20_3e_629',['is_coord&lt; Index2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_index2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
+  ['is_5fcoord_3c_20size2d_3c_20t_2c_20tag_20_3e_20_3e_630',['is_coord&lt; Size2D&lt; T, Tag &gt; &gt;',['../structdlaf_1_1common_1_1internal_1_1is__coord_3_01_size2_d_3_01_t_00_01_tag_01_4_01_4.html',1,'dlaf::common::internal']]],
+  ['is_5fdata_631',['is_data',['../structdlaf_1_1common_1_1is__data.html',1,'dlaf::common']]],
+  ['isfalse_632',['IsFalse',['../structdlaf_1_1internal_1_1_is_false.html',1,'dlaf::internal']]],
+  ['isfloatingpointorcomplex_633',['IsFloatingPointOrComplex',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex.html',1,'dlaf::internal']]],
+  ['isfloatingpointorcomplex_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_634',['IsFloatingPointOrComplex&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1internal_1_1_is_floating_point_or_complex_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::internal']]],
+  ['iterablerange2d_635',['IterableRange2D',['../classdlaf_1_1common_1_1_iterable_range2_d.html',1,'dlaf::common']]],
+  ['iteratorrange2d_636',['IteratorRange2D',['../structdlaf_1_1common_1_1_iterator_range2_d.html',1,'dlaf::common']]]
 ];
diff --git a/master/search/classes_9.js b/master/search/classes_9.js
index 7f017c6104..73d9f3c522 100644
--- a/master/search/classes_9.js
+++ b/master/search/classes_9.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['layoutinfo_633',['LayoutInfo',['../classdlaf_1_1matrix_1_1_layout_info.html',1,'dlaf::matrix']]]
+  ['layoutinfo_637',['LayoutInfo',['../classdlaf_1_1matrix_1_1_layout_info.html',1,'dlaf::matrix']]]
 ];
diff --git a/master/search/classes_a.js b/master/search/classes_a.js
index 374e3f19f8..61e07c08db 100644
--- a/master/search/classes_a.js
+++ b/master/search/classes_a.js
@@ -1,24 +1,24 @@
 var searchData=
 [
-  ['matrix_634',['Matrix',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20const_20t_2c_20d_20_3e_635',['Matrix&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20const_20t_2c_20source_20_3e_636',['Matrix&lt; const T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20const_20t_2c_20sourcetarget_20_3e_637',['Matrix&lt; const T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20t_2c_20source_20_3e_638',['Matrix&lt; T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20t_2c_20sourcetarget_20_3e_639',['Matrix&lt; T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrix_3c_20t_2c_20target_20_3e_640',['Matrix&lt; T, Target &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
-  ['matrixbase_641',['MatrixBase',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html',1,'dlaf::matrix::internal']]],
-  ['matrixmirror_642',['MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror.html',1,'dlaf::matrix']]],
-  ['matrixmirror_3c_20const_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_643',['MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
-  ['matrixmirror_3c_20const_20t_2c_20target_2c_20source_20_3e_644',['MatrixMirror&lt; const T, Target, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html',1,'dlaf::matrix']]],
-  ['matrixmirror_3c_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_645',['MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
-  ['memorychunk_646',['MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html',1,'dlaf::memory']]],
-  ['memoryview_647',['MemoryView',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory']]],
-  ['memoryview_3c_20t_2c_20device_3a_3acpu_20_3e_648',['MemoryView&lt; T, Device::CPU &gt;',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory']]],
-  ['message_649',['Message',['../classdlaf_1_1comm_1_1_message.html',1,'dlaf::comm']]],
-  ['movenonconsttile_650',['moveNonConstTile',['../structdlaf_1_1internal_1_1move_non_const_tile.html',1,'dlaf::internal']]],
-  ['mpi_5fdatatype_651',['mpi_datatype',['../structdlaf_1_1comm_1_1mpi__datatype.html',1,'dlaf::comm']]],
-  ['mpi_5fdatatype_3c_20const_20t_20_3e_652',['mpi_datatype&lt; const T &gt;',['../structdlaf_1_1comm_1_1mpi__datatype_3_01const_01_t_01_4.html',1,'dlaf::comm']]],
-  ['mpi_5finit_653',['mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html',1,'dlaf::comm']]],
-  ['mpicallhelper_654',['MPICallHelper',['../structdlaf_1_1comm_1_1internal_1_1_m_p_i_call_helper.html',1,'dlaf::comm::internal']]]
+  ['matrix_638',['Matrix',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20const_20t_2c_20d_20_3e_639',['Matrix&lt; const T, D &gt;',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20const_20t_2c_20source_20_3e_640',['Matrix&lt; const T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20const_20t_2c_20sourcetarget_20_3e_641',['Matrix&lt; const T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20t_2c_20source_20_3e_642',['Matrix&lt; T, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20t_2c_20sourcetarget_20_3e_643',['Matrix&lt; T, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrix_3c_20t_2c_20target_20_3e_644',['Matrix&lt; T, Target &gt;',['../classdlaf_1_1matrix_1_1_matrix.html',1,'dlaf::matrix']]],
+  ['matrixbase_645',['MatrixBase',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html',1,'dlaf::matrix::internal']]],
+  ['matrixmirror_646',['MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror.html',1,'dlaf::matrix']]],
+  ['matrixmirror_3c_20const_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_647',['MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
+  ['matrixmirror_3c_20const_20t_2c_20target_2c_20source_20_3e_648',['MatrixMirror&lt; const T, Target, Source &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html',1,'dlaf::matrix']]],
+  ['matrixmirror_3c_20t_2c_20sourcetarget_2c_20sourcetarget_20_3e_649',['MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html',1,'dlaf::matrix']]],
+  ['memorychunk_650',['MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html',1,'dlaf::memory']]],
+  ['memoryview_651',['MemoryView',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory']]],
+  ['memoryview_3c_20t_2c_20device_3a_3acpu_20_3e_652',['MemoryView&lt; T, Device::CPU &gt;',['../classdlaf_1_1memory_1_1_memory_view.html',1,'dlaf::memory']]],
+  ['message_653',['Message',['../classdlaf_1_1comm_1_1_message.html',1,'dlaf::comm']]],
+  ['movenonconsttile_654',['moveNonConstTile',['../structdlaf_1_1internal_1_1move_non_const_tile.html',1,'dlaf::internal']]],
+  ['mpi_5fdatatype_655',['mpi_datatype',['../structdlaf_1_1comm_1_1mpi__datatype.html',1,'dlaf::comm']]],
+  ['mpi_5fdatatype_3c_20const_20t_20_3e_656',['mpi_datatype&lt; const T &gt;',['../structdlaf_1_1comm_1_1mpi__datatype_3_01const_01_t_01_4.html',1,'dlaf::comm']]],
+  ['mpi_5finit_657',['mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html',1,'dlaf::comm']]],
+  ['mpicallhelper_658',['MPICallHelper',['../structdlaf_1_1comm_1_1internal_1_1_m_p_i_call_helper.html',1,'dlaf::comm::internal']]]
 ];
diff --git a/master/search/classes_b.js b/master/search/classes_b.js
index d76b7f0ab9..3e07ead1d1 100644
--- a/master/search/classes_b.js
+++ b/master/search/classes_b.js
@@ -1,8 +1,8 @@
 var searchData=
 [
-  ['norm_655',['Norm',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm.html',1,'dlaf::auxiliary::internal']]],
-  ['norm_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_656',['Norm&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::auxiliary::internal']]],
-  ['numpy_657',['numpy',['../structdlaf_1_1format_1_1numpy.html',1,'dlaf::format']]],
-  ['numpy_5fdatatype_658',['numpy_datatype',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype.html',1,'dlaf::matrix::internal']]],
-  ['numpy_5fdatatype_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_659',['numpy_datatype&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::internal']]]
+  ['norm_659',['Norm',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm.html',1,'dlaf::auxiliary::internal']]],
+  ['norm_3c_20backend_3a_3amc_2c_20device_3a_3acpu_2c_20t_20_3e_660',['Norm&lt; Backend::MC, Device::CPU, T &gt;',['../structdlaf_1_1auxiliary_1_1internal_1_1_norm_3_01_backend_1_1_m_c_00_01_device_1_1_c_p_u_00_01_t_01_4.html',1,'dlaf::auxiliary::internal']]],
+  ['numpy_661',['numpy',['../structdlaf_1_1format_1_1numpy.html',1,'dlaf::format']]],
+  ['numpy_5fdatatype_662',['numpy_datatype',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype.html',1,'dlaf::matrix::internal']]],
+  ['numpy_5fdatatype_3c_20std_3a_3acomplex_3c_20t_20_3e_20_3e_663',['numpy_datatype&lt; std::complex&lt; T &gt; &gt;',['../structdlaf_1_1matrix_1_1internal_1_1numpy__datatype_3_01std_1_1complex_3_01_t_01_4_01_4.html',1,'dlaf::matrix::internal']]]
 ];
diff --git a/master/search/classes_c.js b/master/search/classes_c.js
index 4cded67c7d..113eb3e39d 100644
--- a/master/search/classes_c.js
+++ b/master/search/classes_c.js
@@ -1,18 +1,18 @@
 var searchData=
 [
-  ['panel_660',['Panel',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix']]],
-  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_661',['Panel&lt; axis, const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html',1,'dlaf::matrix']]],
-  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ayes_20_3e_662',['Panel&lt; axis, const T, D, StoreTransposed::Yes &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_yes_01_4.html',1,'dlaf::matrix']]],
-  ['panel_3c_20orthogonal_28axis_29_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_663',['Panel&lt; orthogonal(axis), const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix']]],
-  ['partialtransform_664',['PartialTransform',['../classdlaf_1_1internal_1_1_partial_transform.html',1,'dlaf::internal']]],
-  ['partialtransformbase_665',['PartialTransformBase',['../structdlaf_1_1internal_1_1_partial_transform_base.html',1,'dlaf::internal']]],
-  ['partialtransformdetach_666',['PartialTransformDetach',['../classdlaf_1_1internal_1_1_partial_transform_detach.html',1,'dlaf::internal']]],
-  ['partialtransformmpi_667',['PartialTransformMPI',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i.html',1,'dlaf::comm::internal']]],
-  ['partialtransformmpibase_668',['PartialTransformMPIBase',['../structdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_base.html',1,'dlaf::comm::internal']]],
-  ['partialtransformmpidetach_669',['PartialTransformMPIDetach',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_detach.html',1,'dlaf::comm::internal']]],
-  ['permutations_670',['Permutations',['../structdlaf_1_1permutations_1_1internal_1_1_permutations.html',1,'dlaf::permutations::internal']]],
-  ['pipeline_671',['Pipeline',['../classdlaf_1_1common_1_1_pipeline.html',1,'dlaf::common']]],
-  ['policy_672',['Policy',['../classdlaf_1_1internal_1_1_policy.html',1,'dlaf::internal']]],
-  ['prependpack_673',['PrependPack',['../structdlaf_1_1internal_1_1_prepend_pack.html',1,'dlaf::internal']]],
-  ['prependpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20t_20_3e_674',['PrependPack&lt; Pack&lt; Ts... &gt;, T &gt;',['../structdlaf_1_1internal_1_1_prepend_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_t_01_4.html',1,'dlaf::internal']]]
+  ['panel_664',['Panel',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix']]],
+  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_665',['Panel&lt; axis, const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html',1,'dlaf::matrix']]],
+  ['panel_3c_20axis_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ayes_20_3e_666',['Panel&lt; axis, const T, D, StoreTransposed::Yes &gt;',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_yes_01_4.html',1,'dlaf::matrix']]],
+  ['panel_3c_20orthogonal_28axis_29_2c_20const_20t_2c_20d_2c_20storetransposed_3a_3ano_20_3e_667',['Panel&lt; orthogonal(axis), const T, D, StoreTransposed::No &gt;',['../structdlaf_1_1matrix_1_1_panel.html',1,'dlaf::matrix']]],
+  ['partialtransform_668',['PartialTransform',['../classdlaf_1_1internal_1_1_partial_transform.html',1,'dlaf::internal']]],
+  ['partialtransformbase_669',['PartialTransformBase',['../structdlaf_1_1internal_1_1_partial_transform_base.html',1,'dlaf::internal']]],
+  ['partialtransformdetach_670',['PartialTransformDetach',['../classdlaf_1_1internal_1_1_partial_transform_detach.html',1,'dlaf::internal']]],
+  ['partialtransformmpi_671',['PartialTransformMPI',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i.html',1,'dlaf::comm::internal']]],
+  ['partialtransformmpibase_672',['PartialTransformMPIBase',['../structdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_base.html',1,'dlaf::comm::internal']]],
+  ['partialtransformmpidetach_673',['PartialTransformMPIDetach',['../classdlaf_1_1comm_1_1internal_1_1_partial_transform_m_p_i_detach.html',1,'dlaf::comm::internal']]],
+  ['permutations_674',['Permutations',['../structdlaf_1_1permutations_1_1internal_1_1_permutations.html',1,'dlaf::permutations::internal']]],
+  ['pipeline_675',['Pipeline',['../classdlaf_1_1common_1_1_pipeline.html',1,'dlaf::common']]],
+  ['policy_676',['Policy',['../classdlaf_1_1internal_1_1_policy.html',1,'dlaf::internal']]],
+  ['prependpack_677',['PrependPack',['../structdlaf_1_1internal_1_1_prepend_pack.html',1,'dlaf::internal']]],
+  ['prependpack_3c_20pack_3c_20ts_2e_2e_2e_20_3e_2c_20t_20_3e_678',['PrependPack&lt; Pack&lt; Ts... &gt;, T &gt;',['../structdlaf_1_1internal_1_1_prepend_pack_3_01_pack_3_01_ts_8_8_8_01_4_00_01_t_01_4.html',1,'dlaf::internal']]]
 ];
diff --git a/master/search/classes_d.js b/master/search/classes_d.js
index e4f333b0c2..9d11f696a8 100644
--- a/master/search/classes_d.js
+++ b/master/search/classes_d.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['qr_675',['QR',['../structdlaf_1_1factorization_1_1internal_1_1_q_r.html',1,'dlaf::factorization::internal']]],
-  ['qr_5ftfactor_676',['QR_Tfactor',['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html',1,'dlaf::factorization::internal']]]
+  ['qr_679',['QR',['../structdlaf_1_1factorization_1_1internal_1_1_q_r.html',1,'dlaf::factorization::internal']]],
+  ['qr_5ftfactor_680',['QR_Tfactor',['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html',1,'dlaf::factorization::internal']]]
 ];
diff --git a/master/search/classes_e.js b/master/search/classes_e.js
index fc95f63c2f..42e733369c 100644
--- a/master/search/classes_e.js
+++ b/master/search/classes_e.js
@@ -1,7 +1,6 @@
 var searchData=
 [
-  ['reductiontoband_677',['ReductionToBand',['../structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html',1,'dlaf::eigensolver::internal']]],
-  ['retiledmatrix_678',['RetiledMatrix',['../classdlaf_1_1matrix_1_1_retiled_matrix.html',1,'dlaf::matrix']]],
-  ['roundrobin_679',['RoundRobin',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]],
-  ['roundrobin_3c_20dlaf_3a_3amatrix_3a_3apanel_3c_20coord_3a_3acol_2c_20t_2c_20device_3a_3acpu_20_3e_20_3e_680',['RoundRobin&lt; dlaf::matrix::Panel&lt; Coord::Col, T, Device::CPU &gt; &gt;',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]]
+  ['reductiontoband_681',['ReductionToBand',['../structdlaf_1_1eigensolver_1_1internal_1_1_reduction_to_band.html',1,'dlaf::eigensolver::internal']]],
+  ['roundrobin_682',['RoundRobin',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]],
+  ['roundrobin_3c_20dlaf_3a_3amatrix_3a_3apanel_3c_20coord_3a_3acol_2c_20t_2c_20device_3a_3acpu_20_3e_20_3e_683',['RoundRobin&lt; dlaf::matrix::Panel&lt; Coord::Col, T, Device::CPU &gt; &gt;',['../structdlaf_1_1common_1_1_round_robin.html',1,'dlaf::common']]]
 ];
diff --git a/master/search/classes_f.js b/master/search/classes_f.js
index f501c6afea..752e9e24c6 100644
--- a/master/search/classes_f.js
+++ b/master/search/classes_f.js
@@ -1,24 +1,24 @@
 var searchData=
 [
-  ['scopedinitializer_681',['ScopedInitializer',['../structdlaf_1_1_scoped_initializer.html',1,'dlaf']]],
-  ['sendersinglevaluetypeimpl_682',['SenderSingleValueTypeImpl',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3aread_20_3e_20_3e_20_3e_20_3e_683',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::read &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_356df456d49829a554002eacb85cc5b7.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3areadwrite_20_3e_20_3e_20_3e_20_3e_684',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::readwrite &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_3535bbe9d77284105a6158ec315ee38c.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_20_3e_20_3e_685',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; std::reference_wrapper&lt; T &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01std_1b569951bd408b620bb545799a6089d25.html',1,'dlaf::internal']]],
-  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20t_20_3e_20_3e_20_3e_686',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; T &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01_t_01_4_01_4_01_4.html',1,'dlaf::internal']]],
-  ['singlethreadedblasscope_687',['SingleThreadedBlasScope',['../classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html',1,'dlaf::common::internal']]],
-  ['size2d_688',['Size2D',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_689',['Size2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_690',['Size2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_691',['Size2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocalelement_5ftag_20_3e_692',['Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_693',['Size2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['size2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_694',['Size2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
-  ['source_5flocation_695',['source_location',['../structdlaf_1_1common_1_1internal_1_1source__location.html',1,'dlaf::common::internal']]],
-  ['submatrixview_696',['SubMatrixView',['../structdlaf_1_1matrix_1_1_sub_matrix_view.html',1,'dlaf::matrix']]],
-  ['subpanelview_697',['SubPanelView',['../structdlaf_1_1matrix_1_1_sub_panel_view.html',1,'dlaf::matrix']]],
-  ['subpipelinetag_698',['SubPipelineTag',['../structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
-  ['subtilespec_699',['SubTileSpec',['../structdlaf_1_1matrix_1_1_sub_tile_spec.html',1,'dlaf::matrix']]],
-  ['sweepworker_700',['SweepWorker',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker.html',1,'dlaf::eigensolver::internal']]],
-  ['sweepworkerdist_701',['SweepWorkerDist',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker_dist.html',1,'dlaf::eigensolver::internal']]]
+  ['scopedinitializer_684',['ScopedInitializer',['../structdlaf_1_1_scoped_initializer.html',1,'dlaf']]],
+  ['sendersinglevaluetypeimpl_685',['SenderSingleValueTypeImpl',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3aread_20_3e_20_3e_20_3e_20_3e_686',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::read &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_356df456d49829a554002eacb85cc5b7.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5fwrapper_3c_20rwtype_2c_20rtype_2c_20pika_3a_3aexecution_3a_3aexperimental_3a_3aasync_5frw_5fmutex_5faccess_5ftype_3a_3areadwrite_20_3e_20_3e_20_3e_20_3e_687',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; pika::execution::experimental::async_rw_mutex_access_wrapper&lt; RWType, RType, pika::execution::experimental::async_rw_mutex_access_type::readwrite &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01pika_3535bbe9d77284105a6158ec315ee38c.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20std_3a_3areference_5fwrapper_3c_20t_20_3e_20_3e_20_3e_20_3e_688',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; std::reference_wrapper&lt; T &gt; &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01std_1b569951bd408b620bb545799a6089d25.html',1,'dlaf::internal']]],
+  ['sendersinglevaluetypeimpl_3c_20typelist_3c_20typelist_3c_20t_20_3e_20_3e_20_3e_689',['SenderSingleValueTypeImpl&lt; TypeList&lt; TypeList&lt; T &gt; &gt; &gt;',['../structdlaf_1_1internal_1_1_sender_single_value_type_impl_3_01_type_list_3_01_type_list_3_01_t_01_4_01_4_01_4.html',1,'dlaf::internal']]],
+  ['singlethreadedblasscope_690',['SingleThreadedBlasScope',['../classdlaf_1_1common_1_1internal_1_1_single_threaded_blas_scope.html',1,'dlaf::common::internal']]],
+  ['size2d_691',['Size2D',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20indext_5fmpi_2c_20tag_5fmpi_20_3e_692',['Size2D&lt; IndexT_MPI, TAG_MPI &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobalelement_5ftag_20_3e_693',['Size2D&lt; SizeType, matrix::GlobalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3aglobaltile_5ftag_20_3e_694',['Size2D&lt; SizeType, matrix::GlobalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocalelement_5ftag_20_3e_695',['Size2D&lt; SizeType, matrix::LocalElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3alocaltile_5ftag_20_3e_696',['Size2D&lt; SizeType, matrix::LocalTile_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['size2d_3c_20sizetype_2c_20matrix_3a_3atileelement_5ftag_20_3e_697',['Size2D&lt; SizeType, matrix::TileElement_TAG &gt;',['../classdlaf_1_1common_1_1_size2_d.html',1,'dlaf::common']]],
+  ['source_5flocation_698',['source_location',['../structdlaf_1_1common_1_1internal_1_1source__location.html',1,'dlaf::common::internal']]],
+  ['submatrixview_699',['SubMatrixView',['../structdlaf_1_1matrix_1_1_sub_matrix_view.html',1,'dlaf::matrix']]],
+  ['subpanelview_700',['SubPanelView',['../structdlaf_1_1matrix_1_1_sub_panel_view.html',1,'dlaf::matrix']]],
+  ['subpipelinetag_701',['SubPipelineTag',['../structdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_1_1_sub_pipeline_tag.html',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['subtilespec_702',['SubTileSpec',['../structdlaf_1_1matrix_1_1_sub_tile_spec.html',1,'dlaf::matrix']]],
+  ['sweepworker_703',['SweepWorker',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker.html',1,'dlaf::eigensolver::internal']]],
+  ['sweepworkerdist_704',['SweepWorkerDist',['../classdlaf_1_1eigensolver_1_1internal_1_1_sweep_worker_dist.html',1,'dlaf::eigensolver::internal']]]
 ];
diff --git a/master/search/defines_0.js b/master/search/defines_0.js
index fad889f1ec..1ef5bcd9e6 100644
--- a/master/search/defines_0.js
+++ b/master/search/defines_0.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['dlaf_5fmake_5fcallable_5fobject_1088',['DLAF_MAKE_CALLABLE_OBJECT',['../callable__object_8h.html#a5aafa5a9c65ad07da48410427f4825b2',1,'callable_object.h']]]
+  ['dlaf_5fmake_5fcallable_5fobject_1094',['DLAF_MAKE_CALLABLE_OBJECT',['../callable__object_8h.html#a5aafa5a9c65ad07da48410427f4825b2',1,'callable_object.h']]]
 ];
diff --git a/master/search/defines_1.js b/master/search/defines_1.js
index 6e19ff6ae1..ab45cfe071 100644
--- a/master/search/defines_1.js
+++ b/master/search/defines_1.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['source_5flocation_1089',['SOURCE_LOCATION',['../source__location_8h.html#aa6e6fc9684bd84ce7b72da6a2eef668f',1,'source_location.h']]]
+  ['source_5flocation_1095',['SOURCE_LOCATION',['../source__location_8h.html#aa6e6fc9684bd84ce7b72da6a2eef668f',1,'source_location.h']]]
 ];
diff --git a/master/search/enums_0.js b/master/search/enums_0.js
index 7d6f99ad27..1909209e7e 100644
--- a/master/search/enums_0.js
+++ b/master/search/enums_0.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['ordering_1084',['Ordering',['../index2d_8h.html#a02419996f0ffc187079c310f0175ce76',1,'dlaf::common']]]
+  ['ordering_1090',['Ordering',['../index2d_8h.html#a02419996f0ffc187079c310f0175ce76',1,'dlaf::common']]]
 ];
diff --git a/master/search/files_0.js b/master/search/files_0.js
index a3751432a0..257f497888 100644
--- a/master/search/files_0.js
+++ b/master/search/files_0.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['all_5freduce_2eh_745',['all_reduce.h',['../kernels_2all__reduce_8h.html',1,'(Global Namespace)'],['../sync_2all__reduce_8h.html',1,'(Global Namespace)']]],
-  ['auxiliary_2eh_746',['auxiliary.h',['../auxiliary_8h.html',1,'']]]
+  ['all_5freduce_2eh_748',['all_reduce.h',['../kernels_2all__reduce_8h.html',1,'(Global Namespace)'],['../sync_2all__reduce_8h.html',1,'(Global Namespace)']]],
+  ['auxiliary_2eh_749',['auxiliary.h',['../auxiliary_8h.html',1,'']]]
 ];
diff --git a/master/search/files_1.js b/master/search/files_1.js
index 9995c9de67..fa7a870b18 100644
--- a/master/search/files_1.js
+++ b/master/search/files_1.js
@@ -1,9 +1,9 @@
 var searchData=
 [
-  ['band_5fto_5ftridiag_2eh_747',['band_to_tridiag.h',['../band__to__tridiag_8h.html',1,'']]],
-  ['basic_2eh_748',['basic.h',['../basic_8h.html',1,'']]],
-  ['broadcast_2eh_749',['broadcast.h',['../kernels_2broadcast_8h.html',1,'(Global Namespace)'],['../sync_2broadcast_8h.html',1,'(Global Namespace)']]],
-  ['broadcast_5fpanel_2eh_750',['broadcast_panel.h',['../broadcast__panel_8h.html',1,'']]],
-  ['bt_5fband_5fto_5ftridiag_2eh_751',['bt_band_to_tridiag.h',['../bt__band__to__tridiag_8h.html',1,'']]],
-  ['bt_5freduction_5fto_5fband_2eh_752',['bt_reduction_to_band.h',['../bt__reduction__to__band_8h.html',1,'']]]
+  ['band_5fto_5ftridiag_2eh_750',['band_to_tridiag.h',['../band__to__tridiag_8h.html',1,'']]],
+  ['basic_2eh_751',['basic.h',['../basic_8h.html',1,'']]],
+  ['broadcast_2eh_752',['broadcast.h',['../kernels_2broadcast_8h.html',1,'(Global Namespace)'],['../sync_2broadcast_8h.html',1,'(Global Namespace)']]],
+  ['broadcast_5fpanel_2eh_753',['broadcast_panel.h',['../broadcast__panel_8h.html',1,'']]],
+  ['bt_5fband_5fto_5ftridiag_2eh_754',['bt_band_to_tridiag.h',['../bt__band__to__tridiag_8h.html',1,'']]],
+  ['bt_5freduction_5fto_5fband_2eh_755',['bt_reduction_to_band.h',['../bt__reduction__to__band_8h.html',1,'']]]
 ];
diff --git a/master/search/files_10.js b/master/search/files_10.js
index 85b864e224..0b346cc6e0 100644
--- a/master/search/files_10.js
+++ b/master/search/files_10.js
@@ -1,8 +1,8 @@
 var searchData=
 [
-  ['scal_2eh_799',['scal.h',['../scal_8h.html',1,'']]],
-  ['schedulers_2eh_800',['schedulers.h',['../schedulers_8h.html',1,'']]],
-  ['single_5fthreaded_5fblas_2eh_801',['single_threaded_blas.h',['../single__threaded__blas_8h.html',1,'']]],
-  ['solver_2eh_802',['solver.h',['../solver_8h.html',1,'']]],
-  ['source_5flocation_2eh_803',['source_location.h',['../source__location_8h.html',1,'']]]
+  ['scal_2eh_801',['scal.h',['../scal_8h.html',1,'']]],
+  ['schedulers_2eh_802',['schedulers.h',['../schedulers_8h.html',1,'']]],
+  ['single_5fthreaded_5fblas_2eh_803',['single_threaded_blas.h',['../single__threaded__blas_8h.html',1,'']]],
+  ['solver_2eh_804',['solver.h',['../solver_8h.html',1,'']]],
+  ['source_5flocation_2eh_805',['source_location.h',['../source__location_8h.html',1,'']]]
 ];
diff --git a/master/search/files_11.js b/master/search/files_11.js
index d9dd35f71b..d70fa6521c 100644
--- a/master/search/files_11.js
+++ b/master/search/files_11.js
@@ -1,12 +1,12 @@
 var searchData=
 [
-  ['tile_2eh_804',['tile.h',['../blas_2tile_8h.html',1,'(Global Namespace)'],['../lapack_2tile_8h.html',1,'(Global Namespace)'],['../matrix_2tile_8h.html',1,'(Global Namespace)']]],
-  ['tile_5fextensions_2eh_805',['tile_extensions.h',['../tile__extensions_8h.html',1,'']]],
-  ['timer_2eh_806',['timer.h',['../timer_8h.html',1,'']]],
-  ['traits_2eh_807',['traits.h',['../traits_8h.html',1,'']]],
-  ['triangular_2eh_808',['triangular.h',['../multiplication_2triangular_8h.html',1,'(Global Namespace)'],['../solver_2triangular_8h.html',1,'(Global Namespace)']]],
-  ['tridiag_5fsolver_2eh_809',['tridiag_solver.h',['../tridiag__solver_8h.html',1,'']]],
-  ['tune_2eh_810',['tune.h',['../tune_8h.html',1,'']]],
-  ['type_5fhandler_2eh_811',['type_handler.h',['../type__handler_8h.html',1,'']]],
-  ['types_2eh_812',['types.h',['../types_8h.html',1,'']]]
+  ['tile_2eh_806',['tile.h',['../blas_2tile_8h.html',1,'(Global Namespace)'],['../lapack_2tile_8h.html',1,'(Global Namespace)'],['../matrix_2tile_8h.html',1,'(Global Namespace)']]],
+  ['tile_5fextensions_2eh_807',['tile_extensions.h',['../tile__extensions_8h.html',1,'']]],
+  ['timer_2eh_808',['timer.h',['../timer_8h.html',1,'']]],
+  ['traits_2eh_809',['traits.h',['../traits_8h.html',1,'']]],
+  ['triangular_2eh_810',['triangular.h',['../multiplication_2triangular_8h.html',1,'(Global Namespace)'],['../solver_2triangular_8h.html',1,'(Global Namespace)']]],
+  ['tridiag_5fsolver_2eh_811',['tridiag_solver.h',['../tridiag__solver_8h.html',1,'']]],
+  ['tune_2eh_812',['tune.h',['../tune_8h.html',1,'']]],
+  ['type_5fhandler_2eh_813',['type_handler.h',['../type__handler_8h.html',1,'']]],
+  ['types_2eh_814',['types.h',['../types_8h.html',1,'']]]
 ];
diff --git a/master/search/files_12.js b/master/search/files_12.js
index 621bef8b11..a66b109a99 100644
--- a/master/search/files_12.js
+++ b/master/search/files_12.js
@@ -1,10 +1,10 @@
 var searchData=
 [
-  ['unwrap_2eh_813',['unwrap.h',['../unwrap_8h.html',1,'']]],
-  ['util_5fblas_2eh_814',['util_blas.h',['../util__blas_8h.html',1,'']]],
-  ['util_5fdistribution_2eh_815',['util_distribution.h',['../util__distribution_8h.html',1,'']]],
-  ['util_5flapack_2eh_816',['util_lapack.h',['../util__lapack_8h.html',1,'']]],
-  ['util_5fmath_2eh_817',['util_math.h',['../util__math_8h.html',1,'']]],
-  ['util_5fmatrix_2eh_818',['util_matrix.h',['../util__matrix_8h.html',1,'']]],
-  ['util_5ftile_2eh_819',['util_tile.h',['../util__tile_8h.html',1,'']]]
+  ['unwrap_2eh_815',['unwrap.h',['../unwrap_8h.html',1,'']]],
+  ['util_5fblas_2eh_816',['util_blas.h',['../util__blas_8h.html',1,'']]],
+  ['util_5fdistribution_2eh_817',['util_distribution.h',['../util__distribution_8h.html',1,'']]],
+  ['util_5flapack_2eh_818',['util_lapack.h',['../util__lapack_8h.html',1,'']]],
+  ['util_5fmath_2eh_819',['util_math.h',['../util__math_8h.html',1,'']]],
+  ['util_5fmatrix_2eh_820',['util_matrix.h',['../util__matrix_8h.html',1,'']]],
+  ['util_5ftile_2eh_821',['util_tile.h',['../util__tile_8h.html',1,'']]]
 ];
diff --git a/master/search/files_13.js b/master/search/files_13.js
index 798f9bda85..cd1a0c6b80 100644
--- a/master/search/files_13.js
+++ b/master/search/files_13.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['vector_2eh_820',['vector.h',['../vector_8h.html',1,'']]],
-  ['views_2eh_821',['views.h',['../views_8h.html',1,'']]]
+  ['vector_2eh_822',['vector.h',['../vector_8h.html',1,'']]],
+  ['views_2eh_823',['views.h',['../views_8h.html',1,'']]]
 ];
diff --git a/master/search/files_2.js b/master/search/files_2.js
index 816d3cefbb..d44a0d2e82 100644
--- a/master/search/files_2.js
+++ b/master/search/files_2.js
@@ -1,9 +1,9 @@
 var searchData=
 [
-  ['callable_5fobject_2eh_753',['callable_object.h',['../callable__object_8h.html',1,'']]],
-  ['cholesky_2eh_754',['cholesky.h',['../cholesky_8h.html',1,'']]],
-  ['communicator_2eh_755',['communicator.h',['../communicator_8h.html',1,'']]],
-  ['communicator_5fgrid_2eh_756',['communicator_grid.h',['../communicator__grid_8h.html',1,'']]],
-  ['copy_2eh_757',['copy.h',['../copy_8h.html',1,'']]],
-  ['copy_5ftile_2eh_758',['copy_tile.h',['../copy__tile_8h.html',1,'']]]
+  ['callable_5fobject_2eh_756',['callable_object.h',['../callable__object_8h.html',1,'']]],
+  ['cholesky_2eh_757',['cholesky.h',['../cholesky_8h.html',1,'']]],
+  ['communicator_2eh_758',['communicator.h',['../communicator_8h.html',1,'']]],
+  ['communicator_5fgrid_2eh_759',['communicator_grid.h',['../communicator__grid_8h.html',1,'']]],
+  ['copy_2eh_760',['copy.h',['../copy_8h.html',1,'']]],
+  ['copy_5ftile_2eh_761',['copy_tile.h',['../copy__tile_8h.html',1,'']]]
 ];
diff --git a/master/search/files_3.js b/master/search/files_3.js
index f3818d6f25..7bc5f78f93 100644
--- a/master/search/files_3.js
+++ b/master/search/files_3.js
@@ -1,7 +1,7 @@
 var searchData=
 [
-  ['data_2eh_759',['data.h',['../data_8h.html',1,'']]],
-  ['data_5fdescriptor_2eh_760',['data_descriptor.h',['../data__descriptor_8h.html',1,'']]],
-  ['datatypes_2eh_761',['datatypes.h',['../datatypes_8h.html',1,'']]],
-  ['distribution_2eh_762',['distribution.h',['../distribution_8h.html',1,'']]]
+  ['data_2eh_762',['data.h',['../data_8h.html',1,'']]],
+  ['data_5fdescriptor_2eh_763',['data_descriptor.h',['../data__descriptor_8h.html',1,'']]],
+  ['datatypes_2eh_764',['datatypes.h',['../datatypes_8h.html',1,'']]],
+  ['distribution_2eh_765',['distribution.h',['../distribution_8h.html',1,'']]]
 ];
diff --git a/master/search/files_4.js b/master/search/files_4.js
index 940b9126f4..93ae241fbd 100644
--- a/master/search/files_4.js
+++ b/master/search/files_4.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['eigensolver_2eh_763',['eigensolver.h',['../eigensolver_2eigensolver_8h.html',1,'(Global Namespace)'],['../eigensolver_8h.html',1,'(Global Namespace)']]],
-  ['enum_5foutput_2eh_764',['enum_output.h',['../blas_2enum__output_8h.html',1,'']]],
-  ['error_2eh_765',['error.h',['../communication_2error_8h.html',1,'']]]
+  ['eigensolver_2eh_766',['eigensolver.h',['../eigensolver_2eigensolver_8h.html',1,'(Global Namespace)'],['../eigensolver_8h.html',1,'(Global Namespace)']]],
+  ['enum_5foutput_2eh_767',['enum_output.h',['../blas_2enum__output_8h.html',1,'']]],
+  ['error_2eh_768',['error.h',['../communication_2error_8h.html',1,'']]]
 ];
diff --git a/master/search/files_5.js b/master/search/files_5.js
index e574a8dda3..f5e1d19419 100644
--- a/master/search/files_5.js
+++ b/master/search/files_5.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['factorization_2eh_766',['factorization.h',['../factorization_8h.html',1,'']]],
-  ['format_5fshort_2eh_767',['format_short.h',['../format__short_8h.html',1,'']]],
-  ['functions_5fsync_2eh_768',['functions_sync.h',['../functions__sync_8h.html',1,'']]]
+  ['factorization_2eh_769',['factorization.h',['../factorization_8h.html',1,'']]],
+  ['format_5fshort_2eh_770',['format_short.h',['../format__short_8h.html',1,'']]],
+  ['functions_5fsync_2eh_771',['functions_sync.h',['../functions__sync_8h.html',1,'']]]
 ];
diff --git a/master/search/files_6.js b/master/search/files_6.js
index f1d7ac052f..107a0a93d3 100644
--- a/master/search/files_6.js
+++ b/master/search/files_6.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['gen_5feigensolver_2eh_769',['gen_eigensolver.h',['../gen__eigensolver_8h.html',1,'']]],
-  ['gen_5fto_5fstd_2eh_770',['gen_to_std.h',['../gen__to__std_8h.html',1,'']]],
-  ['general_2eh_771',['general.h',['../multiplication_2general_8h.html',1,'(Global Namespace)'],['../permutations_2general_8h.html',1,'(Global Namespace)']]]
+  ['gen_5feigensolver_2eh_772',['gen_eigensolver.h',['../gen__eigensolver_8h.html',1,'']]],
+  ['gen_5fto_5fstd_2eh_773',['gen_to_std.h',['../gen__to__std_8h.html',1,'']]],
+  ['general_2eh_774',['general.h',['../multiplication_2general_8h.html',1,'(Global Namespace)'],['../permutations_2general_8h.html',1,'(Global Namespace)']]]
 ];
diff --git a/master/search/files_7.js b/master/search/files_7.js
index 8cc7a034a5..653223e42e 100644
--- a/master/search/files_7.js
+++ b/master/search/files_7.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['hermitian_2eh_772',['hermitian.h',['../hermitian_8h.html',1,'']]]
+  ['hermitian_2eh_775',['hermitian.h',['../hermitian_8h.html',1,'']]]
 ];
diff --git a/master/search/files_8.js b/master/search/files_8.js
index 0c438af520..718042f7c0 100644
--- a/master/search/files_8.js
+++ b/master/search/files_8.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['index_2eh_773',['index.h',['../index_8h.html',1,'']]],
-  ['index2d_2eh_774',['index2d.h',['../index2d_8h.html',1,'']]],
-  ['init_2eh_775',['init.h',['../communication_2init_8h.html',1,'(Global Namespace)'],['../init_8h.html',1,'(Global Namespace)']]]
+  ['index_2eh_776',['index.h',['../index_8h.html',1,'']]],
+  ['index2d_2eh_777',['index2d.h',['../index2d_8h.html',1,'']]],
+  ['init_2eh_778',['init.h',['../communication_2init_8h.html',1,'(Global Namespace)'],['../init_8h.html',1,'(Global Namespace)']]]
 ];
diff --git a/master/search/files_9.js b/master/search/files_9.js
index de2bcb8782..fe731f04fe 100644
--- a/master/search/files_9.js
+++ b/master/search/files_9.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['kernels_2eh_776',['kernels.h',['../communication_2kernels_8h.html',1,'']]]
+  ['kernels_2eh_779',['kernels.h',['../communication_2kernels_8h.html',1,'']]]
 ];
diff --git a/master/search/files_a.js b/master/search/files_a.js
index 0968144c44..502a44dfd5 100644
--- a/master/search/files_a.js
+++ b/master/search/files_a.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['layout_5finfo_2eh_777',['layout_info.h',['../layout__info_8h.html',1,'']]]
+  ['layout_5finfo_2eh_780',['layout_info.h',['../layout__info_8h.html',1,'']]]
 ];
diff --git a/master/search/files_b.js b/master/search/files_b.js
index 5619eee3ce..ce5f41e9a5 100644
--- a/master/search/files_b.js
+++ b/master/search/files_b.js
@@ -1,9 +1,9 @@
 var searchData=
 [
-  ['matrix_2eh_778',['matrix.h',['../matrix_8h.html',1,'']]],
-  ['matrix_5fbase_2eh_779',['matrix_base.h',['../matrix__base_8h.html',1,'']]],
-  ['matrix_5fmirror_2eh_780',['matrix_mirror.h',['../matrix__mirror_8h.html',1,'']]],
-  ['memory_5fchunk_2eh_781',['memory_chunk.h',['../memory__chunk_8h.html',1,'']]],
-  ['memory_5fview_2eh_782',['memory_view.h',['../memory__view_8h.html',1,'']]],
-  ['message_2eh_783',['message.h',['../message_8h.html',1,'']]]
+  ['matrix_2eh_781',['matrix.h',['../matrix_8h.html',1,'']]],
+  ['matrix_5fbase_2eh_782',['matrix_base.h',['../matrix__base_8h.html',1,'']]],
+  ['matrix_5fmirror_2eh_783',['matrix_mirror.h',['../matrix__mirror_8h.html',1,'']]],
+  ['memory_5fchunk_2eh_784',['memory_chunk.h',['../memory__chunk_8h.html',1,'']]],
+  ['memory_5fview_2eh_785',['memory_view.h',['../memory__view_8h.html',1,'']]],
+  ['message_2eh_786',['message.h',['../message_8h.html',1,'']]]
 ];
diff --git a/master/search/files_c.js b/master/search/files_c.js
index 2b58fe0939..05208b2906 100644
--- a/master/search/files_c.js
+++ b/master/search/files_c.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['norm_2eh_784',['norm.h',['../norm_8h.html',1,'']]]
+  ['norm_2eh_787',['norm.h',['../norm_8h.html',1,'']]]
 ];
diff --git a/master/search/files_d.js b/master/search/files_d.js
index 12701aa695..92897be57b 100644
--- a/master/search/files_d.js
+++ b/master/search/files_d.js
@@ -1,10 +1,10 @@
 var searchData=
 [
-  ['p2p_2eh_785',['p2p.h',['../p2p_8h.html',1,'']]],
-  ['p2p_5fallsum_2eh_786',['p2p_allsum.h',['../p2p__allsum_8h.html',1,'']]],
-  ['panel_2eh_787',['panel.h',['../panel_8h.html',1,'']]],
-  ['pipeline_2eh_788',['pipeline.h',['../pipeline_8h.html',1,'']]],
-  ['print_5fcsv_2eh_789',['print_csv.h',['../print__csv_8h.html',1,'']]],
-  ['print_5fgpu_2eh_790',['print_gpu.h',['../print__gpu_8h.html',1,'']]],
-  ['print_5fnumpy_2eh_791',['print_numpy.h',['../print__numpy_8h.html',1,'']]]
+  ['p2p_2eh_788',['p2p.h',['../p2p_8h.html',1,'']]],
+  ['p2p_5fallsum_2eh_789',['p2p_allsum.h',['../p2p__allsum_8h.html',1,'']]],
+  ['panel_2eh_790',['panel.h',['../panel_8h.html',1,'']]],
+  ['pipeline_2eh_791',['pipeline.h',['../pipeline_8h.html',1,'']]],
+  ['print_5fcsv_2eh_792',['print_csv.h',['../print__csv_8h.html',1,'']]],
+  ['print_5fgpu_2eh_793',['print_gpu.h',['../print__gpu_8h.html',1,'']]],
+  ['print_5fnumpy_2eh_794',['print_numpy.h',['../print__numpy_8h.html',1,'']]]
 ];
diff --git a/master/search/files_e.js b/master/search/files_e.js
index 61babb9e72..70b06c4b51 100644
--- a/master/search/files_e.js
+++ b/master/search/files_e.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['qr_2eh_792',['qr.h',['../qr_8h.html',1,'']]]
+  ['qr_2eh_795',['qr.h',['../qr_8h.html',1,'']]]
 ];
diff --git a/master/search/files_f.js b/master/search/files_f.js
index cd579f9cb8..9acc87001d 100644
--- a/master/search/files_f.js
+++ b/master/search/files_f.js
@@ -1,9 +1,8 @@
 var searchData=
 [
-  ['range2d_2eh_793',['range2d.h',['../range2d_8h.html',1,'']]],
-  ['rdma_2eh_794',['rdma.h',['../rdma_8h.html',1,'']]],
-  ['reduce_2eh_795',['reduce.h',['../kernels_2reduce_8h.html',1,'(Global Namespace)'],['../sync_2reduce_8h.html',1,'(Global Namespace)']]],
-  ['reduction_5fto_5fband_2eh_796',['reduction_to_band.h',['../reduction__to__band_8h.html',1,'']]],
-  ['retiled_5fmatrix_2eh_797',['retiled_matrix.h',['../retiled__matrix_8h.html',1,'']]],
-  ['round_5frobin_2eh_798',['round_robin.h',['../round__robin_8h.html',1,'']]]
+  ['range2d_2eh_796',['range2d.h',['../range2d_8h.html',1,'']]],
+  ['rdma_2eh_797',['rdma.h',['../rdma_8h.html',1,'']]],
+  ['reduce_2eh_798',['reduce.h',['../kernels_2reduce_8h.html',1,'(Global Namespace)'],['../sync_2reduce_8h.html',1,'(Global Namespace)']]],
+  ['reduction_5fto_5fband_2eh_799',['reduction_to_band.h',['../reduction__to__band_8h.html',1,'']]],
+  ['round_5frobin_2eh_800',['round_robin.h',['../round__robin_8h.html',1,'']]]
 ];
diff --git a/master/search/functions_0.js b/master/search/functions_0.js
index bf522edcdb..fffd6efcea 100644
--- a/master/search/functions_0.js
+++ b/master/search/functions_0.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['add_822',['add',['../tile__extensions_8h.html#aaff9e7cefc29db10ec4d5619a723b1e8',1,'dlaf::tile::add(T alpha, const matrix::Tile&lt; const T, D &gt; &amp;tile_b, const matrix::Tile&lt; T, D &gt; &amp;tile_a)'],['../tile__extensions_8h.html#aee89b6690331c2208abce640e9bd81a7',1,'dlaf::tile::add(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../tile__extensions_8h.html#ab6d1e869fabafc8c41981cb76e3bb543',1,'dlaf::tile::add(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['allreduce_823',['allReduce',['../sync_2all__reduce_8h.html#ab2ce05dba76e64025b65287f83331332',1,'dlaf::comm::sync']]],
-  ['allreduceinplace_824',['allReduceInPlace',['../sync_2all__reduce_8h.html#ac31a941ab370f1930ce5ed0f0717b00b',1,'dlaf::comm::sync']]]
+  ['add_824',['add',['../tile__extensions_8h.html#aaff9e7cefc29db10ec4d5619a723b1e8',1,'dlaf::tile::add(T alpha, const matrix::Tile&lt; const T, D &gt; &amp;tile_b, const matrix::Tile&lt; T, D &gt; &amp;tile_a)'],['../tile__extensions_8h.html#aee89b6690331c2208abce640e9bd81a7',1,'dlaf::tile::add(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../tile__extensions_8h.html#ab6d1e869fabafc8c41981cb76e3bb543',1,'dlaf::tile::add(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['allreduce_825',['allReduce',['../sync_2all__reduce_8h.html#ab2ce05dba76e64025b65287f83331332',1,'dlaf::comm::sync']]],
+  ['allreduceinplace_826',['allReduceInPlace',['../sync_2all__reduce_8h.html#ac31a941ab370f1930ce5ed0f0717b00b',1,'dlaf::comm::sync']]]
 ];
diff --git a/master/search/functions_1.js b/master/search/functions_1.js
index 77ae9b9d77..2923fc470f 100644
--- a/master/search/functions_1.js
+++ b/master/search/functions_1.js
@@ -1,11 +1,11 @@
 var searchData=
 [
-  ['backtransformationreductiontoband_825',['backTransformationReductionToBand',['../bt__reduction__to__band_8h.html#aa0009f01a9bcae7b94d16e3696433ef8',1,'dlaf::eigensolver::backTransformationReductionToBand(comm::CommunicatorGrid grid, const SizeType b, Matrix&lt; T, device &gt; &amp;mat_c, Matrix&lt; const T, device &gt; &amp;mat_v, Matrix&lt; const T, Device::CPU &gt; &amp;mat_taus)'],['../bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03',1,'dlaf::eigensolver::backTransformationReductionToBand(const SizeType b, Matrix&lt; T, device &gt; &amp;mat_c, Matrix&lt; const T, device &gt; &amp;mat_v, Matrix&lt; const T, Device::CPU &gt; &amp;mat_taus)']]],
-  ['bandtotridiag_826',['bandToTridiag',['../band__to__tridiag_8h.html#ad81b7972326c06b90ed419d9169351fc',1,'dlaf::eigensolver::bandToTridiag(comm::CommunicatorGrid grid, blas::Uplo uplo, SizeType band_size, Matrix&lt; const T, device &gt; &amp;mat_a)'],['../band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434',1,'dlaf::eigensolver::bandToTridiag(blas::Uplo uplo, SizeType band_size, Matrix&lt; const T, D &gt; &amp;mat_a)']]],
-  ['basetilesize_827',['baseTileSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#add48022e3fd9298035052a023fa6dbb0',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['basic_5fcoords_828',['basic_coords',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a80a7c82a6cf0cef1cb765fb62ab42173',1,'dlaf::common::internal::basic_coords::basic_coords(IndexT row, IndexT col) noexcept'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a0f13ee129706aa74fefba6cefa29ab55',1,'dlaf::common::internal::basic_coords::basic_coords(Coord component, IndexT value, IndexT fixed=0) noexcept'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#ac7a56bcf4ceaad4b19c02b12a9b7e5df',1,'dlaf::common::internal::basic_coords::basic_coords(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept'],['../classdlaf_1_1common_1_1_size2_d.html#a80a7c82a6cf0cef1cb765fb62ab42173',1,'dlaf::common::Size2D::basic_coords(IndexT row, IndexT col) noexcept'],['../classdlaf_1_1common_1_1_size2_d.html#a0f13ee129706aa74fefba6cefa29ab55',1,'dlaf::common::Size2D::basic_coords(Coord component, IndexT value, IndexT fixed=0) noexcept'],['../classdlaf_1_1common_1_1_size2_d.html#ac7a56bcf4ceaad4b19c02b12a9b7e5df',1,'dlaf::common::Size2D::basic_coords(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#a80a7c82a6cf0cef1cb765fb62ab42173',1,'dlaf::common::Index2D::basic_coords(IndexT row, IndexT col) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#a0f13ee129706aa74fefba6cefa29ab55',1,'dlaf::common::Index2D::basic_coords(Coord component, IndexT value, IndexT fixed=0) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#ac7a56bcf4ceaad4b19c02b12a9b7e5df',1,'dlaf::common::Index2D::basic_coords(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept']]],
-  ['blocksize_829',['blockSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a3f645fd23ce4c20591fdd2738b235f92',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['blocksize_830',['blocksize',['../structdlaf_1_1common_1_1_data_descriptor.html#aeb70d2395b5e4f49d56e133d3d4b3dd3',1,'dlaf::common::DataDescriptor']]],
-  ['broadcast_831',['broadcast',['../broadcast__panel_8h.html#a83a59dd8a250067f25b9b4bbd041a9cf',1,'dlaf::comm::broadcast(comm::IndexT_MPI rank_root, matrix::Panel&lt; axis, T, D, storage &gt; &amp;panel, common::Pipeline&lt; comm::Communicator &gt; &amp;serial_comm)'],['../broadcast__panel_8h.html#a6e56082c935ff28b0184870563b4069b',1,'dlaf::comm::broadcast(comm::IndexT_MPI rank_root, matrix::Panel&lt; axis, T, D, storage &gt; &amp;panel, matrix::Panel&lt; orthogonal(axis), T, D, storageT &gt; &amp;panelT, common::Pipeline&lt; comm::Communicator &gt; &amp;row_task_chain, common::Pipeline&lt; comm::Communicator &gt; &amp;col_task_chain)']]],
-  ['buffer_832',['Buffer',['../structdlaf_1_1common_1_1_buffer.html#a904065ced6826be020d27b87b4d7596d',1,'dlaf::common::Buffer::Buffer(const SizeType N)'],['../structdlaf_1_1common_1_1_buffer.html#a84240f0e2434c412292ed0c1a9db6c61',1,'dlaf::common::Buffer::Buffer(std::unique_ptr&lt; T[]&gt; &amp;&amp;memory, const SizeType N)'],['../structdlaf_1_1common_1_1_buffer.html#ae96ced7d357b20a027c5499aad807293',1,'dlaf::common::Buffer::Buffer()=default']]]
+  ['backtransformationreductiontoband_827',['backTransformationReductionToBand',['../bt__reduction__to__band_8h.html#aa0009f01a9bcae7b94d16e3696433ef8',1,'dlaf::eigensolver::backTransformationReductionToBand(comm::CommunicatorGrid grid, const SizeType b, Matrix&lt; T, device &gt; &amp;mat_c, Matrix&lt; const T, device &gt; &amp;mat_v, Matrix&lt; const T, Device::CPU &gt; &amp;mat_taus)'],['../bt__reduction__to__band_8h.html#a04e50376b3136f312c5c4114b917ae03',1,'dlaf::eigensolver::backTransformationReductionToBand(const SizeType b, Matrix&lt; T, device &gt; &amp;mat_c, Matrix&lt; const T, device &gt; &amp;mat_v, Matrix&lt; const T, Device::CPU &gt; &amp;mat_taus)']]],
+  ['bandtotridiag_828',['bandToTridiag',['../band__to__tridiag_8h.html#ad81b7972326c06b90ed419d9169351fc',1,'dlaf::eigensolver::bandToTridiag(comm::CommunicatorGrid grid, blas::Uplo uplo, SizeType band_size, Matrix&lt; const T, device &gt; &amp;mat_a)'],['../band__to__tridiag_8h.html#a5389b4333d5882eb71a9ccf6a24b2434',1,'dlaf::eigensolver::bandToTridiag(blas::Uplo uplo, SizeType band_size, Matrix&lt; const T, D &gt; &amp;mat_a)']]],
+  ['basetilesize_829',['baseTileSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#add48022e3fd9298035052a023fa6dbb0',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['basic_5fcoords_830',['basic_coords',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a80a7c82a6cf0cef1cb765fb62ab42173',1,'dlaf::common::internal::basic_coords::basic_coords(IndexT row, IndexT col) noexcept'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a0f13ee129706aa74fefba6cefa29ab55',1,'dlaf::common::internal::basic_coords::basic_coords(Coord component, IndexT value, IndexT fixed=0) noexcept'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#ac7a56bcf4ceaad4b19c02b12a9b7e5df',1,'dlaf::common::internal::basic_coords::basic_coords(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept'],['../classdlaf_1_1common_1_1_size2_d.html#a80a7c82a6cf0cef1cb765fb62ab42173',1,'dlaf::common::Size2D::basic_coords(IndexT row, IndexT col) noexcept'],['../classdlaf_1_1common_1_1_size2_d.html#a0f13ee129706aa74fefba6cefa29ab55',1,'dlaf::common::Size2D::basic_coords(Coord component, IndexT value, IndexT fixed=0) noexcept'],['../classdlaf_1_1common_1_1_size2_d.html#ac7a56bcf4ceaad4b19c02b12a9b7e5df',1,'dlaf::common::Size2D::basic_coords(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#a80a7c82a6cf0cef1cb765fb62ab42173',1,'dlaf::common::Index2D::basic_coords(IndexT row, IndexT col) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#a0f13ee129706aa74fefba6cefa29ab55',1,'dlaf::common::Index2D::basic_coords(Coord component, IndexT value, IndexT fixed=0) noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#ac7a56bcf4ceaad4b19c02b12a9b7e5df',1,'dlaf::common::Index2D::basic_coords(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept']]],
+  ['blocksize_831',['blockSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a3f645fd23ce4c20591fdd2738b235f92',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['blocksize_832',['blocksize',['../structdlaf_1_1common_1_1_data_descriptor.html#aeb70d2395b5e4f49d56e133d3d4b3dd3',1,'dlaf::common::DataDescriptor']]],
+  ['broadcast_833',['broadcast',['../broadcast__panel_8h.html#a83a59dd8a250067f25b9b4bbd041a9cf',1,'dlaf::comm::broadcast(comm::IndexT_MPI rank_root, matrix::Panel&lt; axis, T, D, storage &gt; &amp;panel, common::Pipeline&lt; comm::Communicator &gt; &amp;serial_comm)'],['../broadcast__panel_8h.html#a6e56082c935ff28b0184870563b4069b',1,'dlaf::comm::broadcast(comm::IndexT_MPI rank_root, matrix::Panel&lt; axis, T, D, storage &gt; &amp;panel, matrix::Panel&lt; orthogonal(axis), T, D, storageT &gt; &amp;panelT, common::Pipeline&lt; comm::Communicator &gt; &amp;row_task_chain, common::Pipeline&lt; comm::Communicator &gt; &amp;col_task_chain)']]],
+  ['buffer_834',['Buffer',['../structdlaf_1_1common_1_1_buffer.html#a904065ced6826be020d27b87b4d7596d',1,'dlaf::common::Buffer::Buffer(const SizeType N)'],['../structdlaf_1_1common_1_1_buffer.html#a84240f0e2434c412292ed0c1a9db6c61',1,'dlaf::common::Buffer::Buffer(std::unique_ptr&lt; T[]&gt; &amp;&amp;memory, const SizeType N)'],['../structdlaf_1_1common_1_1_buffer.html#ae96ced7d357b20a027c5499aad807293',1,'dlaf::common::Buffer::Buffer()=default']]]
 ];
diff --git a/master/search/functions_10.js b/master/search/functions_10.js
index c940961679..2c5fded7c4 100644
--- a/master/search/functions_10.js
+++ b/master/search/functions_10.js
@@ -1,28 +1,28 @@
 var searchData=
 [
-  ['tile_1033',['Tile',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a73f2bfb1856011bce752fca6582ba584',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile()'],['../classdlaf_1_1matrix_1_1_tile.html#af4bddf624138747a5089071f1f57eee4',1,'dlaf::matrix::Tile::Tile()=default'],['../classdlaf_1_1matrix_1_1_tile.html#a4c7d7a75afcd2cc6911b40643f4f095f',1,'dlaf::matrix::Tile::Tile(const TileElementSize &amp;size, memory::MemoryView&lt; ElementType, D &gt; &amp;&amp;memory_view, SizeType ld) noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a38b4f570cc1ccedb8880d469d353414e',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile()']]],
-  ['tileelementfromelement_1034',['tileElementFromElement',['../util__distribution_8h.html#a77c1788e03f30e7d9511a7e90a89a494',1,'dlaf::util::matrix']]],
-  ['tileelementfromglobalelement_1035',['tileElementFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#afe2b66a02c3a1a78bfac1bb2f20f2864',1,'dlaf::matrix::Distribution']]],
-  ['tileelementindex_1036',['tileElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a71ad776a93750b9c6d1ebfa2d36e28db',1,'dlaf::matrix::Distribution']]],
-  ['tilefromelement_1037',['tileFromElement',['../util__distribution_8h.html#a8876d879740e8f24112ca972961e11c7',1,'dlaf::util::matrix']]],
-  ['tilelayout_1038',['tileLayout',['../layout__info_8h.html#a873adaaaa2e661caed98af371fbb1943',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution)'],['../layout__info_8h.html#a254e1e0948e647642b0f2615aeaa0ea2',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)'],['../layout__info_8h.html#a970afb0f1a7abc87e507e6c4d35f442a',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution, SizeType ld_tile, SizeType tiles_per_col)'],['../layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col)']]],
-  ['tilelinearindex_1039',['tileLinearIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['tileoffset_1040',['tileOffset',['../classdlaf_1_1matrix_1_1_layout_info.html#ad03e1291efd2ed416ace133a24a30ac4',1,'dlaf::matrix::LayoutInfo']]],
-  ['tilesize_1041',['tileSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5',1,'dlaf::matrix::internal::MatrixBase::tileSize()'],['../classdlaf_1_1matrix_1_1_layout_info.html#a62e3619b9016e9c827c120fce629d08e',1,'dlaf::matrix::LayoutInfo::tileSize()'],['../classdlaf_1_1matrix_1_1_distribution.html#a4cec137b1316902f68b63148d282be62',1,'dlaf::matrix::Distribution::tileSize(const GlobalTileIndex &amp;index) const noexcept']]],
-  ['tilesizefromglobalelement_1042',['tileSizeFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a3dd77d459960a11b56fc1e7fb27932f7',1,'dlaf::matrix::Distribution']]],
-  ['to_5fint_1043',['to_int',['../types_8h.html#af90e7fd5acadf5987b7199b0bd44deea',1,'dlaf']]],
-  ['to_5fsigned_1044',['to_signed',['../types_8h.html#aa39d2d6e54b007c18e1c57ff380c73cd',1,'dlaf::to_signed(const U unsigned_value)'],['../types_8h.html#a2246feaf3c49f3f3ae5928082363f7d3',1,'dlaf::to_signed(const SB value)']]],
-  ['to_5fsizet_1045',['to_sizet',['../types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1',1,'dlaf']]],
-  ['to_5fsizetype_1046',['to_SizeType',['../types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9',1,'dlaf']]],
-  ['to_5fuint_1047',['to_uint',['../types_8h.html#a4543febf91f08c23fd8a6eeca8f49d82',1,'dlaf']]],
-  ['to_5funsigned_1048',['to_unsigned',['../types_8h.html#afeb5db746331f9ca3a669373e1af84ba',1,'dlaf::to_unsigned(const S signed_value)'],['../types_8h.html#ae9973646cf4ce493ed1831a5bdbf7500',1,'dlaf::to_unsigned(const UB unsigned_value)']]],
-  ['total_5fops_1049',['total_ops',['../types_8h.html#a831d9cfa2a32641121185df5d9d70cdc',1,'dlaf']]],
-  ['transpose_1050',['transpose',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a98f8b3b0cd7b4c1fa62b40b9de0041bb',1,'dlaf::common::internal::basic_coords']]],
-  ['transposed_1051',['transposed',['../index2d_8h.html#a024753ac73fbefa174548c575327862b',1,'dlaf::common']]],
-  ['triangular_1052',['triangular',['../multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51',1,'dlaf::multiplication::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../multiplication_2triangular_8h.html#ad4de985e76a6c12c487b36fa773b870b',1,'dlaf::multiplication::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a9d48ec5978acfd3714a66613678a1afd',1,'dlaf::solver::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a3ff8022461abe72c4197e34601d592a9',1,'dlaf::solver::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
-  ['tridiagsolver_1053',['tridiagSolver',['../tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a',1,'dlaf::eigensolver::tridiagSolver(Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, device &gt; &amp;evals, Matrix&lt; T, device &gt; &amp;evecs)'],['../tridiag__solver_8h.html#a0cfeab14e9e1dc7a2fb703006cd7e957',1,'dlaf::eigensolver::tridiagSolver(comm::CommunicatorGrid grid, Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;evals, Matrix&lt; T, D &gt; &amp;evecs)']]],
-  ['trmm_1054',['trmm',['../blas_2tile_8h.html#a383ebe00fbfd1f328dd0378b8aa42b89',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#a185aa2ac627de6e9e393240cda2b5f4c',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a61397e6748a24f13ee6ad7f23e5339f7',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)']]],
-  ['trmm3_1055',['trmm3',['../blas_2tile_8h.html#a0cdf7b22f8a310978252ff7a0c456b98',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a9906093b08eefa0a5341b140ce6100a3',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#aebff48d52916dafd14479dc3b1e04e8e',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const Tile&lt; T, D &gt; &amp;c)']]],
-  ['trsm_1056',['trsm',['../blas_2tile_8h.html#a1b11d671c920bf9dce76092e6d1aaa8c',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a23eb607d942637d4e14331a2f0f253f7',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#a2fe48f2d3a3a7515a99805d135c5b2ce',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)']]],
-  ['type_5fhandler_1057',['type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa71d40004e1c645161b1d00b511ad9ee',1,'dlaf::comm::internal::type_handler::type_handler() noexcept=default'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa9eebfb39b8aabe2344f61a7bf26ee40',1,'dlaf::comm::internal::type_handler::type_handler(SizeType nblocks, SizeType block_size, SizeType stride)']]]
+  ['tile_1039',['Tile',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a73f2bfb1856011bce752fca6582ba584',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile()'],['../classdlaf_1_1matrix_1_1_tile.html#af4bddf624138747a5089071f1f57eee4',1,'dlaf::matrix::Tile::Tile()=default'],['../classdlaf_1_1matrix_1_1_tile.html#a4c7d7a75afcd2cc6911b40643f4f095f',1,'dlaf::matrix::Tile::Tile(const TileElementSize &amp;size, memory::MemoryView&lt; ElementType, D &gt; &amp;&amp;memory_view, SizeType ld) noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a38b4f570cc1ccedb8880d469d353414e',1,'dlaf::matrix::Tile&lt; const T, D &gt;::Tile()']]],
+  ['tileelementfromelement_1040',['tileElementFromElement',['../util__distribution_8h.html#a77c1788e03f30e7d9511a7e90a89a494',1,'dlaf::util::matrix']]],
+  ['tileelementfromglobalelement_1041',['tileElementFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#afe2b66a02c3a1a78bfac1bb2f20f2864',1,'dlaf::matrix::Distribution']]],
+  ['tileelementindex_1042',['tileElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a71ad776a93750b9c6d1ebfa2d36e28db',1,'dlaf::matrix::Distribution']]],
+  ['tilefromelement_1043',['tileFromElement',['../util__distribution_8h.html#a8876d879740e8f24112ca972961e11c7',1,'dlaf::util::matrix']]],
+  ['tilelayout_1044',['tileLayout',['../layout__info_8h.html#a873adaaaa2e661caed98af371fbb1943',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution)'],['../layout__info_8h.html#a254e1e0948e647642b0f2615aeaa0ea2',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)'],['../layout__info_8h.html#a970afb0f1a7abc87e507e6c4d35f442a',1,'dlaf::matrix::tileLayout(const matrix::Distribution &amp;distribution, SizeType ld_tile, SizeType tiles_per_col)'],['../layout__info_8h.html#a94ba1a30c8eef4798f864ae119c77113',1,'dlaf::matrix::tileLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col)']]],
+  ['tilelinearindex_1045',['tileLinearIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a5cdaa0376724e6f624591a6a6bcf46d9',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['tileoffset_1046',['tileOffset',['../classdlaf_1_1matrix_1_1_layout_info.html#ad03e1291efd2ed416ace133a24a30ac4',1,'dlaf::matrix::LayoutInfo']]],
+  ['tilesize_1047',['tileSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a891c1da69cefcfdfb73b3915ccc2cce5',1,'dlaf::matrix::internal::MatrixBase::tileSize()'],['../classdlaf_1_1matrix_1_1_layout_info.html#a62e3619b9016e9c827c120fce629d08e',1,'dlaf::matrix::LayoutInfo::tileSize()'],['../classdlaf_1_1matrix_1_1_distribution.html#a4cec137b1316902f68b63148d282be62',1,'dlaf::matrix::Distribution::tileSize(const GlobalTileIndex &amp;index) const noexcept']]],
+  ['tilesizefromglobalelement_1048',['tileSizeFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a3dd77d459960a11b56fc1e7fb27932f7',1,'dlaf::matrix::Distribution']]],
+  ['to_5fint_1049',['to_int',['../types_8h.html#af90e7fd5acadf5987b7199b0bd44deea',1,'dlaf']]],
+  ['to_5fsigned_1050',['to_signed',['../types_8h.html#aa39d2d6e54b007c18e1c57ff380c73cd',1,'dlaf::to_signed(const U unsigned_value)'],['../types_8h.html#a2246feaf3c49f3f3ae5928082363f7d3',1,'dlaf::to_signed(const SB value)']]],
+  ['to_5fsizet_1051',['to_sizet',['../types_8h.html#a25d16ff6621f011d9a98be3d9ebf29f1',1,'dlaf']]],
+  ['to_5fsizetype_1052',['to_SizeType',['../types_8h.html#ab1f0edc8e1281293c9c1325cb9d4bec9',1,'dlaf']]],
+  ['to_5fuint_1053',['to_uint',['../types_8h.html#a4543febf91f08c23fd8a6eeca8f49d82',1,'dlaf']]],
+  ['to_5funsigned_1054',['to_unsigned',['../types_8h.html#afeb5db746331f9ca3a669373e1af84ba',1,'dlaf::to_unsigned(const S signed_value)'],['../types_8h.html#ae9973646cf4ce493ed1831a5bdbf7500',1,'dlaf::to_unsigned(const UB unsigned_value)']]],
+  ['total_5fops_1055',['total_ops',['../types_8h.html#a831d9cfa2a32641121185df5d9d70cdc',1,'dlaf']]],
+  ['transpose_1056',['transpose',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a98f8b3b0cd7b4c1fa62b40b9de0041bb',1,'dlaf::common::internal::basic_coords']]],
+  ['transposed_1057',['transposed',['../index2d_8h.html#a024753ac73fbefa174548c575327862b',1,'dlaf::common']]],
+  ['triangular_1058',['triangular',['../multiplication_2triangular_8h.html#a6300b8eb1a939512a5b1c45286e89f51',1,'dlaf::multiplication::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../multiplication_2triangular_8h.html#ad4de985e76a6c12c487b36fa773b870b',1,'dlaf::multiplication::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a9d48ec5978acfd3714a66613678a1afd',1,'dlaf::solver::triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../solver_2triangular_8h.html#a3ff8022461abe72c4197e34601d592a9',1,'dlaf::solver::triangular(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha, Matrix&lt; const T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
+  ['tridiagsolver_1059',['tridiagSolver',['../tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a',1,'dlaf::eigensolver::tridiagSolver(Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, device &gt; &amp;evals, Matrix&lt; T, device &gt; &amp;evecs)'],['../tridiag__solver_8h.html#a0cfeab14e9e1dc7a2fb703006cd7e957',1,'dlaf::eigensolver::tridiagSolver(comm::CommunicatorGrid grid, Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;evals, Matrix&lt; T, D &gt; &amp;evecs)']]],
+  ['trmm_1060',['trmm',['../blas_2tile_8h.html#a383ebe00fbfd1f328dd0378b8aa42b89',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#a185aa2ac627de6e9e393240cda2b5f4c',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a61397e6748a24f13ee6ad7f23e5339f7',1,'dlaf::tile::trmm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)']]],
+  ['trmm3_1061',['trmm3',['../blas_2tile_8h.html#a0cdf7b22f8a310978252ff7a0c456b98',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a9906093b08eefa0a5341b140ce6100a3',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#aebff48d52916dafd14479dc3b1e04e8e',1,'dlaf::tile::trmm3(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const Tile&lt; T, D &gt; &amp;c)']]],
+  ['trsm_1062',['trsm',['../blas_2tile_8h.html#a1b11d671c920bf9dce76092e6d1aaa8c',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a23eb607d942637d4e14331a2f0f253f7',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#a2fe48f2d3a3a7515a99805d135c5b2ce',1,'dlaf::tile::trsm(const dlaf::internal::Policy&lt; B &gt; &amp;policy, const blas::Side side, const blas::Uplo uplo, const blas::Op op, const blas::Diag diag, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; T, D &gt; &amp;b)']]],
+  ['type_5fhandler_1063',['type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa71d40004e1c645161b1d00b511ad9ee',1,'dlaf::comm::internal::type_handler::type_handler() noexcept=default'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#aa9eebfb39b8aabe2344f61a7bf26ee40',1,'dlaf::comm::internal::type_handler::type_handler(SizeType nblocks, SizeType block_size, SizeType stride)']]]
 ];
diff --git a/master/search/functions_11.js b/master/search/functions_11.js
index 0d08b82294..bc55d253c5 100644
--- a/master/search/functions_11.js
+++ b/master/search/functions_11.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['unwrap_1058',['unwrap',['../unwrap_8h.html#a8da70a5535ac987a8f6ca7f8b195547d',1,'dlaf::common::internal']]]
+  ['unwrap_1064',['unwrap',['../unwrap_8h.html#a8da70a5535ac987a8f6ca7f8b195547d',1,'dlaf::common::internal']]]
 ];
diff --git a/master/search/functions_12.js b/master/search/functions_12.js
index 4bd74569a7..9bb3d270a1 100644
--- a/master/search/functions_12.js
+++ b/master/search/functions_12.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['valid_1059',['valid',['../classdlaf_1_1common_1_1_pipeline.html#affda528ea4c5e0e54f8fca4250b53af5',1,'dlaf::common::Pipeline::valid()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a3e3096bb1ef85b6017bd8c42c9617586',1,'dlaf::matrix::internal::TilePipeline::valid()']]],
-  ['view_1060',['View',['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a3635af3164815f905a9fd33979a14a34',1,'dlaf::matrix::internal::View']]]
+  ['valid_1065',['valid',['../classdlaf_1_1common_1_1_pipeline.html#affda528ea4c5e0e54f8fca4250b53af5',1,'dlaf::common::Pipeline::valid()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a3e3096bb1ef85b6017bd8c42c9617586',1,'dlaf::matrix::internal::TilePipeline::valid()']]],
+  ['view_1066',['View',['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a3635af3164815f905a9fd33979a14a34',1,'dlaf::matrix::internal::View']]]
 ];
diff --git a/master/search/functions_13.js b/master/search/functions_13.js
index 9ea6c3b8bd..41f8134b38 100644
--- a/master/search/functions_13.js
+++ b/master/search/functions_13.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['waitlocaltiles_1061',['waitLocalTiles',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::waitLocalTiles()'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#ab731cfea1c5b07288bc3b34c59cb37d0',1,'dlaf::matrix::RetiledMatrix::waitLocalTiles()']]]
+  ['waitlocaltiles_1067',['waitLocalTiles',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abffc73bf079f7f7c23af3fca4dec329f',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]]
 ];
diff --git a/master/search/functions_14.js b/master/search/functions_14.js
index 9ee18a9282..0438f1acd1 100644
--- a/master/search/functions_14.js
+++ b/master/search/functions_14.js
@@ -1,9 +1,9 @@
 var searchData=
 [
-  ['_7ematrixmirror_1062',['~MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a2eeef61985e20a9218d55e76548acfb5',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::~MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ae24915137508619315773c7a416f902f',1,'dlaf::matrix::MatrixMirror::~MatrixMirror()']]],
-  ['_7ememorychunk_1063',['~MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html#a597aa1c075db44808f7e14c9ec03e50b',1,'dlaf::memory::MemoryChunk']]],
-  ['_7empi_5finit_1064',['~mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html#a2413c9dc23983c5790cd0ebb3bb9e057',1,'dlaf::comm::mpi_init']]],
-  ['_7epanel_1065',['~Panel',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adab53d11d9904715b775df7c23ba6682',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['_7etile_1066',['~Tile',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a66f6b8ef0f4d9168c12715d0fc1b16dc',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
-  ['_7etype_5fhandler_1067',['~type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8fab81a168aa4f3441deb1a01f4a5171',1,'dlaf::comm::internal::type_handler']]]
+  ['_7ematrixmirror_1068',['~MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a2eeef61985e20a9218d55e76548acfb5',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::~MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ae24915137508619315773c7a416f902f',1,'dlaf::matrix::MatrixMirror::~MatrixMirror()']]],
+  ['_7ememorychunk_1069',['~MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html#a597aa1c075db44808f7e14c9ec03e50b',1,'dlaf::memory::MemoryChunk']]],
+  ['_7empi_5finit_1070',['~mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html#a2413c9dc23983c5790cd0ebb3bb9e057',1,'dlaf::comm::mpi_init']]],
+  ['_7epanel_1071',['~Panel',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adab53d11d9904715b775df7c23ba6682',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['_7etile_1072',['~Tile',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a66f6b8ef0f4d9168c12715d0fc1b16dc',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
+  ['_7etype_5fhandler_1073',['~type_handler',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8fab81a168aa4f3441deb1a01f4a5171',1,'dlaf::comm::internal::type_handler']]]
 ];
diff --git a/master/search/functions_2.js b/master/search/functions_2.js
index ce995d246f..1806efd95f 100644
--- a/master/search/functions_2.js
+++ b/master/search/functions_2.js
@@ -1,29 +1,29 @@
 var searchData=
 [
-  ['call_833',['call',['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html#ac73f315af163e45f509e230f362d1310',1,'dlaf::factorization::internal::QR_Tfactor::call(matrix::Panel&lt; Coord::Col, T, device &gt; &amp;hh_panel, matrix::ReadOnlyTileSender&lt; T, Device::CPU &gt; taus, matrix::ReadWriteTileSender&lt; T, device &gt; t, common::Pipeline&lt; comm::Communicator &gt; &amp;mpi_col_task_chain)'],['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html#a1d9391570e947628f8c23668f944f7d4',1,'dlaf::factorization::internal::QR_Tfactor::call(matrix::Panel&lt; Coord::Col, T, device &gt; &amp;panel_view, matrix::ReadOnlyTileSender&lt; T, Device::CPU &gt; taus, matrix::ReadWriteTileSender&lt; T, device &gt; t)']]],
-  ['ceildiv_834',['ceilDiv',['../util__math_8h.html#a65aa2478fed7af8bdb404930d7a90fb3',1,'dlaf::util']]],
-  ['cholesky_835',['cholesky',['../cholesky_8h.html#aed7e035a7eff7eb31eea293621b0c8fa',1,'dlaf::factorization::cholesky(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a)'],['../cholesky_8h.html#a016f168408d2fe4c2803538e486d7241',1,'dlaf::factorization::cholesky(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a)']]],
-  ['clone_836',['clone',['../classdlaf_1_1comm_1_1_communicator.html#a436eca0d1c23635a6dcd209f1a1c37df',1,'dlaf::comm::Communicator']]],
-  ['colcommunicator_837',['colCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#af6821b23aeb96284b9e217a02c5115e5',1,'dlaf::comm::CommunicatorGrid']]],
-  ['colmajorlayout_838',['colMajorLayout',['../layout__info_8h.html#ae46d78a3ef61da55b5c5d70329cc0d11',1,'dlaf::matrix::colMajorLayout(const matrix::Distribution &amp;distribution, SizeType ld)'],['../layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902',1,'dlaf::matrix::colMajorLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld)']]],
-  ['cols_839',['cols',['../structdlaf_1_1matrix_1_1_sub_panel_view.html#aa36196de77e52108028c96e7d94e988d',1,'dlaf::matrix::SubPanelView']]],
-  ['commgridsize_840',['commGridSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a1f81375953df07b80ddb5cae672319bd',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['communicator_841',['Communicator',['../classdlaf_1_1comm_1_1_communicator.html#a891a7bf00a52071373bfc38aae8f83aa',1,'dlaf::comm::Communicator::Communicator()'],['../classdlaf_1_1comm_1_1_communicator.html#afa39beca08a343e1b8587b98d63870a0',1,'dlaf::comm::Communicator::Communicator(MPI_Comm mpi_communicator)']]],
-  ['communicatorgrid_842',['CommunicatorGrid',['../classdlaf_1_1comm_1_1_communicator_grid.html#aa17d9edca4165db00ede2fa650463aca',1,'dlaf::comm::CommunicatorGrid::CommunicatorGrid(Communicator comm, IndexT_MPI rows, IndexT_MPI cols, common::Ordering ordering)'],['../classdlaf_1_1comm_1_1_communicator_grid.html#ab8d976dcbcf87aa12cde5433fdcbe8a7',1,'dlaf::comm::CommunicatorGrid::CommunicatorGrid(Communicator comm, const std::array&lt; IndexT_MPI, 2 &gt; &amp;size, common::Ordering ordering)']]],
-  ['computecoords_843',['computeCoords',['../index2d_8h.html#ab6f5ed39b526ad9ae94ed6394a35832b',1,'dlaf::common']]],
-  ['computecoordscolmajor_844',['computeCoordsColMajor',['../index2d_8h.html#afa922ad7c9bdb475884943a4cb233744',1,'dlaf::common']]],
-  ['computecoordsrowmajor_845',['computeCoordsRowMajor',['../index2d_8h.html#ac9c99027fa12a875fa12d878393fefff',1,'dlaf::common']]],
-  ['computelinearindex_846',['computeLinearIndex',['../index2d_8h.html#a15f2674deab8ea5e84471b18b8ffba94',1,'dlaf::common']]],
-  ['computelinearindexcolmajor_847',['computeLinearIndexColMajor',['../index2d_8h.html#a7e8f91611ddcaf36316ee316666e4d07',1,'dlaf::common']]],
-  ['computelinearindexrowmajor_848',['computeLinearIndexRowMajor',['../index2d_8h.html#ad3fcc947c550d2315d1afca1241b29b9',1,'dlaf::common']]],
-  ['computetfactor_849',['computeTFactor',['../qr_8h.html#a4654c00202b44c6c9365d1a03eff9e99',1,'dlaf::factorization::internal']]],
-  ['conj_850',['conj',['../types_8h.html#a669723b711f94043da9793d2b24d51d9',1,'dlaf::conj(const std::complex&lt; T &gt; number)'],['../types_8h.html#aa28e454906f2ff49398f76a2be8789a4',1,'dlaf::conj(const T number)']]],
-  ['copy_851',['copy',['../copy__tile_8h.html#a6b3c08cc454ab1e1f36e53b59c667c2f',1,'dlaf::matrix::internal::copy()'],['../data_8h.html#a7f6919f56260399a905af9e869afba10',1,'dlaf::common::copy()'],['../copy_8h.html#abc90df94f398c001b29a9d62a5714043',1,'dlaf::matrix::copy()']]],
-  ['copysourcetotarget_852',['copySourceToTarget',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#af6a0069ca18c893cd63044f09df006a8',1,'dlaf::matrix::MatrixMirror::copySourceToTarget()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a928052751a50582ba6d7f793fdc877d3',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::copySourceToTarget()']]],
-  ['copytargettosource_853',['copyTargetToSource',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#abb91b94a9c46d72c9e0f2566bf34728c',1,'dlaf::matrix::MatrixMirror::copyTargetToSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a05e120862eb3eae604143d67afef22bf',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::copyTargetToSource()']]],
-  ['count_854',['count',['../structdlaf_1_1common_1_1_data_descriptor.html#a936d7432ec4732975764786e9e74cf39',1,'dlaf::common::DataDescriptor::count()'],['../classdlaf_1_1comm_1_1_message.html#a53b9c220b5c7a92bee1a5ad0963014d4',1,'dlaf::comm::Message::count()']]],
-  ['create_5fdata_855',['create_data',['../data_8h.html#ab547927373241ec4d208e6e62b1b7f80',1,'dlaf::common::create_data()'],['../matrix_2tile_8h.html#a5635e7d6d98ad8b7bcfacfc502e6bdee',1,'dlaf::matrix::create_data()']]],
-  ['create_5ftemporary_5fbuffer_856',['create_temporary_buffer',['../data__descriptor_8h.html#a7168d5e011929eeafdfebaee7492c9ba',1,'dlaf::common']]],
-  ['creatematrixfromcolmajor_857',['createMatrixFromColMajor',['../matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7',1,'dlaf::matrix::createMatrixFromColMajor(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, T *ptr)'],['../matrix_8h.html#aace8acce04f452c07b86ea6d04b33366',1,'dlaf::matrix::createMatrixFromColMajor(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, const comm::CommunicatorGrid &amp;comm, const comm::Index2D &amp;source_rank_index, T *ptr)'],['../matrix_8h.html#a6191cb29721235980256d98eeea8d722',1,'dlaf::matrix::createMatrixFromColMajor(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, const comm::CommunicatorGrid &amp;comm, T *ptr)']]],
-  ['creatematrixfromtile_858',['createMatrixFromTile',['../matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226',1,'dlaf::matrix::createMatrixFromTile(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, T *ptr)'],['../matrix_8h.html#a5b237a24c0c9c1d9ca958e56684973ae',1,'dlaf::matrix::createMatrixFromTile(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col, T *ptr)'],['../matrix_8h.html#a56931003af5239d82bb1ba403af878e4',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm, const comm::Index2D &amp;source_rank_index, T *ptr)'],['../matrix_8h.html#a26c92f6737011495d6b3764725c4949a',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm, T *ptr)'],['../matrix_8h.html#a6bbd903412fe86fb4e7ad4b9b52a2102',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col, const comm::CommunicatorGrid &amp;comm, const comm::Index2D &amp;source_rank_index, T *ptr)'],['../matrix_8h.html#a71205e9a339140e0f9844c929d963d85',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col, const comm::CommunicatorGrid &amp;comm, T *ptr)']]]
+  ['call_835',['call',['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html#ac73f315af163e45f509e230f362d1310',1,'dlaf::factorization::internal::QR_Tfactor::call(matrix::Panel&lt; Coord::Col, T, device &gt; &amp;hh_panel, matrix::ReadOnlyTileSender&lt; T, Device::CPU &gt; taus, matrix::ReadWriteTileSender&lt; T, device &gt; t, common::Pipeline&lt; comm::Communicator &gt; &amp;mpi_col_task_chain)'],['../structdlaf_1_1factorization_1_1internal_1_1_q_r___tfactor.html#a1d9391570e947628f8c23668f944f7d4',1,'dlaf::factorization::internal::QR_Tfactor::call(matrix::Panel&lt; Coord::Col, T, device &gt; &amp;panel_view, matrix::ReadOnlyTileSender&lt; T, Device::CPU &gt; taus, matrix::ReadWriteTileSender&lt; T, device &gt; t)']]],
+  ['ceildiv_836',['ceilDiv',['../util__math_8h.html#a65aa2478fed7af8bdb404930d7a90fb3',1,'dlaf::util']]],
+  ['cholesky_837',['cholesky',['../cholesky_8h.html#aed7e035a7eff7eb31eea293621b0c8fa',1,'dlaf::factorization::cholesky(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a)'],['../cholesky_8h.html#a016f168408d2fe4c2803538e486d7241',1,'dlaf::factorization::cholesky(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a)']]],
+  ['clone_838',['clone',['../classdlaf_1_1comm_1_1_communicator.html#a436eca0d1c23635a6dcd209f1a1c37df',1,'dlaf::comm::Communicator']]],
+  ['colcommunicator_839',['colCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#af6821b23aeb96284b9e217a02c5115e5',1,'dlaf::comm::CommunicatorGrid']]],
+  ['colmajorlayout_840',['colMajorLayout',['../layout__info_8h.html#ae46d78a3ef61da55b5c5d70329cc0d11',1,'dlaf::matrix::colMajorLayout(const matrix::Distribution &amp;distribution, SizeType ld)'],['../layout__info_8h.html#adf298ab87e69a013e5f06856ab7e7902',1,'dlaf::matrix::colMajorLayout(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld)']]],
+  ['cols_841',['cols',['../structdlaf_1_1matrix_1_1_sub_panel_view.html#aa36196de77e52108028c96e7d94e988d',1,'dlaf::matrix::SubPanelView']]],
+  ['commgridsize_842',['commGridSize',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a1f81375953df07b80ddb5cae672319bd',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['communicator_843',['Communicator',['../classdlaf_1_1comm_1_1_communicator.html#a891a7bf00a52071373bfc38aae8f83aa',1,'dlaf::comm::Communicator::Communicator()'],['../classdlaf_1_1comm_1_1_communicator.html#afa39beca08a343e1b8587b98d63870a0',1,'dlaf::comm::Communicator::Communicator(MPI_Comm mpi_communicator)']]],
+  ['communicatorgrid_844',['CommunicatorGrid',['../classdlaf_1_1comm_1_1_communicator_grid.html#aa17d9edca4165db00ede2fa650463aca',1,'dlaf::comm::CommunicatorGrid::CommunicatorGrid(Communicator comm, IndexT_MPI rows, IndexT_MPI cols, common::Ordering ordering)'],['../classdlaf_1_1comm_1_1_communicator_grid.html#ab8d976dcbcf87aa12cde5433fdcbe8a7',1,'dlaf::comm::CommunicatorGrid::CommunicatorGrid(Communicator comm, const std::array&lt; IndexT_MPI, 2 &gt; &amp;size, common::Ordering ordering)']]],
+  ['computecoords_845',['computeCoords',['../index2d_8h.html#ab6f5ed39b526ad9ae94ed6394a35832b',1,'dlaf::common']]],
+  ['computecoordscolmajor_846',['computeCoordsColMajor',['../index2d_8h.html#afa922ad7c9bdb475884943a4cb233744',1,'dlaf::common']]],
+  ['computecoordsrowmajor_847',['computeCoordsRowMajor',['../index2d_8h.html#ac9c99027fa12a875fa12d878393fefff',1,'dlaf::common']]],
+  ['computelinearindex_848',['computeLinearIndex',['../index2d_8h.html#a15f2674deab8ea5e84471b18b8ffba94',1,'dlaf::common']]],
+  ['computelinearindexcolmajor_849',['computeLinearIndexColMajor',['../index2d_8h.html#a7e8f91611ddcaf36316ee316666e4d07',1,'dlaf::common']]],
+  ['computelinearindexrowmajor_850',['computeLinearIndexRowMajor',['../index2d_8h.html#ad3fcc947c550d2315d1afca1241b29b9',1,'dlaf::common']]],
+  ['computetfactor_851',['computeTFactor',['../qr_8h.html#a4654c00202b44c6c9365d1a03eff9e99',1,'dlaf::factorization::internal']]],
+  ['conj_852',['conj',['../types_8h.html#a669723b711f94043da9793d2b24d51d9',1,'dlaf::conj(const std::complex&lt; T &gt; number)'],['../types_8h.html#aa28e454906f2ff49398f76a2be8789a4',1,'dlaf::conj(const T number)']]],
+  ['copy_853',['copy',['../copy__tile_8h.html#a6b3c08cc454ab1e1f36e53b59c667c2f',1,'dlaf::matrix::internal::copy()'],['../data_8h.html#a7f6919f56260399a905af9e869afba10',1,'dlaf::common::copy()'],['../copy_8h.html#abc90df94f398c001b29a9d62a5714043',1,'dlaf::matrix::copy()']]],
+  ['copysourcetotarget_854',['copySourceToTarget',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#af6a0069ca18c893cd63044f09df006a8',1,'dlaf::matrix::MatrixMirror::copySourceToTarget()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a928052751a50582ba6d7f793fdc877d3',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::copySourceToTarget()']]],
+  ['copytargettosource_855',['copyTargetToSource',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#abb91b94a9c46d72c9e0f2566bf34728c',1,'dlaf::matrix::MatrixMirror::copyTargetToSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a05e120862eb3eae604143d67afef22bf',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::copyTargetToSource()']]],
+  ['count_856',['count',['../structdlaf_1_1common_1_1_data_descriptor.html#a936d7432ec4732975764786e9e74cf39',1,'dlaf::common::DataDescriptor::count()'],['../classdlaf_1_1comm_1_1_message.html#a53b9c220b5c7a92bee1a5ad0963014d4',1,'dlaf::comm::Message::count()']]],
+  ['create_5fdata_857',['create_data',['../data_8h.html#ab547927373241ec4d208e6e62b1b7f80',1,'dlaf::common::create_data()'],['../matrix_2tile_8h.html#a5635e7d6d98ad8b7bcfacfc502e6bdee',1,'dlaf::matrix::create_data()']]],
+  ['create_5ftemporary_5fbuffer_858',['create_temporary_buffer',['../data__descriptor_8h.html#a7168d5e011929eeafdfebaee7492c9ba',1,'dlaf::common']]],
+  ['creatematrixfromcolmajor_859',['createMatrixFromColMajor',['../matrix_8h.html#a0edf764f5d64e80355ffe9a5c8eb31e7',1,'dlaf::matrix::createMatrixFromColMajor(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, T *ptr)'],['../matrix_8h.html#aace8acce04f452c07b86ea6d04b33366',1,'dlaf::matrix::createMatrixFromColMajor(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, const comm::CommunicatorGrid &amp;comm, const comm::Index2D &amp;source_rank_index, T *ptr)'],['../matrix_8h.html#a6191cb29721235980256d98eeea8d722',1,'dlaf::matrix::createMatrixFromColMajor(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld, const comm::CommunicatorGrid &amp;comm, T *ptr)']]],
+  ['creatematrixfromtile_860',['createMatrixFromTile',['../matrix_8h.html#abae8f550140d87bbe74dfb9bc35c5226',1,'dlaf::matrix::createMatrixFromTile(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, T *ptr)'],['../matrix_8h.html#a5b237a24c0c9c1d9ca958e56684973ae',1,'dlaf::matrix::createMatrixFromTile(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col, T *ptr)'],['../matrix_8h.html#a56931003af5239d82bb1ba403af878e4',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm, const comm::Index2D &amp;source_rank_index, T *ptr)'],['../matrix_8h.html#a26c92f6737011495d6b3764725c4949a',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm, T *ptr)'],['../matrix_8h.html#a6bbd903412fe86fb4e7ad4b9b52a2102',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col, const comm::CommunicatorGrid &amp;comm, const comm::Index2D &amp;source_rank_index, T *ptr)'],['../matrix_8h.html#a71205e9a339140e0f9844c929d963d85',1,'dlaf::matrix::createMatrixFromTile(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, SizeType ld_tile, SizeType tiles_per_col, const comm::CommunicatorGrid &amp;comm, T *ptr)']]]
 ];
diff --git a/master/search/functions_3.js b/master/search/functions_3.js
index 1d929c2d9f..f723f18c3e 100644
--- a/master/search/functions_3.js
+++ b/master/search/functions_3.js
@@ -1,16 +1,16 @@
 var searchData=
 [
-  ['data_859',['data',['../classdlaf_1_1comm_1_1_message.html#a3684d7d2edac45401785fa9e8561eb73',1,'dlaf::comm::Message::data()'],['../structdlaf_1_1common_1_1_data_descriptor.html#a6f93fef2051c96e6b0100bcb50c280e2',1,'dlaf::common::DataDescriptor::data()']]],
-  ['data_5fblocksize_860',['data_blocksize',['../data_8h.html#aee766fd59c4a4d3c428082b37b54ea81',1,'dlaf::common']]],
-  ['data_5fcount_861',['data_count',['../data_8h.html#a4b0d72a2fdf94917b5641c25c86bcf18',1,'dlaf::common']]],
-  ['data_5fiscontiguous_862',['data_iscontiguous',['../data_8h.html#aee9f8825e02ce8fb557f93bd4d4facef',1,'dlaf::common']]],
-  ['data_5fnblocks_863',['data_nblocks',['../data_8h.html#a2f5f60205cc53a1a1bce17012cc36368',1,'dlaf::common']]],
-  ['data_5fpointer_864',['data_pointer',['../data_8h.html#ab4238a013332af8dc361a581d4250205',1,'dlaf::common']]],
-  ['data_5fstride_865',['data_stride',['../data_8h.html#a18f232284c687293001d172fd19ed3fe',1,'dlaf::common']]],
-  ['datadescriptor_866',['DataDescriptor',['../structdlaf_1_1common_1_1_data_descriptor.html#a87ca3689fd590f74e636317987af17bd',1,'dlaf::common::DataDescriptor::DataDescriptor()'],['../structdlaf_1_1common_1_1_data_descriptor.html#a8c969a23a32e1cf2ae19a7811ae394e4',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType n) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#acd73354fd77df45c9b70ab034fc1cd61',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType num_blocks, SizeType blocksize, SizeType stride) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#acb58ba4559ea0a6022a45bb781dccc6c',1,'dlaf::common::DataDescriptor::DataDescriptor(const Data &amp;data)'],['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html#acef674017777de4a735258a476e95e47',1,'dlaf::common::DataDescriptor&lt; T[N]&gt;::DataDescriptor()']]],
-  ['distancetoadjacenttile_867',['distanceToAdjacentTile',['../classdlaf_1_1matrix_1_1_distribution.html#aa0b67d70b8b3e6f74c53d1062546b8ed',1,'dlaf::matrix::Distribution']]],
-  ['distribution_868',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html#a47b322556c713fd38223538f50f58e14',1,'dlaf::matrix::Distribution']]],
-  ['distribution_869',['distribution',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['distribution_870',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html#a012f931d7acdf168a42445bcbbce5dd3',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a51c38487398212457417f784dd3d2594',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a97b363d57f32add582ce1774a6b9a147',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a146465cb553b8a9d9f32bf63ff7e7375',1,'dlaf::matrix::Distribution::Distribution(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#aacf1f8d3d02d9c70bf0bffe0725b5d92',1,'dlaf::matrix::Distribution::Distribution() noexcept']]],
-  ['dlaf_5fmake_5fsender_5falgorithm_5foverloads_871',['DLAF_MAKE_SENDER_ALGORITHM_OVERLOADS',['../copy__tile_8h.html#a57758eefb97e5d9fef7405d84c90d867',1,'dlaf::matrix']]]
+  ['data_861',['data',['../classdlaf_1_1comm_1_1_message.html#a3684d7d2edac45401785fa9e8561eb73',1,'dlaf::comm::Message::data()'],['../structdlaf_1_1common_1_1_data_descriptor.html#a6f93fef2051c96e6b0100bcb50c280e2',1,'dlaf::common::DataDescriptor::data()']]],
+  ['data_5fblocksize_862',['data_blocksize',['../data_8h.html#aee766fd59c4a4d3c428082b37b54ea81',1,'dlaf::common']]],
+  ['data_5fcount_863',['data_count',['../data_8h.html#a4b0d72a2fdf94917b5641c25c86bcf18',1,'dlaf::common']]],
+  ['data_5fiscontiguous_864',['data_iscontiguous',['../data_8h.html#aee9f8825e02ce8fb557f93bd4d4facef',1,'dlaf::common']]],
+  ['data_5fnblocks_865',['data_nblocks',['../data_8h.html#a2f5f60205cc53a1a1bce17012cc36368',1,'dlaf::common']]],
+  ['data_5fpointer_866',['data_pointer',['../data_8h.html#ab4238a013332af8dc361a581d4250205',1,'dlaf::common']]],
+  ['data_5fstride_867',['data_stride',['../data_8h.html#a18f232284c687293001d172fd19ed3fe',1,'dlaf::common']]],
+  ['datadescriptor_868',['DataDescriptor',['../structdlaf_1_1common_1_1_data_descriptor.html#a87ca3689fd590f74e636317987af17bd',1,'dlaf::common::DataDescriptor::DataDescriptor()'],['../structdlaf_1_1common_1_1_data_descriptor.html#a8c969a23a32e1cf2ae19a7811ae394e4',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType n) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#acd73354fd77df45c9b70ab034fc1cd61',1,'dlaf::common::DataDescriptor::DataDescriptor(T *ptr, SizeType num_blocks, SizeType blocksize, SizeType stride) noexcept'],['../structdlaf_1_1common_1_1_data_descriptor.html#acb58ba4559ea0a6022a45bb781dccc6c',1,'dlaf::common::DataDescriptor::DataDescriptor(const Data &amp;data)'],['../structdlaf_1_1common_1_1_data_descriptor_3_01_t_0f_n_0e_4.html#acef674017777de4a735258a476e95e47',1,'dlaf::common::DataDescriptor&lt; T[N]&gt;::DataDescriptor()']]],
+  ['distancetoadjacenttile_869',['distanceToAdjacentTile',['../classdlaf_1_1matrix_1_1_distribution.html#aa0b67d70b8b3e6f74c53d1062546b8ed',1,'dlaf::matrix::Distribution']]],
+  ['distribution_870',['Distribution',['../classdlaf_1_1matrix_1_1_distribution.html#a47b322556c713fd38223538f50f58e14',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a012f931d7acdf168a42445bcbbce5dd3',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalTileIndex &amp;tile_offset, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a51c38487398212457417f784dd3d2594',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const TileElementSize &amp;tile_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a97b363d57f32add582ce1774a6b9a147',1,'dlaf::matrix::Distribution::Distribution(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::Size2D &amp;grid_size, const comm::Index2D &amp;rank_index, const comm::Index2D &amp;source_rank_index, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#a146465cb553b8a9d9f32bf63ff7e7375',1,'dlaf::matrix::Distribution::Distribution(const LocalElementSize &amp;size, const TileElementSize &amp;block_size, const GlobalElementIndex &amp;element_offset={0, 0})'],['../classdlaf_1_1matrix_1_1_distribution.html#aacf1f8d3d02d9c70bf0bffe0725b5d92',1,'dlaf::matrix::Distribution::Distribution() noexcept']]],
+  ['distribution_871',['distribution',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a28967ff509064a6e04cfc8b2d35af402',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['dlaf_5fmake_5fsender_5falgorithm_5foverloads_872',['DLAF_MAKE_SENDER_ALGORITHM_OVERLOADS',['../copy__tile_8h.html#a57758eefb97e5d9fef7405d84c90d867',1,'dlaf::matrix']]],
+  ['done_873',['done',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aaac68e6ec599e12aac6e7e4bd32570a8',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::done(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#ade093c346a4df7e85c94b71fd86eaec2',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::done(const GlobalTileIndex &amp;index) noexcept']]]
 ];
diff --git a/master/search/functions_4.js b/master/search/functions_4.js
index 268caeee45..685b47bc8f 100644
--- a/master/search/functions_4.js
+++ b/master/search/functions_4.js
@@ -1,9 +1,9 @@
 var searchData=
 [
-  ['eigensolver_872',['eigensolver',['../eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../eigensolver_2eigensolver_8h.html#a94fb08e9087b48ae5fe19b59c9e28db8',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)'],['../eigensolver_2eigensolver_8h.html#a2b99692c7224f63a547cc6686d732490',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../eigensolver_2eigensolver_8h.html#ad43e9ff356aafef70396fdc6b6d3a1f2',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)']]],
-  ['elementfromtileandtileelement_873',['elementFromTileAndTileElement',['../util__distribution_8h.html#a9eab8f0da313765c25ddd2eec12665e0',1,'dlaf::util::matrix']]],
-  ['equal_5fblocksize_874',['equal_blocksize',['../util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe',1,'dlaf::matrix']]],
-  ['equal_5fdistributions_875',['equal_distributions',['../util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2',1,'dlaf::matrix']]],
-  ['equal_5fprocess_5fgrid_876',['equal_process_grid',['../util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c',1,'dlaf::matrix']]],
-  ['equal_5fsize_877',['equal_size',['../util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302',1,'dlaf::matrix']]]
+  ['eigensolver_874',['eigensolver',['../eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../eigensolver_2eigensolver_8h.html#a94fb08e9087b48ae5fe19b59c9e28db8',1,'dlaf::eigensolver::eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)'],['../eigensolver_2eigensolver_8h.html#a2b99692c7224f63a547cc6686d732490',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../eigensolver_2eigensolver_8h.html#ad43e9ff356aafef70396fdc6b6d3a1f2',1,'dlaf::eigensolver::eigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat)']]],
+  ['elementfromtileandtileelement_875',['elementFromTileAndTileElement',['../util__distribution_8h.html#a9eab8f0da313765c25ddd2eec12665e0',1,'dlaf::util::matrix']]],
+  ['equal_5fblocksize_876',['equal_blocksize',['../util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe',1,'dlaf::matrix']]],
+  ['equal_5fdistributions_877',['equal_distributions',['../util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2',1,'dlaf::matrix']]],
+  ['equal_5fprocess_5fgrid_878',['equal_process_grid',['../util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c',1,'dlaf::matrix']]],
+  ['equal_5fsize_879',['equal_size',['../util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302',1,'dlaf::matrix']]]
 ];
diff --git a/master/search/functions_5.js b/master/search/functions_5.js
index f05df936cb..7fa7712be1 100644
--- a/master/search/functions_5.js
+++ b/master/search/functions_5.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['finalize_878',['finalize',['../init_8h.html#abf5448f6d8cff5d741a7680123a7082c',1,'dlaf']]],
-  ['fullcommunicator_879',['fullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#a1cb5842312d3e88e298819ea192d286d',1,'dlaf::comm::CommunicatorGrid']]],
-  ['fullindex_880',['fullIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a709e5ba882750052d23a5a8eb1eff21a',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['finalize_880',['finalize',['../init_8h.html#abf5448f6d8cff5d741a7680123a7082c',1,'dlaf']]],
+  ['fullcommunicator_881',['fullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#a1cb5842312d3e88e298819ea192d286d',1,'dlaf::comm::CommunicatorGrid']]],
+  ['fullindex_882',['fullIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a709e5ba882750052d23a5a8eb1eff21a',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/search/functions_6.js b/master/search/functions_6.js
index f3e91804e5..40dacbd343 100644
--- a/master/search/functions_6.js
+++ b/master/search/functions_6.js
@@ -1,21 +1,21 @@
 var searchData=
 [
-  ['gemm_881',['gemm',['../blas_2tile_8h.html#a8e495a0a86ddf2f997ca8a7c33d106a2',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#afed112b0e26de470da2469d43866918d',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a1de961c6e1c01ee6a5f0039ecf51b162',1,'dlaf::tile::gemm(const blas::Op op_a, const blas::Op op_b, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)']]],
-  ['geneigensolver_882',['genEigensolver',['../gen__eigensolver_8h.html#a7578fbe49ba90d7ef916ac81860c3858',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)'],['../gen__eigensolver_8h.html#a9d80f2453da0de6a6ad73c55165f7f52',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../gen__eigensolver_8h.html#ad60b7fb5135b8ea685d781e4e4165c47',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)'],['../gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)']]],
-  ['generalsubmatrix_883',['generalSubMatrix',['../multiplication_2general_8h.html#a0aa788470aca6ca60202513251578a36',1,'dlaf::multiplication::generalSubMatrix([[maybe_unused]] comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;row_task_chain, common::Pipeline&lt; comm::Communicator &gt; &amp;col_task_chain, const SizeType a, const SizeType b, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93',1,'dlaf::multiplication::generalSubMatrix(const SizeType a, const SizeType b, const blas::Op opA, const blas::Op opB, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]],
-  ['generic_5finteger_5fop_884',['generic_integer_op',['../util__math_8h.html#a4a1c1045d16c92d7fef9c553ae8e6c90',1,'dlaf::util::internal']]],
-  ['gentostd_885',['genToStd',['../gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f',1,'dlaf::eigensolver::genToStd(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../gen__to__std_8h.html#a1c178c1c870afbc1c4928a4dbe078aa4',1,'dlaf::eigensolver::genToStd(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
-  ['get_886',['get',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#a8b053672d5ecf63c2af3a3c23677278b',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::get()'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a23701a66458fad55204f90b84674a8e2',1,'dlaf::common::internal::basic_coords::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ad5eaeb945174c2c237a672dd4191582a',1,'dlaf::matrix::MatrixMirror::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#aa0d470acb7c2f97a7192c06fceef7b32',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#ad2cba1bf3133441bc31d960d2681cf11',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::get()']]],
-  ['getheight_887',['getHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad59bcb70b44cf2a4a61119d8ce4eb5db',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['getoptionsdescription_888',['getOptionsDescription',['../init_8h.html#a6f4711b407727e4b9317d252b451bd89',1,'dlaf']]],
-  ['getsource_889',['getSource',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a2fb277eb0664e0e6ed0e8a011416c7c7',1,'dlaf::matrix::MatrixMirror::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a424e6b85bb0167015efbb7522a31d7fa',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a348f9f6d9af5df67ef6179e4f600850e',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#af6ab705620e03736d36433f0846470fc',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::getSource()']]],
-  ['getwidth_890',['getWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa34a2e93ba64d958df32428f3928ccba',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['globalelementfromglobaltileandtileelement_891',['globalElementFromGlobalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#aed7a91383a0146b02008c6d6bfed2850',1,'dlaf::matrix::Distribution']]],
-  ['globalelementfromlocaltileandtileelement_892',['globalElementFromLocalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#a36c1a5962e433c773a924d8b5bdda594',1,'dlaf::matrix::Distribution']]],
-  ['globalelementindex_893',['globalElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5',1,'dlaf::matrix::Distribution']]],
-  ['globaltileelementdistance_894',['globalTileElementDistance',['../classdlaf_1_1matrix_1_1_distribution.html#a9f57d9074212c024d39f0e971bc9e5db',1,'dlaf::matrix::Distribution']]],
-  ['globaltilefromglobalelement_895',['globalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d',1,'dlaf::matrix::Distribution']]],
-  ['globaltilefromlocaltile_896',['globalTileFromLocalTile',['../util__distribution_8h.html#a3fa80781a6b118e00015b9751e2f6ead',1,'dlaf::util::matrix::globalTileFromLocalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#add4b487f6603fb6099dce376ee2e8c3c',1,'dlaf::matrix::Distribution::globalTileFromLocalTile(SizeType local_tile) const noexcept']]],
-  ['globaltileindex_897',['globalTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a7a0027799c7c187d8f7135a1242ca3f5',1,'dlaf::matrix::Distribution::globalTileIndex(const LocalTileIndex &amp;local_tile) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299',1,'dlaf::matrix::Distribution::globalTileIndex(const GlobalElementIndex &amp;global_element) const noexcept']]],
-  ['globaltilelinearindex_898',['globalTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a0b174a696d5fe710ecb2bc081081c137',1,'dlaf::matrix::Distribution']]]
+  ['gemm_883',['gemm',['../blas_2tile_8h.html#a8e495a0a86ddf2f997ca8a7c33d106a2',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)'],['../blas_2tile_8h.html#afed112b0e26de470da2469d43866918d',1,'dlaf::tile::gemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a1de961c6e1c01ee6a5f0039ecf51b162',1,'dlaf::tile::gemm(const blas::Op op_a, const blas::Op op_b, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)']]],
+  ['geneigensolver_884',['genEigensolver',['../gen__eigensolver_8h.html#a7578fbe49ba90d7ef916ac81860c3858',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)'],['../gen__eigensolver_8h.html#a9d80f2453da0de6a6ad73c55165f7f52',1,'dlaf::eigensolver::genEigensolver(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)'],['../gen__eigensolver_8h.html#ad60b7fb5135b8ea685d781e4e4165c47',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b)'],['../gen__eigensolver_8h.html#ae119b500260a60dcabdd237e461a12dd',1,'dlaf::eigensolver::genEigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, D &gt; &amp;mat_b, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)']]],
+  ['generalsubmatrix_885',['generalSubMatrix',['../multiplication_2general_8h.html#a0aa788470aca6ca60202513251578a36',1,'dlaf::multiplication::generalSubMatrix([[maybe_unused]] comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;row_task_chain, common::Pipeline&lt; comm::Communicator &gt; &amp;col_task_chain, const SizeType a, const SizeType b, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../multiplication_2general_8h.html#a45f04fd24259c413a07a210a17b91b93',1,'dlaf::multiplication::generalSubMatrix(const SizeType a, const SizeType b, const blas::Op opA, const blas::Op opB, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]],
+  ['generic_5finteger_5fop_886',['generic_integer_op',['../util__math_8h.html#a4a1c1045d16c92d7fef9c553ae8e6c90',1,'dlaf::util::internal']]],
+  ['gentostd_887',['genToStd',['../gen__to__std_8h.html#a8f0b0f0094c0185dc428f69f8506ba8f',1,'dlaf::eigensolver::genToStd(blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)'],['../gen__to__std_8h.html#a1c178c1c870afbc1c4928a4dbe078aa4',1,'dlaf::eigensolver::genToStd(comm::CommunicatorGrid grid, blas::Uplo uplo, Matrix&lt; T, device &gt; &amp;mat_a, Matrix&lt; T, device &gt; &amp;mat_b)']]],
+  ['get_888',['get',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#a8b053672d5ecf63c2af3a3c23677278b',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::get()'],['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a23701a66458fad55204f90b84674a8e2',1,'dlaf::common::internal::basic_coords::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#ad5eaeb945174c2c237a672dd4191582a',1,'dlaf::matrix::MatrixMirror::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#aa0d470acb7c2f97a7192c06fceef7b32',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::get()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#ad2cba1bf3133441bc31d960d2681cf11',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::get()']]],
+  ['getheight_889',['getHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad59bcb70b44cf2a4a61119d8ce4eb5db',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['getoptionsdescription_890',['getOptionsDescription',['../init_8h.html#a6f4711b407727e4b9317d252b451bd89',1,'dlaf']]],
+  ['getsource_891',['getSource',['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a2fb277eb0664e0e6ed0e8a011416c7c7',1,'dlaf::matrix::MatrixMirror::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#a424e6b85bb0167015efbb7522a31d7fa',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a348f9f6d9af5df67ef6179e4f600850e',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::getSource()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#af6ab705620e03736d36433f0846470fc',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::getSource()']]],
+  ['getwidth_892',['getWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa34a2e93ba64d958df32428f3928ccba',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['globalelementfromglobaltileandtileelement_893',['globalElementFromGlobalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#aed7a91383a0146b02008c6d6bfed2850',1,'dlaf::matrix::Distribution']]],
+  ['globalelementfromlocaltileandtileelement_894',['globalElementFromLocalTileAndTileElement',['../classdlaf_1_1matrix_1_1_distribution.html#a36c1a5962e433c773a924d8b5bdda594',1,'dlaf::matrix::Distribution']]],
+  ['globalelementindex_895',['globalElementIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5',1,'dlaf::matrix::Distribution']]],
+  ['globaltileelementdistance_896',['globalTileElementDistance',['../classdlaf_1_1matrix_1_1_distribution.html#a9f57d9074212c024d39f0e971bc9e5db',1,'dlaf::matrix::Distribution']]],
+  ['globaltilefromglobalelement_897',['globalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae63d662d123b38f1150b553b2cdb259d',1,'dlaf::matrix::Distribution']]],
+  ['globaltilefromlocaltile_898',['globalTileFromLocalTile',['../util__distribution_8h.html#a3fa80781a6b118e00015b9751e2f6ead',1,'dlaf::util::matrix::globalTileFromLocalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#add4b487f6603fb6099dce376ee2e8c3c',1,'dlaf::matrix::Distribution::globalTileFromLocalTile(SizeType local_tile) const noexcept']]],
+  ['globaltileindex_899',['globalTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a7a0027799c7c187d8f7135a1242ca3f5',1,'dlaf::matrix::Distribution::globalTileIndex(const LocalTileIndex &amp;local_tile) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299',1,'dlaf::matrix::Distribution::globalTileIndex(const GlobalElementIndex &amp;global_element) const noexcept']]],
+  ['globaltilelinearindex_900',['globalTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a0b174a696d5fe710ecb2bc081081c137',1,'dlaf::matrix::Distribution']]]
 ];
diff --git a/master/search/functions_7.js b/master/search/functions_7.js
index 7c120c5acf..c18293fbee 100644
--- a/master/search/functions_7.js
+++ b/master/search/functions_7.js
@@ -1,8 +1,8 @@
 var searchData=
 [
-  ['hegst_899',['hegst',['../lapack_2tile_8h.html#aaf274e91e36453e7994dd1f2a2813681',1,'dlaf::tile']]],
-  ['hemm_900',['hemm',['../blas_2tile_8h.html#aeec422be0ef5abea8ab6f1a8ae40c8ef',1,'dlaf::tile::hemm(const blas::Side side, const blas::Uplo uplo, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#ab7031513f6c7338a1f3cea71784d0e9a',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a8887bb899e49f4ea3acce81474f5965d',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['her2k_901',['her2k',['../blas_2tile_8h.html#a36642d0aeb16e71f10fd289985f4a03f',1,'dlaf::tile::her2k(const blas::Uplo uplo, const blas::Op op, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#aafcb69907e7154cb12e0e3121534310a',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a45e96a215d6f3a7f64ccf05d108087e7',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['herk_902',['herk',['../blas_2tile_8h.html#a72ab20a0ba5ba199c1ec18f8a31ee2eb',1,'dlaf::tile::herk(const blas::Uplo uplo, const blas::Op op, const BaseType&lt; T &gt; alpha, const Tile&lt; const T, D &gt; &amp;a, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#a8a4f39f0b26f02bc094e531add909e6e',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#aa8fd52359e36023fb6418834d4b27fcd',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
-  ['hermitian_903',['hermitian',['../hermitian_8h.html#a117a0b955e26513fecdc562da0f96922',1,'dlaf::multiplication::hermitian(blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../hermitian_8h.html#a3a63ff51bec2e9383f3dfd8b2914673e',1,'dlaf::multiplication::hermitian(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]]
+  ['hegst_901',['hegst',['../lapack_2tile_8h.html#aaf274e91e36453e7994dd1f2a2813681',1,'dlaf::tile']]],
+  ['hemm_902',['hemm',['../blas_2tile_8h.html#aeec422be0ef5abea8ab6f1a8ae40c8ef',1,'dlaf::tile::hemm(const blas::Side side, const blas::Uplo uplo, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const T beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#ab7031513f6c7338a1f3cea71784d0e9a',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a8887bb899e49f4ea3acce81474f5965d',1,'dlaf::tile::hemm(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['her2k_903',['her2k',['../blas_2tile_8h.html#a36642d0aeb16e71f10fd289985f4a03f',1,'dlaf::tile::her2k(const blas::Uplo uplo, const blas::Op op, const T alpha, const Tile&lt; const T, D &gt; &amp;a, const Tile&lt; const T, D &gt; &amp;b, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#aafcb69907e7154cb12e0e3121534310a',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#a45e96a215d6f3a7f64ccf05d108087e7',1,'dlaf::tile::her2k(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['herk_904',['herk',['../blas_2tile_8h.html#a72ab20a0ba5ba199c1ec18f8a31ee2eb',1,'dlaf::tile::herk(const blas::Uplo uplo, const blas::Op op, const BaseType&lt; T &gt; alpha, const Tile&lt; const T, D &gt; &amp;a, const BaseType&lt; T &gt; beta, const Tile&lt; T, D &gt; &amp;c)'],['../blas_2tile_8h.html#a8a4f39f0b26f02bc094e531add909e6e',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p, Sender &amp;&amp;s)'],['../blas_2tile_8h.html#aa8fd52359e36023fb6418834d4b27fcd',1,'dlaf::tile::herk(const dlaf::internal::Policy&lt; B &gt; &amp;p)']]],
+  ['hermitian_905',['hermitian',['../hermitian_8h.html#a117a0b955e26513fecdc562da0f96922',1,'dlaf::multiplication::hermitian(blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)'],['../hermitian_8h.html#a3a63ff51bec2e9383f3dfd8b2914673e',1,'dlaf::multiplication::hermitian(comm::CommunicatorGrid grid, blas::Side side, blas::Uplo uplo, const T alpha, Matrix&lt; const T, D &gt; &amp;mat_a, Matrix&lt; const T, D &gt; &amp;mat_b, const T beta, Matrix&lt; T, D &gt; &amp;mat_c)']]]
 ];
diff --git a/master/search/functions_8.js b/master/search/functions_8.js
index 8861c1cd9c..ed957d3c7c 100644
--- a/master/search/functions_8.js
+++ b/master/search/functions_8.js
@@ -1,14 +1,14 @@
 var searchData=
 [
-  ['index2d_904',['Index2D',['../classdlaf_1_1common_1_1_index2_d.html#a940432586f1b501b8dda46355999335d',1,'dlaf::common::Index2D::Index2D() noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#ae959b1b0c405d3480f9d4960946b5b2e',1,'dlaf::common::Index2D::Index2D(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept']]],
-  ['initialize_905',['initialize',['../init_8h.html#a100757e13ff576c8a93dd7aed3ca7ec4',1,'dlaf::initialize(const pika::program_options::variables_map &amp;vm, const configuration &amp;user_cfg={})'],['../init_8h.html#a94175c61baedbcc0bf6bd53e0f57380f',1,'dlaf::initialize(int argc, const char *const argv[], const configuration &amp;user_cfg={})']]],
-  ['initresourcepartitionerhandler_906',['initResourcePartitionerHandler',['../init_8h.html#a3685b1a9ef2da35287ae3b03ea3b62e6',1,'dlaf']]],
-  ['is_5fcontiguous_907',['is_contiguous',['../structdlaf_1_1common_1_1_data_descriptor.html#ad73cebe7217dd9f3ad68190dc09bce9e',1,'dlaf::common::DataDescriptor']]],
-  ['isempty_908',['isEmpty',['../classdlaf_1_1common_1_1_size2_d.html#afe5870841ddc785db5d4c81cc22aeb93',1,'dlaf::common::Size2D']]],
-  ['isexternal_909',['isExternal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa77cf35507fc6a6291e9197996034db8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['isin_910',['isIn',['../classdlaf_1_1common_1_1_index2_d.html#a5f174cc234af20d79923b31d7fa90b19',1,'dlaf::common::Index2D']]],
-  ['isinoron_911',['isInOrOn',['../classdlaf_1_1common_1_1_index2_d.html#ab230f7ada23f15ffd3b3d0a3921f1685',1,'dlaf::common::Index2D']]],
-  ['isvalid_912',['isValid',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a380f1ac07da35bc014bcbfff908eb0a9',1,'dlaf::common::internal::basic_coords']]],
-  ['iterate_5frange2d_913',['iterate_range2d',['../range2d_8h.html#adcdcf40345b7f03cf52e871a2420057b',1,'dlaf::common']]],
-  ['iteratorlocal_914',['iteratorLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a79626e0d68d508aca69d1114cedc38a7',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::iteratorLocal()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad',1,'dlaf::matrix::internal::View::iteratorLocal()']]]
+  ['index2d_906',['Index2D',['../classdlaf_1_1common_1_1_index2_d.html#a940432586f1b501b8dda46355999335d',1,'dlaf::common::Index2D::Index2D() noexcept'],['../classdlaf_1_1common_1_1_index2_d.html#ae959b1b0c405d3480f9d4960946b5b2e',1,'dlaf::common::Index2D::Index2D(const std::array&lt; IndexT, 2 &gt; &amp;coords) noexcept']]],
+  ['initialize_907',['initialize',['../init_8h.html#a100757e13ff576c8a93dd7aed3ca7ec4',1,'dlaf::initialize(const pika::program_options::variables_map &amp;vm, const configuration &amp;user_cfg={})'],['../init_8h.html#a94175c61baedbcc0bf6bd53e0f57380f',1,'dlaf::initialize(int argc, const char *const argv[], const configuration &amp;user_cfg={})']]],
+  ['initresourcepartitionerhandler_908',['initResourcePartitionerHandler',['../init_8h.html#a3685b1a9ef2da35287ae3b03ea3b62e6',1,'dlaf']]],
+  ['is_5fcontiguous_909',['is_contiguous',['../structdlaf_1_1common_1_1_data_descriptor.html#ad73cebe7217dd9f3ad68190dc09bce9e',1,'dlaf::common::DataDescriptor']]],
+  ['isempty_910',['isEmpty',['../classdlaf_1_1common_1_1_size2_d.html#afe5870841ddc785db5d4c81cc22aeb93',1,'dlaf::common::Size2D']]],
+  ['isexternal_911',['isExternal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa77cf35507fc6a6291e9197996034db8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['isin_912',['isIn',['../classdlaf_1_1common_1_1_index2_d.html#a5f174cc234af20d79923b31d7fa90b19',1,'dlaf::common::Index2D']]],
+  ['isinoron_913',['isInOrOn',['../classdlaf_1_1common_1_1_index2_d.html#ab230f7ada23f15ffd3b3d0a3921f1685',1,'dlaf::common::Index2D']]],
+  ['isvalid_914',['isValid',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a380f1ac07da35bc014bcbfff908eb0a9',1,'dlaf::common::internal::basic_coords']]],
+  ['iterate_5frange2d_915',['iterate_range2d',['../range2d_8h.html#adcdcf40345b7f03cf52e871a2420057b',1,'dlaf::common']]],
+  ['iteratorlocal_916',['iteratorLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a79626e0d68d508aca69d1114cedc38a7',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::iteratorLocal()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7c25686d3fb7e47b627af360592168ad',1,'dlaf::matrix::internal::View::iteratorLocal()']]]
 ];
diff --git a/master/search/functions_9.js b/master/search/functions_9.js
index cc26976aff..833905c7cf 100644
--- a/master/search/functions_9.js
+++ b/master/search/functions_9.js
@@ -1,18 +1,18 @@
 var searchData=
 [
-  ['lacpy_915',['lacpy',['../util__lapack_8h.html#a2a62e0ec6768b42ae19efff5ea5e4331',1,'lapack::lacpy()'],['../lapack_2tile_8h.html#a1bbf24144aebc55d9d50bb3b53ae38f7',1,'dlaf::tile::lacpy(TileElementSize region, TileElementIndex in_idx, const Tile&lt; const T, Device::CPU &gt; &amp;in, TileElementIndex out_idx, const Tile&lt; T, Device::CPU &gt; &amp;out)'],['../lapack_2tile_8h.html#adba78fac5535c410d8bd2e6c53ff8c7d',1,'dlaf::tile::lacpy(const Tile&lt; const T, Device::CPU &gt; &amp;a, const Tile&lt; T, Device::CPU &gt; &amp;b)']]],
-  ['lange_916',['lange',['../lapack_2tile_8h.html#a839d86dad6ce772207964d76b3ad07fa',1,'dlaf::tile']]],
-  ['lantr_917',['lantr',['../lapack_2tile_8h.html#a22be986552edcbdc4a3785a72620d0ca',1,'dlaf::tile']]],
-  ['laset_918',['laset',['../lapack_2tile_8h.html#a19439efac55cc846b684ed2c6f78eb33',1,'dlaf::tile::laset()'],['../util__lapack_8h.html#a653b4d466d700c7d6d3befb51c8ca9d8',1,'lapack::laset()']]],
-  ['layoutinfo_919',['LayoutInfo',['../classdlaf_1_1matrix_1_1_layout_info.html#a8c41196b99f84410426dfdd62609b982',1,'dlaf::matrix::LayoutInfo']]],
-  ['ld_920',['ld',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a44282c10a5112a78c95c557538f13a74',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
-  ['linearindex_921',['linearIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a1d863b84e40d0567f731413ff788a1a6',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['local_5fmatrix_922',['local_matrix',['../util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921',1,'dlaf::matrix']]],
-  ['localelementdistancefromglobaltile_923',['localElementDistanceFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#a532cc910ad683b4bf2154e5b01540e61',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(GlobalTileIndex begin, GlobalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ac0eef1aae43a7fc895cd280cac21eaa7',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(SizeType i_begin, SizeType i_end) const noexcept']]],
-  ['localelementdistancefromlocaltile_924',['localElementDistanceFromLocalTile',['../classdlaf_1_1matrix_1_1_distribution.html#ab590472ea7c2132b30b725954f8ea3c0',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(LocalTileIndex begin, LocalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#a757d638249f12dd13ffbaa95a9aba21a',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(SizeType i_loc_begin, SizeType i_loc_end) const noexcept']]],
-  ['localnrtiles_925',['localNrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34',1,'dlaf::matrix::Distribution']]],
-  ['localtilefromglobalelement_926',['localTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae812ba2b5ba6b753d733abb48acc5d72',1,'dlaf::matrix::Distribution']]],
-  ['localtilefromglobaltile_927',['localTileFromGlobalTile',['../util__distribution_8h.html#a235a8d1c90d534e32f93f2ce0e364700',1,'dlaf::util::matrix::localTileFromGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811',1,'dlaf::matrix::Distribution::localTileFromGlobalTile(SizeType global_tile) const noexcept']]],
-  ['localtileindex_928',['localTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a77f2413076c87fee45f6afb6e6e1baae',1,'dlaf::matrix::Distribution']]],
-  ['localtilelinearindex_929',['localTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a22259431b76866f2f6acfe1a47ab3ace',1,'dlaf::matrix::Distribution']]]
+  ['lacpy_917',['lacpy',['../util__lapack_8h.html#a2a62e0ec6768b42ae19efff5ea5e4331',1,'lapack::lacpy()'],['../lapack_2tile_8h.html#a1bbf24144aebc55d9d50bb3b53ae38f7',1,'dlaf::tile::lacpy(TileElementSize region, TileElementIndex in_idx, const Tile&lt; const T, Device::CPU &gt; &amp;in, TileElementIndex out_idx, const Tile&lt; T, Device::CPU &gt; &amp;out)'],['../lapack_2tile_8h.html#adba78fac5535c410d8bd2e6c53ff8c7d',1,'dlaf::tile::lacpy(const Tile&lt; const T, Device::CPU &gt; &amp;a, const Tile&lt; T, Device::CPU &gt; &amp;b)']]],
+  ['lange_918',['lange',['../lapack_2tile_8h.html#a839d86dad6ce772207964d76b3ad07fa',1,'dlaf::tile']]],
+  ['lantr_919',['lantr',['../lapack_2tile_8h.html#a22be986552edcbdc4a3785a72620d0ca',1,'dlaf::tile']]],
+  ['laset_920',['laset',['../lapack_2tile_8h.html#a19439efac55cc846b684ed2c6f78eb33',1,'dlaf::tile::laset()'],['../util__lapack_8h.html#a653b4d466d700c7d6d3befb51c8ca9d8',1,'lapack::laset()']]],
+  ['layoutinfo_921',['LayoutInfo',['../classdlaf_1_1matrix_1_1_layout_info.html#a8c41196b99f84410426dfdd62609b982',1,'dlaf::matrix::LayoutInfo']]],
+  ['ld_922',['ld',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a44282c10a5112a78c95c557538f13a74',1,'dlaf::matrix::Tile&lt; const T, D &gt;']]],
+  ['linearindex_923',['linearIndex',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a1d863b84e40d0567f731413ff788a1a6',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['local_5fmatrix_924',['local_matrix',['../util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921',1,'dlaf::matrix']]],
+  ['localelementdistancefromglobaltile_925',['localElementDistanceFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#a532cc910ad683b4bf2154e5b01540e61',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(GlobalTileIndex begin, GlobalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ac0eef1aae43a7fc895cd280cac21eaa7',1,'dlaf::matrix::Distribution::localElementDistanceFromGlobalTile(SizeType i_begin, SizeType i_end) const noexcept']]],
+  ['localelementdistancefromlocaltile_926',['localElementDistanceFromLocalTile',['../classdlaf_1_1matrix_1_1_distribution.html#ab590472ea7c2132b30b725954f8ea3c0',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(LocalTileIndex begin, LocalTileIndex end) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#a757d638249f12dd13ffbaa95a9aba21a',1,'dlaf::matrix::Distribution::localElementDistanceFromLocalTile(SizeType i_loc_begin, SizeType i_loc_end) const noexcept']]],
+  ['localnrtiles_927',['localNrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34',1,'dlaf::matrix::Distribution']]],
+  ['localtilefromglobalelement_928',['localTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#ae812ba2b5ba6b753d733abb48acc5d72',1,'dlaf::matrix::Distribution']]],
+  ['localtilefromglobaltile_929',['localTileFromGlobalTile',['../util__distribution_8h.html#a235a8d1c90d534e32f93f2ce0e364700',1,'dlaf::util::matrix::localTileFromGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#abdc93bce29920c2dff64235391cf3811',1,'dlaf::matrix::Distribution::localTileFromGlobalTile(SizeType global_tile) const noexcept']]],
+  ['localtileindex_930',['localTileIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a77f2413076c87fee45f6afb6e6e1baae',1,'dlaf::matrix::Distribution']]],
+  ['localtilelinearindex_931',['localTileLinearIndex',['../classdlaf_1_1matrix_1_1_distribution.html#a22259431b76866f2f6acfe1a47ab3ace',1,'dlaf::matrix::Distribution']]]
 ];
diff --git a/master/search/functions_a.js b/master/search/functions_a.js
index 41e3e0d5d1..163a312d0c 100644
--- a/master/search/functions_a.js
+++ b/master/search/functions_a.js
@@ -1,20 +1,20 @@
 var searchData=
 [
-  ['make_5fcommunicator_5fmanaged_930',['make_communicator_managed',['../communicator_8h.html#a8b7bf4fa5dfb408439c9c93ce3ebb216',1,'dlaf::comm']]],
-  ['make_5fcontiguous_931',['make_contiguous',['../data__descriptor_8h.html#a96a67d2223bad7ea28fcca7041877560',1,'dlaf::common']]],
-  ['make_5fdata_932',['make_data',['../data_8h.html#ae8a4cf6d87f0a72e5daad8a35478f051',1,'dlaf::common::make_data(Data &amp;&amp;data) noexcept'],['../data_8h.html#aa3aa1962f3a8382cbf457db22c8ca48f',1,'dlaf::common::make_data(T &amp;&amp;data, Ts &amp;&amp;... args) noexcept']]],
-  ['make_5fmessage_933',['make_message',['../message_8h.html#a256282d96e42c4ff2e6353ae28263422',1,'dlaf::comm']]],
-  ['matrix_934',['Matrix',['../classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023',1,'dlaf::matrix::Matrix::Matrix(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm)'],['../classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779',1,'dlaf::matrix::Matrix::Matrix(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)'],['../classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout, ElementType *ptr) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49',1,'dlaf::matrix::Matrix::Matrix(const LayoutInfo &amp;layout, ElementType *ptr)'],['../classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution)']]],
-  ['matrixmirror_935',['MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a66b7ac6e591f693cd7bb8119955055fc',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#ac9dfb2578a5c94b8cf6bf0d5b3186979',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a355ab06273bb75ba0fb40119829d2aa0',1,'dlaf::matrix::MatrixMirror::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#ab4b4d7a17b5f0ae45d301ef415f41b29',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::MatrixMirror()']]],
-  ['memorychunk_936',['MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html#a4059fde641a91f8cac05721fb54c749b',1,'dlaf::memory::MemoryChunk::MemoryChunk()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a53cffddd0ddfd2e1e0db839157a58913',1,'dlaf::memory::MemoryChunk::MemoryChunk(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a8855d0d0e0c35c83394ce82cd14ea36d',1,'dlaf::memory::MemoryChunk::MemoryChunk(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ab7a334b89c214fe25ffde4bf0fd4e802',1,'dlaf::memory::MemoryChunk::MemoryChunk(MemoryChunk &amp;&amp;rhs) noexcept']]],
-  ['memoryview_937',['MemoryView',['../classdlaf_1_1memory_1_1_memory_view.html#a76c5e9d28626abb2991dd6ad1ce460c7',1,'dlaf::memory::MemoryView::MemoryView(const MemoryView &amp;memory_view, SizeType offset, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a0835f719277ae4f7b97c68d097a07071',1,'dlaf::memory::MemoryView::MemoryView(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a0650b61938741469c7583d671240619d',1,'dlaf::memory::MemoryView::MemoryView(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#aa0752bb38aa279bd6260e2d440b8ca7d',1,'dlaf::memory::MemoryView::MemoryView()']]],
-  ['message_938',['Message',['../classdlaf_1_1comm_1_1_message.html#aa0a15382490f3f628d14f734aeddf285',1,'dlaf::comm::Message']]],
-  ['minmemsize_939',['minMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#ad51fa263d160dce4f4db2943720d2506',1,'dlaf::matrix::LayoutInfo']]],
-  ['mintilememsize_940',['minTileMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#a90af3a4b4a456d3107dec3eb4c207c29',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const LocalTileIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_layout_info.html#aa13f1acc6c4df1d0e0c11204d3c81ba0',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const TileElementSize &amp;tile_size) const noexcept']]],
-  ['mpi_5fcall_941',['mpi_call',['../communication_2error_8h.html#aa640fad0edb091d239f68708fbe00103',1,'dlaf::internal']]],
-  ['mpi_5finit_942',['mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html#a415e55c02e205e6f782ff7000755c842',1,'dlaf::comm::mpi_init']]],
-  ['mpi_5ftype_943',['mpi_type',['../classdlaf_1_1comm_1_1_message.html#ac9fa892f3513f9b60ad178d1f788f0af',1,'dlaf::comm::Message']]],
-  ['mul_944',['mul',['../util__math_8h.html#a77a106250e33d119c5415546f6b74544',1,'dlaf::util::size_t::mul()'],['../util__math_8h.html#a090c5b89334c2c21574610d8f0881b67',1,'dlaf::util::ptrdiff_t::mul()']]],
-  ['multipliable_945',['multipliable',['../util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86',1,'dlaf::matrix']]],
-  ['multipliable_5fsizes_946',['multipliable_sizes',['../util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400',1,'dlaf::matrix']]]
+  ['make_5fcommunicator_5fmanaged_932',['make_communicator_managed',['../communicator_8h.html#a8b7bf4fa5dfb408439c9c93ce3ebb216',1,'dlaf::comm']]],
+  ['make_5fcontiguous_933',['make_contiguous',['../data__descriptor_8h.html#a96a67d2223bad7ea28fcca7041877560',1,'dlaf::common']]],
+  ['make_5fdata_934',['make_data',['../data_8h.html#ae8a4cf6d87f0a72e5daad8a35478f051',1,'dlaf::common::make_data(Data &amp;&amp;data) noexcept'],['../data_8h.html#aa3aa1962f3a8382cbf457db22c8ca48f',1,'dlaf::common::make_data(T &amp;&amp;data, Ts &amp;&amp;... args) noexcept']]],
+  ['make_5fmessage_935',['make_message',['../message_8h.html#a256282d96e42c4ff2e6353ae28263422',1,'dlaf::comm']]],
+  ['matrix_936',['Matrix',['../classdlaf_1_1matrix_1_1_matrix.html#a65b04ca6f55cf213c52cda2f3a532023',1,'dlaf::matrix::Matrix::Matrix(const GlobalElementSize &amp;size, const TileElementSize &amp;block_size, const comm::CommunicatorGrid &amp;comm)'],['../classdlaf_1_1matrix_1_1_matrix.html#aa0614a38addeb9aaf83d268f1092b779',1,'dlaf::matrix::Matrix::Matrix(const LocalElementSize &amp;size, const TileElementSize &amp;block_size)'],['../classdlaf_1_1matrix_1_1_matrix.html#a5d2827ca2dbad4d6e6482e4c1e963472',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout, ElementType *ptr) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#ad5f429b579c79194b453206f24d7de49',1,'dlaf::matrix::Matrix::Matrix(const LayoutInfo &amp;layout, ElementType *ptr)'],['../classdlaf_1_1matrix_1_1_matrix.html#a1f0c98f29fa14cccef9f5378f6ee20b1',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution, const LayoutInfo &amp;layout) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#a73b38df3414aa5272abd3b6e87d67e37',1,'dlaf::matrix::Matrix::Matrix(Distribution distribution)']]],
+  ['matrixmirror_937',['MatrixMirror',['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01_t_00_01_source_target_00_01_source_target_01_4.html#a66b7ac6e591f693cd7bb8119955055fc',1,'dlaf::matrix::MatrixMirror&lt; T, SourceTarget, SourceTarget &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_target_00_01_source_01_4.html#ac9dfb2578a5c94b8cf6bf0d5b3186979',1,'dlaf::matrix::MatrixMirror&lt; const T, Target, Source &gt;::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror.html#a355ab06273bb75ba0fb40119829d2aa0',1,'dlaf::matrix::MatrixMirror::MatrixMirror()'],['../classdlaf_1_1matrix_1_1_matrix_mirror_3_01const_01_t_00_01_source_target_00_01_source_target_01_4.html#ab4b4d7a17b5f0ae45d301ef415f41b29',1,'dlaf::matrix::MatrixMirror&lt; const T, SourceTarget, SourceTarget &gt;::MatrixMirror()']]],
+  ['memorychunk_938',['MemoryChunk',['../classdlaf_1_1memory_1_1_memory_chunk.html#a4059fde641a91f8cac05721fb54c749b',1,'dlaf::memory::MemoryChunk::MemoryChunk()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a53cffddd0ddfd2e1e0db839157a58913',1,'dlaf::memory::MemoryChunk::MemoryChunk(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a8855d0d0e0c35c83394ce82cd14ea36d',1,'dlaf::memory::MemoryChunk::MemoryChunk(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ab7a334b89c214fe25ffde4bf0fd4e802',1,'dlaf::memory::MemoryChunk::MemoryChunk(MemoryChunk &amp;&amp;rhs) noexcept']]],
+  ['memoryview_939',['MemoryView',['../classdlaf_1_1memory_1_1_memory_view.html#a76c5e9d28626abb2991dd6ad1ce460c7',1,'dlaf::memory::MemoryView::MemoryView(const MemoryView &amp;memory_view, SizeType offset, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a0835f719277ae4f7b97c68d097a07071',1,'dlaf::memory::MemoryView::MemoryView(T *ptr, SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#a0650b61938741469c7583d671240619d',1,'dlaf::memory::MemoryView::MemoryView(SizeType size)'],['../classdlaf_1_1memory_1_1_memory_view.html#aa0752bb38aa279bd6260e2d440b8ca7d',1,'dlaf::memory::MemoryView::MemoryView()']]],
+  ['message_940',['Message',['../classdlaf_1_1comm_1_1_message.html#aa0a15382490f3f628d14f734aeddf285',1,'dlaf::comm::Message']]],
+  ['minmemsize_941',['minMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#ad51fa263d160dce4f4db2943720d2506',1,'dlaf::matrix::LayoutInfo']]],
+  ['mintilememsize_942',['minTileMemSize',['../classdlaf_1_1matrix_1_1_layout_info.html#a90af3a4b4a456d3107dec3eb4c207c29',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const LocalTileIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_layout_info.html#aa13f1acc6c4df1d0e0c11204d3c81ba0',1,'dlaf::matrix::LayoutInfo::minTileMemSize(const TileElementSize &amp;tile_size) const noexcept']]],
+  ['mpi_5fcall_943',['mpi_call',['../communication_2error_8h.html#aa640fad0edb091d239f68708fbe00103',1,'dlaf::internal']]],
+  ['mpi_5finit_944',['mpi_init',['../structdlaf_1_1comm_1_1mpi__init.html#a415e55c02e205e6f782ff7000755c842',1,'dlaf::comm::mpi_init']]],
+  ['mpi_5ftype_945',['mpi_type',['../classdlaf_1_1comm_1_1_message.html#ac9fa892f3513f9b60ad178d1f788f0af',1,'dlaf::comm::Message']]],
+  ['mul_946',['mul',['../util__math_8h.html#a77a106250e33d119c5415546f6b74544',1,'dlaf::util::size_t::mul()'],['../util__math_8h.html#a090c5b89334c2c21574610d8f0881b67',1,'dlaf::util::ptrdiff_t::mul()']]],
+  ['multipliable_947',['multipliable',['../util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86',1,'dlaf::matrix']]],
+  ['multipliable_5fsizes_948',['multipliable_sizes',['../util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400',1,'dlaf::matrix']]]
 ];
diff --git a/master/search/functions_b.js b/master/search/functions_b.js
index fe0cea232b..39368903d2 100644
--- a/master/search/functions_b.js
+++ b/master/search/functions_b.js
@@ -1,8 +1,8 @@
 var searchData=
 [
-  ['nblocks_947',['nblocks',['../structdlaf_1_1common_1_1_data_descriptor.html#a583161cb3c61e3af88fe66552a123866',1,'dlaf::common::DataDescriptor']]],
-  ['nextlocaltilefromglobalelement_948',['nextLocalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a559caf9af0f658507a6a8fe949e09a93',1,'dlaf::matrix::Distribution']]],
-  ['nextlocaltilefromglobaltile_949',['nextLocalTileFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#afcd76386ddd1319978242aaf54412825',1,'dlaf::matrix::Distribution::nextLocalTileFromGlobalTile()'],['../util__distribution_8h.html#ad6d38066f4c7c00e41fc2d8830efb77f',1,'dlaf::util::matrix::nextLocalTileFromGlobalTile()']]],
-  ['norm_950',['norm',['../norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839',1,'dlaf::auxiliary']]],
-  ['nrtiles_951',['nrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516',1,'dlaf::matrix::Distribution::nrTiles()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d',1,'dlaf::matrix::internal::MatrixBase::nrTiles()']]]
+  ['nblocks_949',['nblocks',['../structdlaf_1_1common_1_1_data_descriptor.html#a583161cb3c61e3af88fe66552a123866',1,'dlaf::common::DataDescriptor']]],
+  ['nextlocaltilefromglobalelement_950',['nextLocalTileFromGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a559caf9af0f658507a6a8fe949e09a93',1,'dlaf::matrix::Distribution']]],
+  ['nextlocaltilefromglobaltile_951',['nextLocalTileFromGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#afcd76386ddd1319978242aaf54412825',1,'dlaf::matrix::Distribution::nextLocalTileFromGlobalTile()'],['../util__distribution_8h.html#ad6d38066f4c7c00e41fc2d8830efb77f',1,'dlaf::util::matrix::nextLocalTileFromGlobalTile()']]],
+  ['norm_952',['norm',['../norm_8h.html#a2d0adfb7be9cfe934f96e9dd1c38d839',1,'dlaf::auxiliary']]],
+  ['nrtiles_953',['nrTiles',['../classdlaf_1_1matrix_1_1_distribution.html#acc85a62e6350bcac93a8e442d4603516',1,'dlaf::matrix::Distribution::nrTiles()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a068e58f7f6c2956f92e69fd7c8d8f68d',1,'dlaf::matrix::internal::MatrixBase::nrTiles()']]]
 ];
diff --git a/master/search/functions_c.js b/master/search/functions_c.js
index a8468d79fb..d201232b5a 100644
--- a/master/search/functions_c.js
+++ b/master/search/functions_c.js
@@ -1,16 +1,16 @@
 var searchData=
 [
-  ['offset_952',['offset',['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7229ff87452798d32b7195fe684fff7a',1,'dlaf::matrix::internal::View']]],
-  ['offsetelement_953',['offsetElement',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a398b31442f71b68e39a3ecbb2762203e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::offsetElement()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7164cccc46c63cc96661288809a37f5f',1,'dlaf::matrix::internal::View::offsetElement()']]],
-  ['operator_20bool_954',['operator bool',['../structdlaf_1_1common_1_1_buffer.html#ae57231c34ebf6f79da4d1e6e1c75cf0a',1,'dlaf::common::Buffer::operator bool()'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8f6d65a5adc84620ed33a7de52bac602',1,'dlaf::comm::internal::type_handler::operator bool()']]],
-  ['operator_20mpi_5fcomm_955',['operator MPI_Comm',['../classdlaf_1_1comm_1_1_communicator.html#a5be809bbc2d038669e31a9de501a2070',1,'dlaf::comm::Communicator']]],
-  ['operator_20mpi_5fdatatype_956',['operator MPI_Datatype',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a2247361b0d7dd77039860c0cd21a13e3',1,'dlaf::comm::internal::type_handler']]],
-  ['operator_21_3d_957',['operator!=',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#abf2886043fbe929f1e1f0eff5e20935d',1,'dlaf::common::internal::basic_coords::operator!=()'],['../classdlaf_1_1common_1_1_size2_d.html#a1a6822fefe13303612ce0ddf44f260ea',1,'dlaf::common::Size2D::operator!=()'],['../classdlaf_1_1common_1_1_index2_d.html#ae2e28cf6eab4febd97d6c46d23c6096d',1,'dlaf::common::Index2D::operator!=()']]],
-  ['operator_26_958',['operator&amp;',['../classdlaf_1_1comm_1_1_communicator.html#ace61947783c442bf684c2f035093acf2',1,'dlaf::comm::Communicator']]],
-  ['operator_28_29_959',['operator()',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#ac22706782f9864d6357df2f48f15ee74',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator()()'],['../classdlaf_1_1memory_1_1_memory_view.html#aad118548f59d6c8021eb4fbe816a1561',1,'dlaf::memory::MemoryView::operator()() const'],['../classdlaf_1_1memory_1_1_memory_view.html#a6f9c8123e686e2f2122ec988ca0b9725',1,'dlaf::memory::MemoryView::operator()(SizeType index) const'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a1720c41c3c3cbad2e198e7cedbfa84de',1,'dlaf::memory::MemoryChunk::operator()()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ac0325c028366b219597dde97814e9a7a',1,'dlaf::memory::MemoryChunk::operator()(SizeType index)'],['../classdlaf_1_1matrix_1_1_tile.html#a5641fc26b7eb759a31ddc24975393ce7',1,'dlaf::matrix::Tile::operator()()'],['../classdlaf_1_1common_1_1_pipeline.html#a388b1fe53e84dde5b0f026e7b334902d',1,'dlaf::common::Pipeline::operator()()']]],
-  ['operator_2b_960',['operator+',['../index2d_8h.html#a2ed7f0c019788f600bc067956646bf75',1,'dlaf::common']]],
-  ['operator_3c_3c_961',['operator&lt;&lt;',['../index2d_8h.html#a352cdd70886a2a2ace1abd246951c538',1,'dlaf::common']]],
-  ['operator_3d_962',['operator=',['../classdlaf_1_1memory_1_1_memory_chunk.html#a0c03f967f09e963519dae5e235da66e1',1,'dlaf::memory::MemoryChunk']]],
-  ['operator_3d_3d_963',['operator==',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a95e16def9c322ee963d123635c2c875b',1,'dlaf::common::internal::basic_coords::operator==()'],['../classdlaf_1_1common_1_1_size2_d.html#a83385feaa5e14b4291c6267bc68fbe51',1,'dlaf::common::Size2D::operator==()'],['../classdlaf_1_1common_1_1_index2_d.html#a4724fdad093b5d189c5f5e0b1ac5e305',1,'dlaf::common::Index2D::operator==()']]],
-  ['orthogonal_964',['orthogonal',['../index2d_8h.html#a9b3be798b052f32def2a280a80e2295c',1,'dlaf']]]
+  ['offset_954',['offset',['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7229ff87452798d32b7195fe684fff7a',1,'dlaf::matrix::internal::View']]],
+  ['offsetelement_955',['offsetElement',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a398b31442f71b68e39a3ecbb2762203e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::offsetElement()'],['../structdlaf_1_1matrix_1_1internal_1_1_view.html#a7164cccc46c63cc96661288809a37f5f',1,'dlaf::matrix::internal::View::offsetElement()']]],
+  ['operator_20bool_956',['operator bool',['../structdlaf_1_1common_1_1_buffer.html#ae57231c34ebf6f79da4d1e6e1c75cf0a',1,'dlaf::common::Buffer::operator bool()'],['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a8f6d65a5adc84620ed33a7de52bac602',1,'dlaf::comm::internal::type_handler::operator bool()']]],
+  ['operator_20mpi_5fcomm_957',['operator MPI_Comm',['../classdlaf_1_1comm_1_1_communicator.html#a5be809bbc2d038669e31a9de501a2070',1,'dlaf::comm::Communicator']]],
+  ['operator_20mpi_5fdatatype_958',['operator MPI_Datatype',['../structdlaf_1_1comm_1_1internal_1_1type__handler.html#a2247361b0d7dd77039860c0cd21a13e3',1,'dlaf::comm::internal::type_handler']]],
+  ['operator_21_3d_959',['operator!=',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#abf2886043fbe929f1e1f0eff5e20935d',1,'dlaf::common::internal::basic_coords::operator!=()'],['../classdlaf_1_1common_1_1_size2_d.html#a1a6822fefe13303612ce0ddf44f260ea',1,'dlaf::common::Size2D::operator!=()'],['../classdlaf_1_1common_1_1_index2_d.html#ae2e28cf6eab4febd97d6c46d23c6096d',1,'dlaf::common::Index2D::operator!=()']]],
+  ['operator_26_960',['operator&amp;',['../classdlaf_1_1comm_1_1_communicator.html#ace61947783c442bf684c2f035093acf2',1,'dlaf::comm::Communicator']]],
+  ['operator_28_29_961',['operator()',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#ac22706782f9864d6357df2f48f15ee74',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator()()'],['../classdlaf_1_1memory_1_1_memory_view.html#aad118548f59d6c8021eb4fbe816a1561',1,'dlaf::memory::MemoryView::operator()() const'],['../classdlaf_1_1memory_1_1_memory_view.html#a6f9c8123e686e2f2122ec988ca0b9725',1,'dlaf::memory::MemoryView::operator()(SizeType index) const'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a1720c41c3c3cbad2e198e7cedbfa84de',1,'dlaf::memory::MemoryChunk::operator()()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#ac0325c028366b219597dde97814e9a7a',1,'dlaf::memory::MemoryChunk::operator()(SizeType index)'],['../classdlaf_1_1matrix_1_1_tile.html#a5641fc26b7eb759a31ddc24975393ce7',1,'dlaf::matrix::Tile::operator()()'],['../classdlaf_1_1common_1_1_pipeline.html#a388b1fe53e84dde5b0f026e7b334902d',1,'dlaf::common::Pipeline::operator()()']]],
+  ['operator_2b_962',['operator+',['../index2d_8h.html#a2ed7f0c019788f600bc067956646bf75',1,'dlaf::common']]],
+  ['operator_3c_3c_963',['operator&lt;&lt;',['../index2d_8h.html#a352cdd70886a2a2ace1abd246951c538',1,'dlaf::common']]],
+  ['operator_3d_964',['operator=',['../classdlaf_1_1memory_1_1_memory_chunk.html#a0c03f967f09e963519dae5e235da66e1',1,'dlaf::memory::MemoryChunk']]],
+  ['operator_3d_3d_965',['operator==',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a95e16def9c322ee963d123635c2c875b',1,'dlaf::common::internal::basic_coords::operator==()'],['../classdlaf_1_1common_1_1_size2_d.html#a83385feaa5e14b4291c6267bc68fbe51',1,'dlaf::common::Size2D::operator==()'],['../classdlaf_1_1common_1_1_index2_d.html#a4724fdad093b5d189c5f5e0b1ac5e305',1,'dlaf::common::Index2D::operator==()']]],
+  ['orthogonal_966',['orthogonal',['../index2d_8h.html#a9b3be798b052f32def2a280a80e2295c',1,'dlaf']]]
 ];
diff --git a/master/search/functions_d.js b/master/search/functions_d.js
index 14c654df5d..0d5300b42a 100644
--- a/master/search/functions_d.js
+++ b/master/search/functions_d.js
@@ -1,11 +1,11 @@
 var searchData=
 [
-  ['panel_965',['Panel',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad63a4d555cea1fdf2f6d5745125fe3cb',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['parentdistribution_966',['parentDistribution',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a66c9a42baab1741e5b562ddac6c716b2',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['permute_967',['permute',['../permutations_2general_8h.html#af301d1e323dbafdc8503756ccd42edcd',1,'dlaf::permutations::permute(SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)'],['../permutations_2general_8h.html#a9dbcd748dd76ddf1b2dfef0d08bba03c',1,'dlaf::permutations::permute(comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;sub_task_chain, SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)']]],
-  ['pipeline_968',['Pipeline',['../classdlaf_1_1common_1_1_pipeline.html#a6379e14f25ed8d98d3b3434ec0d54a62',1,'dlaf::common::Pipeline']]],
-  ['potrf_969',['potrf',['../lapack_2tile_8h.html#aab0795227301a9e8e63232028e331fe0',1,'dlaf::tile']]],
-  ['potrfinfo_970',['potrfInfo',['../lapack_2tile_8h.html#aa917a1efbd53213821776d7d632ee41c',1,'dlaf::tile']]],
-  ['print_971',['print',['../print__csv_8h.html#ace48c87b6c1d3dc59bf005fb943c0629',1,'dlaf::matrix::print(format::csv, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)'],['../print__csv_8h.html#ae6a4db345c18954cc7d83022a1a848d6',1,'dlaf::matrix::print(format::csv, std::string sym, Matrix&lt; const T, Device::CPU &gt; &amp;mat, std::ostream &amp;os=std::cout)'],['../print__gpu_8h.html#aa0268964c774b355f5513ae93a23b258',1,'dlaf::matrix::print(Format format, const Tile&lt; const T, Device::GPU &gt; &amp;tile, std::ostream &amp;os, whip::stream_t stream)'],['../print__numpy_8h.html#ab467c4a97112f7b1d2cffe3acbb41643',1,'dlaf::matrix::print(format::numpy, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)']]],
-  ['ptr_972',['ptr',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a018a34c9be26937cbb0c6dbb727c69ce',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr() const noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7b8f0d5579d0f38743f123046780e860',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr(const TileElementIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#ad14d471389721941e830f73d7ae0716d',1,'dlaf::matrix::Tile::ptr() const noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#a9d16161523f90ce0f432af6e3eacb9f2',1,'dlaf::matrix::Tile::ptr(const TileElementIndex &amp;index) const noexcept']]]
+  ['panel_967',['Panel',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ad63a4d555cea1fdf2f6d5745125fe3cb',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['parentdistribution_968',['parentDistribution',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a66c9a42baab1741e5b562ddac6c716b2',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['permute_969',['permute',['../permutations_2general_8h.html#af301d1e323dbafdc8503756ccd42edcd',1,'dlaf::permutations::permute(SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)'],['../permutations_2general_8h.html#a9dbcd748dd76ddf1b2dfef0d08bba03c',1,'dlaf::permutations::permute(comm::CommunicatorGrid grid, common::Pipeline&lt; comm::Communicator &gt; &amp;sub_task_chain, SizeType i_begin, SizeType i_end, Matrix&lt; const SizeType, D &gt; &amp;perms, Matrix&lt; const T, D &gt; &amp;mat_in, Matrix&lt; T, D &gt; &amp;mat_out)']]],
+  ['pipeline_970',['Pipeline',['../classdlaf_1_1common_1_1_pipeline.html#a6379e14f25ed8d98d3b3434ec0d54a62',1,'dlaf::common::Pipeline']]],
+  ['potrf_971',['potrf',['../lapack_2tile_8h.html#aab0795227301a9e8e63232028e331fe0',1,'dlaf::tile']]],
+  ['potrfinfo_972',['potrfInfo',['../lapack_2tile_8h.html#aa917a1efbd53213821776d7d632ee41c',1,'dlaf::tile']]],
+  ['print_973',['print',['../print__csv_8h.html#ace48c87b6c1d3dc59bf005fb943c0629',1,'dlaf::matrix::print(format::csv, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)'],['../print__csv_8h.html#ae6a4db345c18954cc7d83022a1a848d6',1,'dlaf::matrix::print(format::csv, std::string sym, Matrix&lt; const T, Device::CPU &gt; &amp;mat, std::ostream &amp;os=std::cout)'],['../print__gpu_8h.html#aa0268964c774b355f5513ae93a23b258',1,'dlaf::matrix::print(Format format, const Tile&lt; const T, Device::GPU &gt; &amp;tile, std::ostream &amp;os, whip::stream_t stream)'],['../print__numpy_8h.html#ab467c4a97112f7b1d2cffe3acbb41643',1,'dlaf::matrix::print(format::numpy, const Tile&lt; const T, Device::CPU &gt; &amp;tile, std::ostream &amp;os=std::cout)']]],
+  ['ptr_974',['ptr',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a018a34c9be26937cbb0c6dbb727c69ce',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr() const noexcept'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7b8f0d5579d0f38743f123046780e860',1,'dlaf::matrix::Tile&lt; const T, D &gt;::ptr(const TileElementIndex &amp;index) const noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#ad14d471389721941e830f73d7ae0716d',1,'dlaf::matrix::Tile::ptr() const noexcept'],['../classdlaf_1_1matrix_1_1_tile.html#a9d16161523f90ce0f432af6e3eacb9f2',1,'dlaf::matrix::Tile::ptr(const TileElementIndex &amp;index) const noexcept']]]
 ];
diff --git a/master/search/functions_e.js b/master/search/functions_e.js
index 6d834493b7..af9e3591e9 100644
--- a/master/search/functions_e.js
+++ b/master/search/functions_e.js
@@ -1,25 +1,26 @@
 var searchData=
 [
-  ['rangeend_973',['rangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a3aa72e4de5ae6c2d87b0643e08311df8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rangeendlocal_974',['rangeEndLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a7aa91d49db2332c93e5b2b2e1aadbecf',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rangestart_975',['rangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a09572f6a6461327f0ed6d0e471174410',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rangestartlocal_976',['rangeStartLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acef133d14867a04758e8914135c5d5f8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['rank_977',['rank',['../classdlaf_1_1comm_1_1_communicator.html#a52be17b02755dcbfbdcaa95ba5f9230c',1,'dlaf::comm::Communicator::rank()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e',1,'dlaf::comm::CommunicatorGrid::rank() const noexcept']]],
-  ['rankfullcommunicator_978',['rankFullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ad9a0a0a05723adbe0e57171c7c1e2e93',1,'dlaf::comm::CommunicatorGrid']]],
-  ['rankglobalelement_979',['rankGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a8eac06b3be1805d7261a75809529a910',1,'dlaf::matrix::Distribution']]],
-  ['rankglobaltile_980',['rankGlobalTile',['../classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758',1,'dlaf::matrix::Distribution::rankGlobalTile(const GlobalTileIndex &amp;global_tile) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#a49ff769692620e7f94cf796a65ff6a9e',1,'dlaf::matrix::Distribution::rankGlobalTile(SizeType global_tile) const noexcept'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f',1,'dlaf::matrix::internal::MatrixBase::rankGlobalTile()'],['../util__distribution_8h.html#ad89b3802ea0ed39625419b53e3f199d1',1,'dlaf::util::matrix::rankGlobalTile()']]],
-  ['rankindex_981',['rankIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d',1,'dlaf::matrix::internal::MatrixBase']]],
-  ['read_982',['read',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read(const GlobalTileIndex &amp;index)'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a4631ad4a6fa72e74cf95798c527a48d1',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::read()'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#a814972188382d0ae0120b6acfddd92bb',1,'dlaf::matrix::RetiledMatrix::read(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#afacf9af5a45a341c284844d866227579',1,'dlaf::matrix::RetiledMatrix::read(const GlobalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a99845f6d6b238d3a8d543d20d3adb04d',1,'dlaf::matrix::internal::TilePipeline::read()']]],
-  ['readwrite_983',['readwrite',['../classdlaf_1_1matrix_1_1_retiled_matrix.html#ac3ca2e52e6627f5890bcb25fcff60167',1,'dlaf::matrix::RetiledMatrix::readwrite()'],['../classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38',1,'dlaf::matrix::Matrix::readwrite()'],['../classdlaf_1_1matrix_1_1_retiled_matrix.html#aa0e45d9a97f8d3ff418d2bd08211a5bf',1,'dlaf::matrix::RetiledMatrix::readwrite()'],['../classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811',1,'dlaf::matrix::Matrix::readwrite()'],['../structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a',1,'dlaf::matrix::Panel::readwrite()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#ab0a26ee4322ab4b7a3d250a82d072f68',1,'dlaf::matrix::internal::TilePipeline::readwrite()']]],
-  ['readwrite_5fwith_5fwrapper_984',['readwrite_with_wrapper',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a17403152214a88994a75395f7bebfe3c',1,'dlaf::matrix::internal::TilePipeline']]],
-  ['receive_5ffrom_985',['receive_from',['../basic_8h.html#a13040096b22855cefca83ec02f0c64c0',1,'dlaf::comm::sync::receive_from()'],['../sync_2broadcast_8h.html#a86fb5d23e8299cbd380a4e7d724c1112',1,'dlaf::comm::sync::broadcast::receive_from()']]],
-  ['reduce_986',['reduce',['../sync_2reduce_8h.html#a22dfe268f1dcd2f08e2678af288063be',1,'dlaf::comm::sync']]],
-  ['reduceinplace_987',['reduceInPlace',['../sync_2reduce_8h.html#a86b20000f6542c605c6b5f2bcc9e625b',1,'dlaf::comm::sync']]],
-  ['reducerecv_988',['reduceRecv',['../sync_2reduce_8h.html#a03e9b0551a974dfa12fc9885272a1bee',1,'dlaf::comm::sync']]],
-  ['reducerecvinplace_989',['reduceRecvInPlace',['../sync_2reduce_8h.html#a1ce87e8bcfccf05e7edd9d23e1f778f3',1,'dlaf::comm::sync']]],
-  ['reducesend_990',['reduceSend',['../sync_2reduce_8h.html#a27df5989f95087d0259a3e381b1539b3',1,'dlaf::comm::sync']]],
-  ['reductiontoband_991',['reductionToBand',['../reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617',1,'dlaf::eigensolver::reductionToBand(Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)'],['../reduction__to__band_8h.html#a143b74447a1f72d4d5368b9bad10b331',1,'dlaf::eigensolver::reductionToBand(comm::CommunicatorGrid grid, Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)']]],
-  ['reset_992',['reset',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acb87326419c25da556f027565b96c086',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::reset()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a83ffbae7e4944baa1bc4bfbe5dd1100d',1,'dlaf::matrix::internal::TilePipeline::reset()'],['../classdlaf_1_1common_1_1_pipeline.html#a4a9e1a35ffad351b5b4e01b88ef8a447',1,'dlaf::common::Pipeline::reset()']]],
-  ['retiledmatrix_993',['RetiledMatrix',['../classdlaf_1_1matrix_1_1_retiled_matrix.html#a4e208b9159a478b3fa20167ec8e04318',1,'dlaf::matrix::RetiledMatrix']]],
-  ['rowcommunicator_994',['rowCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391',1,'dlaf::comm::CommunicatorGrid']]]
+  ['rangeend_975',['rangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a3aa72e4de5ae6c2d87b0643e08311df8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rangeendlocal_976',['rangeEndLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a7aa91d49db2332c93e5b2b2e1aadbecf',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rangestart_977',['rangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a09572f6a6461327f0ed6d0e471174410',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rangestartlocal_978',['rangeStartLocal',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acef133d14867a04758e8914135c5d5f8',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['rank_979',['rank',['../classdlaf_1_1comm_1_1_communicator.html#a52be17b02755dcbfbdcaa95ba5f9230c',1,'dlaf::comm::Communicator::rank()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#a45574d05dd3cfb3d40d198cdf10b169e',1,'dlaf::comm::CommunicatorGrid::rank() const noexcept']]],
+  ['rankfullcommunicator_980',['rankFullCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ad9a0a0a05723adbe0e57171c7c1e2e93',1,'dlaf::comm::CommunicatorGrid']]],
+  ['rankglobalelement_981',['rankGlobalElement',['../classdlaf_1_1matrix_1_1_distribution.html#a8eac06b3be1805d7261a75809529a910',1,'dlaf::matrix::Distribution']]],
+  ['rankglobaltile_982',['rankGlobalTile',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a622f4764a792986112c89f282e04080f',1,'dlaf::matrix::internal::MatrixBase::rankGlobalTile()'],['../util__distribution_8h.html#ad89b3802ea0ed39625419b53e3f199d1',1,'dlaf::util::matrix::rankGlobalTile()'],['../classdlaf_1_1matrix_1_1_distribution.html#a49ff769692620e7f94cf796a65ff6a9e',1,'dlaf::matrix::Distribution::rankGlobalTile(SizeType global_tile) const noexcept'],['../classdlaf_1_1matrix_1_1_distribution.html#ae3f7cda513d213773cb4d8a0ba22b758',1,'dlaf::matrix::Distribution::rankGlobalTile(const GlobalTileIndex &amp;global_tile) const noexcept']]],
+  ['rankindex_983',['rankIndex',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a685f321909fc853e023bff712c964c2d',1,'dlaf::matrix::internal::MatrixBase']]],
+  ['read_984',['read',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a99845f6d6b238d3a8d543d20d3adb04d',1,'dlaf::matrix::internal::TilePipeline::read()'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#abd8114d7c9ff03a2ff5c8613284135f6',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#a8485d802a7f318a845de46e1b4e48118',1,'dlaf::matrix::Matrix&lt; const T, D &gt;::read(const GlobalTileIndex &amp;index)'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a4631ad4a6fa72e74cf95798c527a48d1',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::read()']]],
+  ['readwrite_985',['readwrite',['../structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a',1,'dlaf::matrix::Panel::readwrite()'],['../classdlaf_1_1matrix_1_1_matrix.html#af486e66243b57df94b9822bd2553ae38',1,'dlaf::matrix::Matrix::readwrite(const GlobalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811',1,'dlaf::matrix::Matrix::readwrite(const LocalTileIndex &amp;index) noexcept'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#ab0a26ee4322ab4b7a3d250a82d072f68',1,'dlaf::matrix::internal::TilePipeline::readwrite()']]],
+  ['readwrite_5fwith_5fwrapper_986',['readwrite_with_wrapper',['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a17403152214a88994a75395f7bebfe3c',1,'dlaf::matrix::internal::TilePipeline']]],
+  ['receive_5ffrom_987',['receive_from',['../basic_8h.html#a13040096b22855cefca83ec02f0c64c0',1,'dlaf::comm::sync::receive_from()'],['../sync_2broadcast_8h.html#a86fb5d23e8299cbd380a4e7d724c1112',1,'dlaf::comm::sync::broadcast::receive_from()']]],
+  ['reduce_988',['reduce',['../sync_2reduce_8h.html#a22dfe268f1dcd2f08e2678af288063be',1,'dlaf::comm::sync']]],
+  ['reduceinplace_989',['reduceInPlace',['../sync_2reduce_8h.html#a86b20000f6542c605c6b5f2bcc9e625b',1,'dlaf::comm::sync']]],
+  ['reducerecv_990',['reduceRecv',['../sync_2reduce_8h.html#a03e9b0551a974dfa12fc9885272a1bee',1,'dlaf::comm::sync']]],
+  ['reducerecvinplace_991',['reduceRecvInPlace',['../sync_2reduce_8h.html#a1ce87e8bcfccf05e7edd9d23e1f778f3',1,'dlaf::comm::sync']]],
+  ['reducesend_992',['reduceSend',['../sync_2reduce_8h.html#a27df5989f95087d0259a3e381b1539b3',1,'dlaf::comm::sync']]],
+  ['reductiontoband_993',['reductionToBand',['../reduction__to__band_8h.html#a00574f61da45042c5276b043d7c33617',1,'dlaf::eigensolver::reductionToBand(Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)'],['../reduction__to__band_8h.html#a143b74447a1f72d4d5368b9bad10b331',1,'dlaf::eigensolver::reductionToBand(comm::CommunicatorGrid grid, Matrix&lt; T, D &gt; &amp;mat_a, const SizeType band_size)']]],
+  ['reset_994',['reset',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#acb87326419c25da556f027565b96c086',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::reset()'],['../classdlaf_1_1matrix_1_1internal_1_1_tile_pipeline.html#a83ffbae7e4944baa1bc4bfbe5dd1100d',1,'dlaf::matrix::internal::TilePipeline::reset()'],['../classdlaf_1_1common_1_1_pipeline.html#a4a9e1a35ffad351b5b4e01b88ef8a447',1,'dlaf::common::Pipeline::reset()']]],
+  ['retiledsubpipeline_995',['retiledSubPipeline',['../classdlaf_1_1matrix_1_1_matrix.html#aae1c8b22f9862944a006003f528595ff',1,'dlaf::matrix::Matrix']]],
+  ['retiledsubpipelineconst_996',['retiledSubPipelineConst',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa10512ea4bde924a55e73bfe07050942',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['rowcommunicator_997',['rowCommunicator',['../classdlaf_1_1comm_1_1_communicator_grid.html#ab13487adb2992d2cc50e06b498582391',1,'dlaf::comm::CommunicatorGrid']]]
 ];
diff --git a/master/search/functions_f.js b/master/search/functions_f.js
index 561677613c..e12312f80e 100644
--- a/master/search/functions_f.js
+++ b/master/search/functions_f.js
@@ -1,41 +1,44 @@
 var searchData=
 [
-  ['samesign_995',['sameSign',['../util__math_8h.html#a0922553e7cd5d09cc857bb33e8a1b91b',1,'dlaf::util']]],
-  ['scheduleallreduce_996',['scheduleAllReduce',['../kernels_2all__reduce_8h.html#a8cb64ca1859aef0b95cdcfa8a1f05297',1,'dlaf::comm']]],
-  ['scheduleallreduceinplace_997',['scheduleAllReduceInPlace',['../kernels_2all__reduce_8h.html#a689b3d06eea6e5d2c9899521e970ecb0',1,'dlaf::comm']]],
-  ['scheduleallsump2p_998',['scheduleAllSumP2P',['../p2p__allsum_8h.html#ac786ec776d72b61529c8a79c5baffff4',1,'dlaf::comm']]],
-  ['schedulerecvbcast_999',['scheduleRecvBcast',['../kernels_2broadcast_8h.html#a3645d0cfc3caad43c37c355896a7215f',1,'dlaf::comm']]],
-  ['schedulereducerecvinplace_1000',['scheduleReduceRecvInPlace',['../kernels_2reduce_8h.html#a89af8ab199d6ba8902cc962122477f00',1,'dlaf::comm']]],
-  ['schedulereducesend_1001',['scheduleReduceSend',['../kernels_2reduce_8h.html#a60899e3a349b0defe79b1561045a373a',1,'dlaf::comm']]],
-  ['schedulesendbcast_1002',['scheduleSendBcast',['../kernels_2broadcast_8h.html#a98b583f24caaccdf37f3db1f3b46b457',1,'dlaf::comm']]],
-  ['select_1003',['select',['../matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab',1,'dlaf::matrix']]],
-  ['selectgeneric_1004',['selectGeneric',['../matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1',1,'dlaf::matrix::internal']]],
-  ['selectread_1005',['selectRead',['../matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20',1,'dlaf::matrix']]],
-  ['send_1006',['send',['../sync_2broadcast_8h.html#a313a9dc3d212f70d7af273fa0c681aee',1,'dlaf::comm::sync::broadcast']]],
-  ['send_5fto_1007',['send_to',['../basic_8h.html#adfd3205605f800afb2208146565a3bd4',1,'dlaf::comm::sync']]],
-  ['set_1008',['set',['../util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f)'],['../util__matrix_8h.html#af07478cd4a633a1422e160863d3d8510',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f, const blas::Op op)']]],
-  ['set0_1009',['set0',['../lapack_2tile_8h.html#ab094eeac6052422b50a298b42a947251',1,'dlaf::tile::set0()'],['../util__matrix_8h.html#a6cdf6afc18a6456ed68b3fd1dffa9c39',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, LocalTileIndex begin, LocalTileSize sz, Matrix&lt; T, D &gt; &amp;matrix)'],['../util__matrix_8h.html#a79688b3669b67c143114cf2eef3ba69b',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, Panel&lt; axis, T, D, storage &gt; &amp;panel)']]],
-  ['set_5frandom_1010',['set_random',['../util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0',1,'dlaf::matrix::util']]],
-  ['set_5frandom_5fhermitian_1011',['set_random_hermitian',['../util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476',1,'dlaf::matrix::util']]],
-  ['set_5frandom_5fhermitian_5fpositive_5fdefinite_1012',['set_random_hermitian_positive_definite',['../util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58',1,'dlaf::matrix::util']]],
-  ['set_5frandom_5fhermitian_5fwith_5foffset_1013',['set_random_hermitian_with_offset',['../util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133',1,'dlaf::matrix::util::internal']]],
-  ['setheight_1014',['setHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a5ffd11dcc29ca2731c0cf232cb599d8e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setrange_1015',['setRange',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a88f387bed0a5cf8dabd5f6c5b3d2c3b0',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setrangeend_1016',['setRangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a542319871ee2379e84651d7dd91f0749',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setrangestart_1017',['setRangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a621d6ffd26cb962792c4087159df2769',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['settile_1018',['setTile',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa9c0ce49a7829488736d99011c5ac6c9',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setupinternalmatrix_1019',['setupInternalMatrix',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a11f5026c35f76adb7c99c725dc969c44',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['setwidth_1020',['setWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a74e5d5d87edfb1d2de8a54cfa812bd04',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['sharereadwritetile_1021',['shareReadWriteTile',['../matrix_2tile_8h.html#aa8e4a64946c725cef06834fb80b75276',1,'dlaf::matrix']]],
-  ['size_1022',['size',['../classdlaf_1_1memory_1_1_memory_view.html#a5ae9491601035e4f2fd87352916f84c2',1,'dlaf::memory::MemoryView::size()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a886c87812f0a8eb9071c70477ac9f042',1,'dlaf::memory::MemoryChunk::size()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7ef713ad7d24caccfc0863ab4b8481f2',1,'dlaf::matrix::Tile&lt; const T, D &gt;::size()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805',1,'dlaf::matrix::internal::MatrixBase::size()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77',1,'dlaf::comm::CommunicatorGrid::size()'],['../classdlaf_1_1comm_1_1_communicator.html#a415f5d36c3033320074df329163c3127',1,'dlaf::comm::Communicator::size()']]],
-  ['splittile_1023',['splitTile',['../matrix_2tile_8h.html#a7a2383f364417fce38d6e7038cb18bd1',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const std::vector&lt; SubTileSpec &gt; &amp;specs)'],['../matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const SubTileSpec &amp;spec)'],['../matrix_2tile_8h.html#ae5697bd5c424a95890978dfdc4739bf6',1,'dlaf::matrix::splitTile(ReadWriteTileSender&lt; T, D &gt; &amp;&amp;tile, const SubTileSpec &amp;spec)']]],
-  ['splittiledisjoint_1024',['splitTileDisjoint',['../matrix_2tile_8h.html#a4c15e2e57d6336347e6e19d945bd650e',1,'dlaf::matrix']]],
-  ['square_5fblocksize_1025',['square_blocksize',['../util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b',1,'dlaf::matrix']]],
-  ['square_5fsize_1026',['square_size',['../util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0',1,'dlaf::matrix::square_size()'],['../util__tile_8h.html#adfd1e0b37d590f9f6b56cdb276688f0f',1,'dlaf::tile::square_size(const Tile&lt; T, D &gt; &amp;t) noexcept']]],
-  ['stedc_1027',['stedc',['../lapack_2tile_8h.html#a68163899b7b15f447fdbb05e475d9cc6',1,'dlaf::tile']]],
-  ['stride_1028',['stride',['../structdlaf_1_1common_1_1_data_descriptor.html#ab4c4694a381e4cfb44d304cf150743f9',1,'dlaf::common::DataDescriptor']]],
-  ['submatrixview_1029',['SubMatrixView',['../structdlaf_1_1matrix_1_1_sub_matrix_view.html#a7c7cde76a018f82ab23c749de90fe46d',1,'dlaf::matrix::SubMatrixView']]],
-  ['subpanelview_1030',['SubPanelView',['../structdlaf_1_1matrix_1_1_sub_panel_view.html#a556b70975f5928ca81f2196d549be232',1,'dlaf::matrix::SubPanelView']]],
-  ['subtilereference_1031',['subTileReference',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a4adf525073d06baaa47b06886272da41',1,'dlaf::matrix::Tile&lt; const T, D &gt;::subTileReference()'],['../classdlaf_1_1matrix_1_1_tile.html#a670161e49f6a18b5979e9938e4e7e867',1,'dlaf::matrix::Tile::subTileReference()']]],
-  ['sum_1032',['sum',['../util__math_8h.html#afa826e9affbc0fc9e9dbe24d233a9ffb',1,'dlaf::util::size_t::sum()'],['../util__math_8h.html#ae1dbf257cc807e5bdba5a63087e3a2bc',1,'dlaf::util::ptrdiff_t::sum()']]]
+  ['samesign_998',['sameSign',['../util__math_8h.html#a0922553e7cd5d09cc857bb33e8a1b91b',1,'dlaf::util']]],
+  ['scheduleallreduce_999',['scheduleAllReduce',['../kernels_2all__reduce_8h.html#a8cb64ca1859aef0b95cdcfa8a1f05297',1,'dlaf::comm']]],
+  ['scheduleallreduceinplace_1000',['scheduleAllReduceInPlace',['../kernels_2all__reduce_8h.html#a689b3d06eea6e5d2c9899521e970ecb0',1,'dlaf::comm']]],
+  ['scheduleallsump2p_1001',['scheduleAllSumP2P',['../p2p__allsum_8h.html#ac786ec776d72b61529c8a79c5baffff4',1,'dlaf::comm']]],
+  ['schedulerecvbcast_1002',['scheduleRecvBcast',['../kernels_2broadcast_8h.html#a3645d0cfc3caad43c37c355896a7215f',1,'dlaf::comm']]],
+  ['schedulereducerecvinplace_1003',['scheduleReduceRecvInPlace',['../kernels_2reduce_8h.html#a89af8ab199d6ba8902cc962122477f00',1,'dlaf::comm']]],
+  ['schedulereducesend_1004',['scheduleReduceSend',['../kernels_2reduce_8h.html#a60899e3a349b0defe79b1561045a373a',1,'dlaf::comm']]],
+  ['schedulesendbcast_1005',['scheduleSendBcast',['../kernels_2broadcast_8h.html#a98b583f24caaccdf37f3db1f3b46b457',1,'dlaf::comm']]],
+  ['select_1006',['select',['../matrix_8h.html#a1abc47c06dc1c46c9bdc2425090a02ab',1,'dlaf::matrix']]],
+  ['selectgeneric_1007',['selectGeneric',['../matrix_8h.html#ac3737882aaaf23b1f901da6396202ba1',1,'dlaf::matrix::internal']]],
+  ['selectread_1008',['selectRead',['../matrix_8h.html#a02db5399b6bc7e53a162f5939ed7ca20',1,'dlaf::matrix']]],
+  ['send_1009',['send',['../sync_2broadcast_8h.html#a313a9dc3d212f70d7af273fa0c681aee',1,'dlaf::comm::sync::broadcast']]],
+  ['send_5fto_1010',['send_to',['../basic_8h.html#adfd3205605f800afb2208146565a3bd4',1,'dlaf::comm::sync']]],
+  ['set_1011',['set',['../util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f)'],['../util__matrix_8h.html#af07478cd4a633a1422e160863d3d8510',1,'dlaf::matrix::util::set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f, const blas::Op op)']]],
+  ['set0_1012',['set0',['../lapack_2tile_8h.html#ab094eeac6052422b50a298b42a947251',1,'dlaf::tile::set0()'],['../util__matrix_8h.html#a6cdf6afc18a6456ed68b3fd1dffa9c39',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, LocalTileIndex begin, LocalTileSize sz, Matrix&lt; T, D &gt; &amp;matrix)'],['../util__matrix_8h.html#a79688b3669b67c143114cf2eef3ba69b',1,'dlaf::matrix::util::set0(pika::execution::thread_priority priority, Panel&lt; axis, T, D, storage &gt; &amp;panel)']]],
+  ['set_5frandom_1013',['set_random',['../util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0',1,'dlaf::matrix::util']]],
+  ['set_5frandom_5fhermitian_1014',['set_random_hermitian',['../util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476',1,'dlaf::matrix::util']]],
+  ['set_5frandom_5fhermitian_5fpositive_5fdefinite_1015',['set_random_hermitian_positive_definite',['../util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58',1,'dlaf::matrix::util']]],
+  ['set_5frandom_5fhermitian_5fwith_5foffset_1016',['set_random_hermitian_with_offset',['../util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133',1,'dlaf::matrix::util::internal']]],
+  ['setheight_1017',['setHeight',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a5ffd11dcc29ca2731c0cf232cb599d8e',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setrange_1018',['setRange',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a88f387bed0a5cf8dabd5f6c5b3d2c3b0',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setrangeend_1019',['setRangeEnd',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a542319871ee2379e84651d7dd91f0749',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setrangestart_1020',['setRangeStart',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a621d6ffd26cb962792c4087159df2769',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['settile_1021',['setTile',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#aa9c0ce49a7829488736d99011c5ac6c9',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setupinternalmatrix_1022',['setupInternalMatrix',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a11f5026c35f76adb7c99c725dc969c44',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['setwidth_1023',['setWidth',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a74e5d5d87edfb1d2de8a54cfa812bd04',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['sharereadwritetile_1024',['shareReadWriteTile',['../matrix_2tile_8h.html#aa8e4a64946c725cef06834fb80b75276',1,'dlaf::matrix']]],
+  ['single_5ftile_5fper_5fblock_1025',['single_tile_per_block',['../util__matrix_8h.html#a4e47364118c7bc9bb3d038ae4ec8a35c',1,'dlaf::matrix']]],
+  ['size_1026',['size',['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#adc5a25970dab7cdea07e2f98328df805',1,'dlaf::matrix::internal::MatrixBase::size()'],['../classdlaf_1_1comm_1_1_communicator.html#a415f5d36c3033320074df329163c3127',1,'dlaf::comm::Communicator::size()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#a9307e8d79bffad58211c317c92c7dc77',1,'dlaf::comm::CommunicatorGrid::size()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a7ef713ad7d24caccfc0863ab4b8481f2',1,'dlaf::matrix::Tile&lt; const T, D &gt;::size()'],['../classdlaf_1_1memory_1_1_memory_chunk.html#a886c87812f0a8eb9071c70477ac9f042',1,'dlaf::memory::MemoryChunk::size()'],['../classdlaf_1_1memory_1_1_memory_view.html#a5ae9491601035e4f2fd87352916f84c2',1,'dlaf::memory::MemoryView::size()']]],
+  ['splittile_1027',['splitTile',['../matrix_2tile_8h.html#ae46de76ccc35985387f6820b1db9fb51',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const SubTileSpec &amp;spec)'],['../matrix_2tile_8h.html#a7a2383f364417fce38d6e7038cb18bd1',1,'dlaf::matrix::splitTile(ReadOnlyTileSender&lt; T, D &gt; tile, const std::vector&lt; SubTileSpec &gt; &amp;specs)'],['../matrix_2tile_8h.html#ae5697bd5c424a95890978dfdc4739bf6',1,'dlaf::matrix::splitTile(ReadWriteTileSender&lt; T, D &gt; &amp;&amp;tile, const SubTileSpec &amp;spec)']]],
+  ['splittiledisjoint_1028',['splitTileDisjoint',['../matrix_2tile_8h.html#a4c15e2e57d6336347e6e19d945bd650e',1,'dlaf::matrix']]],
+  ['square_5fblocksize_1029',['square_blocksize',['../util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b',1,'dlaf::matrix']]],
+  ['square_5fsize_1030',['square_size',['../util__tile_8h.html#adfd1e0b37d590f9f6b56cdb276688f0f',1,'dlaf::tile::square_size()'],['../util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0',1,'dlaf::matrix::square_size()']]],
+  ['stedc_1031',['stedc',['../lapack_2tile_8h.html#a68163899b7b15f447fdbb05e475d9cc6',1,'dlaf::tile']]],
+  ['stride_1032',['stride',['../structdlaf_1_1common_1_1_data_descriptor.html#ab4c4694a381e4cfb44d304cf150743f9',1,'dlaf::common::DataDescriptor']]],
+  ['submatrixview_1033',['SubMatrixView',['../structdlaf_1_1matrix_1_1_sub_matrix_view.html#a7c7cde76a018f82ab23c749de90fe46d',1,'dlaf::matrix::SubMatrixView']]],
+  ['subpanelview_1034',['SubPanelView',['../structdlaf_1_1matrix_1_1_sub_panel_view.html#a556b70975f5928ca81f2196d549be232',1,'dlaf::matrix::SubPanelView']]],
+  ['subpipeline_1035',['subPipeline',['../classdlaf_1_1matrix_1_1_matrix.html#a720bcfeb6db4c2f2d6e144f8570b8e23',1,'dlaf::matrix::Matrix']]],
+  ['subpipelineconst_1036',['subPipelineConst',['../classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html#aa00bb4dd8e50ec14ad04c8d600982d8c',1,'dlaf::matrix::Matrix&lt; const T, D &gt;']]],
+  ['subtilereference_1037',['subTileReference',['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a4adf525073d06baaa47b06886272da41',1,'dlaf::matrix::Tile&lt; const T, D &gt;::subTileReference()'],['../classdlaf_1_1matrix_1_1_tile.html#a670161e49f6a18b5979e9938e4e7e867',1,'dlaf::matrix::Tile::subTileReference()']]],
+  ['sum_1038',['sum',['../util__math_8h.html#afa826e9affbc0fc9e9dbe24d233a9ffb',1,'dlaf::util::size_t::sum()'],['../util__math_8h.html#ae1dbf257cc807e5bdba5a63087e3a2bc',1,'dlaf::util::ptrdiff_t::sum()']]]
 ];
diff --git a/master/search/related_0.js b/master/search/related_0.js
index 55b3cb6422..d8baecd6ba 100644
--- a/master/search/related_0.js
+++ b/master/search/related_0.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['isindexinrange_1085',['isIndexInRange',['../classdlaf_1_1common_1_1_iterable_range2_d.html#a833f81c7ed8c08d0e995d9c97e8aa935',1,'dlaf::common::IterableRange2D']]]
+  ['isindexinrange_1091',['isIndexInRange',['../classdlaf_1_1common_1_1_iterable_range2_d.html#a833f81c7ed8c08d0e995d9c97e8aa935',1,'dlaf::common::IterableRange2D']]]
 ];
diff --git a/master/search/related_1.js b/master/search/related_1.js
index cdb3f93fcd..cb50fff083 100644
--- a/master/search/related_1.js
+++ b/master/search/related_1.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['make_5fcommunicator_5fmanaged_1086',['make_communicator_managed',['../classdlaf_1_1comm_1_1_communicator.html#ada042e7529d465519d9fb98e004d6a55',1,'dlaf::comm::Communicator']]]
+  ['make_5fcommunicator_5fmanaged_1092',['make_communicator_managed',['../classdlaf_1_1comm_1_1_communicator.html#ada042e7529d465519d9fb98e004d6a55',1,'dlaf::comm::Communicator']]]
 ];
diff --git a/master/search/related_2.js b/master/search/related_2.js
index 7b42519dd1..3769b7d00a 100644
--- a/master/search/related_2.js
+++ b/master/search/related_2.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['operator_3c_3c_1087',['operator&lt;&lt;',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a9a65958ab367757d900bd588a405df77',1,'dlaf::common::internal::basic_coords::operator&lt;&lt;()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#ac215ee8142401d06aba72494c8aa8b9f',1,'dlaf::comm::CommunicatorGrid::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a054e897882d7ab913c1b63af96e87fec',1,'dlaf::matrix::internal::MatrixBase::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a45b5556596386e6bb46e0dc61b838811',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator&lt;&lt;()']]]
+  ['operator_3c_3c_1093',['operator&lt;&lt;',['../classdlaf_1_1common_1_1internal_1_1basic__coords.html#a9a65958ab367757d900bd588a405df77',1,'dlaf::common::internal::basic_coords::operator&lt;&lt;()'],['../classdlaf_1_1comm_1_1_communicator_grid.html#ac215ee8142401d06aba72494c8aa8b9f',1,'dlaf::comm::CommunicatorGrid::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1internal_1_1_matrix_base.html#a054e897882d7ab913c1b63af96e87fec',1,'dlaf::matrix::internal::MatrixBase::operator&lt;&lt;()'],['../classdlaf_1_1matrix_1_1_tile_3_01const_01_t_00_01_d_01_4.html#a45b5556596386e6bb46e0dc61b838811',1,'dlaf::matrix::Tile&lt; const T, D &gt;::operator&lt;&lt;()']]]
 ];
diff --git a/master/search/typedefs_0.js b/master/search/typedefs_0.js
index 5a343d8336..b22fa9d98c 100644
--- a/master/search/typedefs_0.js
+++ b/master/search/typedefs_0.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['enable_5fif_5fconvertible_5ft_1079',['enable_if_convertible_t',['../traits_8h.html#a234bd5c290fe869e9856e7e2d3667baf',1,'dlaf']]],
-  ['enable_5fif_5fsignature_5ft_1080',['enable_if_signature_t',['../traits_8h.html#ada84be4e014ed8f3d91175b3856104e5',1,'dlaf']]]
+  ['enable_5fif_5fconvertible_5ft_1085',['enable_if_convertible_t',['../traits_8h.html#a234bd5c290fe869e9856e7e2d3667baf',1,'dlaf']]],
+  ['enable_5fif_5fsignature_5ft_1086',['enable_if_signature_t',['../traits_8h.html#ada84be4e014ed8f3d91175b3856104e5',1,'dlaf']]]
 ];
diff --git a/master/search/typedefs_1.js b/master/search/typedefs_1.js
index 6c9107e11f..22163d86e2 100644
--- a/master/search/typedefs_1.js
+++ b/master/search/typedefs_1.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['index2d_1081',['Index2D',['../communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e',1,'dlaf::comm']]],
-  ['indext_5fmpi_1082',['IndexT_MPI',['../communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9',1,'dlaf::comm']]]
+  ['index2d_1087',['Index2D',['../communicator__grid_8h.html#af5204c68f1436b89ad06c653b710432e',1,'dlaf::comm']]],
+  ['indext_5fmpi_1088',['IndexT_MPI',['../communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9',1,'dlaf::comm']]]
 ];
diff --git a/master/search/typedefs_2.js b/master/search/typedefs_2.js
index 6f73d8be08..06de637042 100644
--- a/master/search/typedefs_2.js
+++ b/master/search/typedefs_2.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['size2d_1083',['Size2D',['../communicator__grid_8h.html#a1af44f2ea119a10f873e64cf048ba94a',1,'dlaf::comm']]]
+  ['size2d_1089',['Size2D',['../communicator__grid_8h.html#a1af44f2ea119a10f873e64cf048ba94a',1,'dlaf::comm']]]
 ];
diff --git a/master/search/variables_0.js b/master/search/variables_0.js
index 4975fba442..e8832c616d 100644
--- a/master/search/variables_0.js
+++ b/master/search/variables_0.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['bias_5f_1068',['bias_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a2915562160f1b12d3f9e0f49b339988a',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['bias_5f_1074',['bias_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a2915562160f1b12d3f9e0f49b339988a',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/search/variables_1.js b/master/search/variables_1.js
index 0f89c7722d..688601c50e 100644
--- a/master/search/variables_1.js
+++ b/master/search/variables_1.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['classic_5ftype_5f_1069',['classic_type_',['../classdlaf_1_1comm_1_1_message.html#a49412018d3ffdfdbd87690f59fb54a14',1,'dlaf::comm::Message']]],
-  ['custom_5ftype_5f_1070',['custom_type_',['../classdlaf_1_1comm_1_1_message.html#a0172d85a148bcb16f9661a76834fe384',1,'dlaf::comm::Message']]]
+  ['classic_5ftype_5f_1075',['classic_type_',['../classdlaf_1_1comm_1_1_message.html#a49412018d3ffdfdbd87690f59fb54a14',1,'dlaf::comm::Message']]],
+  ['custom_5ftype_5f_1076',['custom_type_',['../classdlaf_1_1comm_1_1_message.html#a0172d85a148bcb16f9661a76834fe384',1,'dlaf::comm::Message']]]
 ];
diff --git a/master/search/variables_2.js b/master/search/variables_2.js
index 15de1a60ee..d0380c2558 100644
--- a/master/search/variables_2.js
+++ b/master/search/variables_2.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['data_5f_1071',['data_',['../classdlaf_1_1comm_1_1_message.html#a93caa3c42cfc16e9a27c65c37fa42c72',1,'dlaf::comm::Message::data_()'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a0aadac7bac5b0878d00305d21666c342',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::data_()']]],
-  ['dim_5f_1072',['dim_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a11827cae3d4fbece622dc9dc2d0a5014',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['dist_5fmatrix_5f_1073',['dist_matrix_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ab991456b59d36ac84dd9277edefc42ac',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['data_5f_1077',['data_',['../classdlaf_1_1comm_1_1_message.html#a93caa3c42cfc16e9a27c65c37fa42c72',1,'dlaf::comm::Message::data_()'],['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a0aadac7bac5b0878d00305d21666c342',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;::data_()']]],
+  ['dim_5f_1078',['dim_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a11827cae3d4fbece622dc9dc2d0a5014',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['dist_5fmatrix_5f_1079',['dist_matrix_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ab991456b59d36ac84dd9277edefc42ac',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/search/variables_3.js b/master/search/variables_3.js
index cb425da9db..f14f1bd065 100644
--- a/master/search/variables_3.js
+++ b/master/search/variables_3.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['end_5f_1074',['end_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a6d52e171776a86d6a42b2e0cc7a26e7b',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['external_5f_1075',['external_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a785fd3e6c916a2ae30efb17f3449c230',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['end_5f_1080',['end_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a6d52e171776a86d6a42b2e0cc7a26e7b',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['external_5f_1081',['external_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a785fd3e6c916a2ae30efb17f3449c230',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/search/variables_4.js b/master/search/variables_4.js
index aa49569f84..54cef6ca2d 100644
--- a/master/search/variables_4.js
+++ b/master/search/variables_4.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['internal_5f_1076',['internal_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adf84f8c3806212547305082bf21ac006',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['internal_5f_1082',['internal_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#adf84f8c3806212547305082bf21ac006',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/search/variables_5.js b/master/search/variables_5.js
index c93ed2dcbe..0de38192f8 100644
--- a/master/search/variables_5.js
+++ b/master/search/variables_5.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['start_5f_1077',['start_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ac49583acc02b6ba394d9b4e3b7450e53',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
-  ['start_5foffset_5f_1078',['start_offset_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a8603ffce77527952a466a9630d98cd5c',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
+  ['start_5f_1083',['start_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#ac49583acc02b6ba394d9b4e3b7450e53',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]],
+  ['start_5foffset_5f_1084',['start_offset_',['../structdlaf_1_1matrix_1_1_panel_3_01axis_00_01const_01_t_00_01_d_00_01_store_transposed_1_1_no_01_4.html#a8603ffce77527952a466a9630d98cd5c',1,'dlaf::matrix::Panel&lt; axis, const T, D, StoreTransposed::No &gt;']]]
 ];
diff --git a/master/solver_2triangular_8h.html b/master/solver_2triangular_8h.html
index 5dd3e719ba..279e12fa82 100644
--- a/master/solver_2triangular_8h.html
+++ b/master/solver_2triangular_8h.html
@@ -163,6 +163,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a9d48ec5978acfd3714a66613
 <dd>
 mat_a has a square block size, </dd>
 <dd>
+mat_a and mat_b have equal tile and block size, </dd>
+<dd>
 mat_a and mat_b are not distributed, </dd>
 <dd>
 mat_a and mat_b are multipliable. </dd></dl>
@@ -248,6 +250,8 @@ <h2 class="memtitle"><span class="permalink"><a href="#a3ff8022461abe72c4197e346
 <dd>
 matrix A has a square block size, </dd>
 <dd>
+matrix A and matrix B have equal tile and block sizes, </dd>
+<dd>
 matrix A and matrix B are distributed according to the grid, </dd>
 <dd>
 matrix A and matrix B are multipliable. </dd></dl>
diff --git a/master/solver_2triangular_8h_source.html b/master/solver_2triangular_8h_source.html
index 9fcdc96929..cef574fe52 100644
--- a/master/solver_2triangular_8h_source.html
+++ b/master/solver_2triangular_8h_source.html
@@ -92,108 +92,112 @@
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="keyword">namespace </span>solver {</div>
 <div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160; </div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="solver_2triangular_8h.html#a9d48ec5978acfd3714a66613678a1afd">   43</a></span>&#160;<span class="keywordtype">void</span> triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha,</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;                Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160; </div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
-<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="solver_2triangular_8h.html#a9d48ec5978acfd3714a66613678a1afd">   44</a></span>&#160;<span class="keywordtype">void</span> triangular(blas::Side side, blas::Uplo uplo, blas::Op op, blas::Diag diag, T alpha,</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;                Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_a), mat_a);</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  DLAF_ASSERT(matrix::local_matrix(mat_b), mat_b);</div>
 <div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160; </div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;      }</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;      }</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    }</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;      }</div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      }</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    }</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;      }</div>
-<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    }</div>
-<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  }</div>
-<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
-<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160; </div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      }</div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      }</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    }</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  }</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      }</div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    }</div>
-<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      }</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      }</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    }</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(diag, alpha, mat_a, mat_b);</div>
 <div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      }</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    }</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  }</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160; </div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="solver_2triangular_8h.html#a3ff8022461abe72c4197e34601d592a9">  112</a></span>&#160;<span class="keywordtype">void</span> triangular(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Side side, blas::Uplo uplo, blas::Op op,</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                blas::Diag diag, T alpha, Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
-<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160; </div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160; </div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      }</div>
-<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      }</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    }</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      }</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      }</div>
-<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    }</div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
-<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160; </div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
-<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      }</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      }</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    }</div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
-<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      }</div>
-<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <span class="keywordflow">else</span> {</div>
-<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      }</div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    }</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  }</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;}</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160; </div>
-<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;}</div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;}</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUT</a>(op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      }</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    }</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  }</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;}</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160; </div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="solver_2triangular_8h.html#a3ff8022461abe72c4197e34601d592a9">  116</a></span>&#160;<span class="keywordtype">void</span> triangular(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, blas::Side side, blas::Uplo uplo, blas::Op op,</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                blas::Diag diag, T alpha, Matrix&lt;const T, device&gt;&amp; mat_a, Matrix&lt;T, device&gt;&amp; mat_b) {</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  DLAF_ASSERT(matrix::square_size(mat_a), mat_a);</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(mat_a), mat_a);</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_a), mat_a);</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(mat_b), mat_b);</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_a, grid), mat_a, grid);</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(mat_b, grid), mat_b, grid);</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160; </div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="keywordflow">if</span> (side == blas::Side::Left) {</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_a, mat_b, mat_b, op, blas::Op::NoTrans), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160; </div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      }</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LLT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      }</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    }</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      }</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_LUT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      }</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    }</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  }</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    DLAF_ASSERT(matrix::multipliable(mat_b, mat_a, mat_b, blas::Op::NoTrans, op), mat_a, mat_b, op);</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160; </div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keywordflow">if</span> (uplo == blas::Uplo::Lower) {</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      }</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RLT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      }</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    }</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="keywordflow">if</span> (op == blas::Op::NoTrans) {</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUN</a>(grid, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      }</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        <a class="code" href="structdlaf_1_1solver_1_1internal_1_1_triangular.html">internal::Triangular&lt;backend, device, T&gt;::call_RUT</a>(grid, op, diag, alpha, mat_a, mat_b);</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      }</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    }</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  }</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;}</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160; </div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;}</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
diff --git a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_563250733b77a55bd996211659d75e42.html b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_563250733b77a55bd996211659d75e42.html
index 4ee7608d74..8ead579438 100644
--- a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_563250733b77a55bd996211659d75e42.html
+++ b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_563250733b77a55bd996211659d75e42.html
@@ -72,8 +72,8 @@
 
 <p>This is the complete list of members for <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>call</b>(Matrix&lt; T, Device::GPU &gt; &amp;mat_a, matrix::RetiledMatrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>call</b>(TriggerSender &amp;&amp;trigger, comm::IndexT_MPI rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, matrix::RetiledMatrix&lt; T, Device::CPU &gt; &amp;mat_taus, SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>call</b>(Matrix&lt; T, Device::GPU &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>call</b>(TriggerSender &amp;&amp;trigger, comm::IndexT_MPI rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>ComputePanelHelper</b>(const std::size_t n_workspaces, matrix::Distribution dist_a) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr bgcolor="#f0f0f0"><td class="entry"><b>copyFromCPU</b>(const matrix::SubPanelView panel_view, matrix::Panel&lt; Coord::Col, T, Device::CPU &gt; &amp;v, matrix::Matrix&lt; T, Device::GPU &gt; &amp;mat_a) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">protected</span></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>copyToCPU</b>(const matrix::SubPanelView panel_view, matrix::Matrix&lt; T, Device::GPU &gt; &amp;mat_a, matrix::Panel&lt; Coord::Col, T, Device::CPU &gt; &amp;v) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::GPU, Device::GPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">protected</span></td></tr>
diff --git a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html
index 617f67a71d..a5e8920e2e 100644
--- a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html
+++ b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_g_p_e566a066992e6980ee13cab3c8831bc5.html
@@ -80,13 +80,13 @@
 <tr class="memitem:a81f20c3b77a670cfbfaf359742466f15"><td class="memItemLeft" align="right" valign="top"><a id="a81f20c3b77a670cfbfaf359742466f15"></a>
 &#160;</td><td class="memItemRight" valign="bottom"><b>ComputePanelHelper</b> (const std::size_t n_workspaces, <a class="el" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a> dist_a)</td></tr>
 <tr class="separator:a81f20c3b77a670cfbfaf359742466f15"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a86c9622b77b3380f2b36ed40215aa9e0"><td class="memItemLeft" align="right" valign="top"><a id="a86c9622b77b3380f2b36ed40215aa9e0"></a>
-void&#160;</td><td class="memItemRight" valign="bottom"><b>call</b> (Matrix&lt; T, Device::GPU &gt; &amp;mat_a, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix</a>&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
-<tr class="separator:a86c9622b77b3380f2b36ed40215aa9e0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a563d18935b58e80a8a432d27528d7357"><td class="memTemplParams" colspan="2"><a id="a563d18935b58e80a8a432d27528d7357"></a>
+<tr class="memitem:a02067b73b4ee1c521d6568a384270b9b"><td class="memItemLeft" align="right" valign="top"><a id="a02067b73b4ee1c521d6568a384270b9b"></a>
+void&#160;</td><td class="memItemRight" valign="bottom"><b>call</b> (Matrix&lt; T, Device::GPU &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
+<tr class="separator:a02067b73b4ee1c521d6568a384270b9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a62d7e04be91ce6a0d37ad6ef648b78"><td class="memTemplParams" colspan="2"><a id="a4a62d7e04be91ce6a0d37ad6ef648b78"></a>
 template&lt;Device D, class CommSender , class TriggerSender &gt; </td></tr>
-<tr class="memitem:a563d18935b58e80a8a432d27528d7357"><td class="memTemplItemLeft" align="right" valign="top">void&#160;</td><td class="memTemplItemRight" valign="bottom"><b>call</b> (TriggerSender &amp;&amp;trigger, <a class="el" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix</a>&lt; T, Device::CPU &gt; &amp;mat_taus, SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
-<tr class="separator:a563d18935b58e80a8a432d27528d7357"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a62d7e04be91ce6a0d37ad6ef648b78"><td class="memTemplItemLeft" align="right" valign="top">void&#160;</td><td class="memTemplItemRight" valign="bottom"><b>call</b> (TriggerSender &amp;&amp;trigger, <a class="el" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
+<tr class="separator:a4a62d7e04be91ce6a0d37ad6ef648b78"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pro-methods"></a>
 Protected Member Functions</h2></td></tr>
diff --git a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_9c17309f77611319159a292eeae019d5.html b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_9c17309f77611319159a292eeae019d5.html
index 7066d7db16..8f154cc84a 100644
--- a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_9c17309f77611319159a292eeae019d5.html
+++ b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_9c17309f77611319159a292eeae019d5.html
@@ -72,8 +72,8 @@
 
 <p>This is the complete list of members for <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>call</b>(Matrix&lt; T, Device::CPU &gt; &amp;mat_a, matrix::RetiledMatrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr bgcolor="#f0f0f0"><td class="entry"><b>call</b>(TriggerSender &amp;&amp;trigger, comm::IndexT_MPI rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, matrix::RetiledMatrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>call</b>(Matrix&lt; T, Device::CPU &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr bgcolor="#f0f0f0"><td class="entry"><b>call</b>(TriggerSender &amp;&amp;trigger, comm::IndexT_MPI rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const matrix::SubPanelView &amp;panel_view) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr bgcolor="#f0f0f0" class="even"><td class="entry"><b>ComputePanelHelper</b>(const std::size_t, matrix::Distribution) (defined in <a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a>)</td><td class="entry"><a class="el" href="structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html">dlaf::eigensolver::internal::red2band::ComputePanelHelper&lt; Backend::MC, Device::CPU, T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
diff --git a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html
index 865359e11d..6a3479e179 100644
--- a/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html
+++ b/master/structdlaf_1_1eigensolver_1_1internal_1_1red2band_1_1_compute_panel_helper_3_01_backend_1_1_m_c_f6049763c467d19a4a2bae31f1d19649.html
@@ -78,13 +78,13 @@
 <tr class="memitem:ada80f169e4824b2efd14ee5a2bbb9b43"><td class="memItemLeft" align="right" valign="top"><a id="ada80f169e4824b2efd14ee5a2bbb9b43"></a>
 &#160;</td><td class="memItemRight" valign="bottom"><b>ComputePanelHelper</b> (const std::size_t, <a class="el" href="classdlaf_1_1matrix_1_1_distribution.html">matrix::Distribution</a>)</td></tr>
 <tr class="separator:ada80f169e4824b2efd14ee5a2bbb9b43"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4fe0d1733bf5055ee603c846daca39db"><td class="memItemLeft" align="right" valign="top"><a id="a4fe0d1733bf5055ee603c846daca39db"></a>
-void&#160;</td><td class="memItemRight" valign="bottom"><b>call</b> (Matrix&lt; T, Device::CPU &gt; &amp;mat_a, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix</a>&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
-<tr class="separator:a4fe0d1733bf5055ee603c846daca39db"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b9f39cb1e7bd45466798dd167178a75"><td class="memTemplParams" colspan="2"><a id="a0b9f39cb1e7bd45466798dd167178a75"></a>
+<tr class="memitem:a45890488dd15523a4d6408e9b53f41bd"><td class="memItemLeft" align="right" valign="top"><a id="a45890488dd15523a4d6408e9b53f41bd"></a>
+void&#160;</td><td class="memItemRight" valign="bottom"><b>call</b> (Matrix&lt; T, Device::CPU &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
+<tr class="separator:a45890488dd15523a4d6408e9b53f41bd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab153af737c210ed87469a9f7b903c862"><td class="memTemplParams" colspan="2"><a id="ab153af737c210ed87469a9f7b903c862"></a>
 template&lt;Device D, class CommSender , class TriggerSender &gt; </td></tr>
-<tr class="memitem:a0b9f39cb1e7bd45466798dd167178a75"><td class="memTemplItemLeft" align="right" valign="top">void&#160;</td><td class="memTemplItemRight" valign="bottom"><b>call</b> (TriggerSender &amp;&amp;trigger, <a class="el" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, <a class="el" href="classdlaf_1_1matrix_1_1_retiled_matrix.html">matrix::RetiledMatrix</a>&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
-<tr class="separator:a0b9f39cb1e7bd45466798dd167178a75"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab153af737c210ed87469a9f7b903c862"><td class="memTemplItemLeft" align="right" valign="top">void&#160;</td><td class="memTemplItemRight" valign="bottom"><b>call</b> (TriggerSender &amp;&amp;trigger, <a class="el" href="communicator_8h.html#a2b48f62607e5e128dff19ceac22093e9">comm::IndexT_MPI</a> rank_v0, CommSender &amp;&amp;mpi_col_chain_panel, Matrix&lt; T, D &gt; &amp;mat_a, Matrix&lt; T, Device::CPU &gt; &amp;mat_taus, const SizeType j_sub, const <a class="el" href="structdlaf_1_1matrix_1_1_sub_panel_view.html">matrix::SubPanelView</a> &amp;panel_view)</td></tr>
+<tr class="separator:ab153af737c210ed87469a9f7b903c862"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <hr/>The documentation for this struct was generated from the following file:<ul>
 <li>/home/runner/work/DLA-Future/DLA-Future/include/dlaf/eigensolver/reduction_to_band/<a class="el" href="eigensolver_2reduction__to__band_2impl_8h_source.html">impl.h</a></li>
diff --git a/master/tridiag__solver_8h.html b/master/tridiag__solver_8h.html
index adb2a728e9..64fe99c2ed 100644
--- a/master/tridiag__solver_8h.html
+++ b/master/tridiag__solver_8h.html
@@ -142,9 +142,15 @@ <h2 class="memtitle"><span class="permalink"><a href="#a0cfeab14e9e1dc7a2fb70300
 <dd>
 tridiag has 2 columns and column block size of 2 </dd>
 <dd>
+tridiag has equal tile and block sizes </dd>
+<dd>
 evecs is a square matrix with global number of rows equal to the number of rows of <code>tridiag</code> and <code>evals</code> </dd>
 <dd>
-evecs has a square block size with number of block rows eqaul to the block rows of <code>tridiag</code> and <code>evals</code> </dd></dl>
+evecs has a square block size with number of block rows equal to the block rows of <code>tridiag</code> and <code>evals</code> </dd>
+<dd>
+evals has equal tile and block sizes </dd>
+<dd>
+evecs has equal tile and block sizes </dd></dl>
 
 </div>
 </div>
@@ -194,9 +200,15 @@ <h2 class="memtitle"><span class="permalink"><a href="#a52f0bd4b681a2d1c3e47bfd6
 <dd>
 tridiag has 2 columns and column block size of 2 </dd>
 <dd>
+tridiag has equal tile and block sizes </dd>
+<dd>
 evecs is a square matrix with number of rows equal to the number of rows of <code>tridiag</code> and <code>evals</code> </dd>
 <dd>
-evecs has a square block size with number of block rows eqaul to the block rows of <code>tridiag</code> and <code>evals</code> </dd></dl>
+evecs has a square block size with number of block rows equal to the block rows of <code>tridiag</code> and <code>evals</code> </dd>
+<dd>
+evals has equal tile and block sizes </dd>
+<dd>
+evecs has equal tile and block sizes </dd></dl>
 
 </div>
 </div>
diff --git a/master/tridiag__solver_8h_source.html b/master/tridiag__solver_8h_source.html
index 773993c489..e32fe1097f 100644
--- a/master/tridiag__solver_8h_source.html
+++ b/master/tridiag__solver_8h_source.html
@@ -91,66 +91,74 @@
 <div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="keyword">namespace </span>dlaf {</div>
 <div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="keyword">namespace </span><a class="code" href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">eigensolver</a> {</div>
 <div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160; </div>
-<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">   39</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">tridiagSolver</a>(Matrix&lt;BaseType&lt;T&gt;, Device::CPU&gt;&amp; tridiag, Matrix&lt;BaseType&lt;T&gt;, device&gt;&amp; evals,</div>
-<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;                   Matrix&lt;T, device&gt;&amp; evecs) {</div>
-<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  DLAF_ASSERT(matrix::local_matrix(tridiag), tridiag);</div>
-<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().cols() == 2, tridiag);</div>
-<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().cols() == 2, tridiag);</div>
-<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160; </div>
-<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(matrix::local_matrix(evals), evals);</div>
-<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(evals.distribution().size().cols() == 1, evals);</div>
-<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160; </div>
-<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  DLAF_ASSERT(matrix::local_matrix(evecs), evecs);</div>
-<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(matrix::square_size(evecs), evecs);</div>
-<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(evecs), evecs);</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;Backend backend, Device device, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">   42</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">tridiagSolver</a>(Matrix&lt;BaseType&lt;T&gt;, Device::CPU&gt;&amp; tridiag, Matrix&lt;BaseType&lt;T&gt;, device&gt;&amp; evals,</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;                   Matrix&lt;T, device&gt;&amp; evecs) {</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  DLAF_ASSERT(matrix::local_matrix(tridiag), tridiag);</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().cols() == 2, tridiag);</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().cols() == 2, tridiag);</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(tridiag), tridiag);</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160; </div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  DLAF_ASSERT(matrix::local_matrix(evals), evals);</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  DLAF_ASSERT(evals.distribution().size().cols() == 1, evals);</div>
 <div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160; </div>
-<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evecs.distribution().blockSize().rows(),</div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;              evecs.distribution().blockSize().rows(), tridiag.distribution().blockSize().rows());</div>
-<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evals.distribution().blockSize().rows(),</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;              tridiag.distribution().blockSize().rows(), evals.distribution().blockSize().rows());</div>
-<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evecs.distribution().size().rows(),</div>
-<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;              evecs.distribution().size().rows(), tridiag.distribution().size().rows());</div>
-<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evals.distribution().size().rows(),</div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;              tridiag.distribution().size().rows(), evals.distribution().size().rows());</div>
-<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160; </div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html">internal::TridiagSolver&lt;backend, device, BaseType&lt;T&gt;</a>&gt;::call(tridiag, evals, evecs);</div>
-<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;}</div>
-<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160; </div>
-<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="tridiag__solver_8h.html#a0cfeab14e9e1dc7a2fb703006cd7e957">   81</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">tridiagSolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, Matrix&lt;BaseType&lt;T&gt;, Device::CPU&gt;&amp; tridiag,</div>
-<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                   Matrix&lt;BaseType&lt;T&gt;, D&gt;&amp; evals, Matrix&lt;T, D&gt;&amp; evecs) {</div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  DLAF_ASSERT(matrix::local_matrix(tridiag), tridiag);</div>
-<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().cols() == 2, tridiag);</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().cols() == 2, tridiag);</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160; </div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  DLAF_ASSERT(matrix::local_matrix(evals), evals);</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  DLAF_ASSERT(evals.distribution().size().cols() == 1, evals);</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160; </div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  DLAF_ASSERT(matrix::square_size(evecs), evecs);</div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(evecs), evecs);</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(evecs, grid), evecs, grid);</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160; </div>
-<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evecs.distribution().blockSize().rows(),</div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;              evecs, tridiag);</div>
-<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evals.distribution().blockSize().rows(),</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;              tridiag, evals);</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evecs.distribution().size().rows(), evecs,</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;              tridiag);</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evals.distribution().size().rows(), tridiag,</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;              evals);</div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160; </div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html">internal::TridiagSolver&lt;B, D, BaseType&lt;T&gt;</a>&gt;::call(grid, tridiag, evals, evecs);</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;}</div>
-<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160; </div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}</div>
-<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;}</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  DLAF_ASSERT(matrix::local_matrix(evecs), evecs);</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  DLAF_ASSERT(matrix::square_size(evecs), evecs);</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(evecs), evecs);</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160; </div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(evecs), evecs);</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(evals), evals);</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160; </div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evecs.distribution().blockSize().rows(),</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;              evecs.distribution().blockSize().rows(), tridiag.distribution().blockSize().rows());</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evals.distribution().blockSize().rows(),</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;              tridiag.distribution().blockSize().rows(), evals.distribution().blockSize().rows());</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evecs.distribution().size().rows(),</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;              evecs.distribution().size().rows(), tridiag.distribution().size().rows());</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evals.distribution().size().rows(),</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;              tridiag.distribution().size().rows(), evals.distribution().size().rows());</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160; </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html">internal::TridiagSolver&lt;backend, device, BaseType&lt;T&gt;</a>&gt;::call(tridiag, evals, evecs);</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;}</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160; </div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;<span class="keyword">template</span> &lt;Backend B, Device D, <span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="tridiag__solver_8h.html#a0cfeab14e9e1dc7a2fb703006cd7e957">   94</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">tridiagSolver</a>(<a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a> grid, Matrix&lt;BaseType&lt;T&gt;, Device::CPU&gt;&amp; tridiag,</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;                   Matrix&lt;BaseType&lt;T&gt;, D&gt;&amp; evals, Matrix&lt;T, D&gt;&amp; evecs) {</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  DLAF_ASSERT(matrix::local_matrix(tridiag), tridiag);</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().cols() == 2, tridiag);</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().cols() == 2, tridiag);</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(tridiag), tridiag);</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160; </div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  DLAF_ASSERT(matrix::local_matrix(evals), evals);</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  DLAF_ASSERT(evals.distribution().size().cols() == 1, evals);</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160; </div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  DLAF_ASSERT(matrix::square_size(evecs), evecs);</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  DLAF_ASSERT(matrix::square_blocksize(evecs), evecs);</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  DLAF_ASSERT(matrix::equal_process_grid(evecs, grid), evecs, grid);</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160; </div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(evecs), evecs);</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  DLAF_ASSERT(matrix::single_tile_per_block(evals), evals);</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evecs.distribution().blockSize().rows(),</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;              evecs, tridiag);</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  DLAF_ASSERT(tridiag.distribution().blockSize().rows() == evals.distribution().blockSize().rows(),</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;              tridiag, evals);</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evecs.distribution().size().rows(), evecs,</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;              tridiag);</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  DLAF_ASSERT(tridiag.distribution().size().rows() == evals.distribution().size().rows(), tridiag,</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;              evals);</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160; </div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <a class="code" href="structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html">internal::TridiagSolver&lt;B, D, BaseType&lt;T&gt;</a>&gt;::call(grid, tridiag, evals, evecs);</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;}</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160; </div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;}</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;}</div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="acommunicator__grid_8h_html"><div class="ttname"><a href="communicator__grid_8h.html">communicator_grid.h</a></div></div>
 <div class="ttc" id="aeigensolver_2eigensolver_8h_html_a7aeed252a1783c24f778eb250d0efd72"><div class="ttname"><a href="eigensolver_2eigensolver_8h.html#a7aeed252a1783c24f778eb250d0efd72">dlaf::eigensolver::eigensolver</a></div><div class="ttdeci">void eigensolver(blas::Uplo uplo, Matrix&lt; T, D &gt; &amp;mat, Matrix&lt; BaseType&lt; T &gt;, D &gt; &amp;eigenvalues, Matrix&lt; T, D &gt; &amp;eigenvectors)</div><div class="ttdef"><b>Definition:</b> eigensolver.h:39</div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
 <div class="ttc" id="astructdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver_html"><div class="ttname"><a href="structdlaf_1_1eigensolver_1_1internal_1_1_tridiag_solver.html">dlaf::eigensolver::internal::TridiagSolver</a></div><div class="ttdef"><b>Definition:</b> api.h:18</div></div>
-<div class="ttc" id="atridiag__solver_8h_html_a52f0bd4b681a2d1c3e47bfd6a6ebf15a"><div class="ttname"><a href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">dlaf::eigensolver::tridiagSolver</a></div><div class="ttdeci">void tridiagSolver(Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, device &gt; &amp;evals, Matrix&lt; T, device &gt; &amp;evecs)</div><div class="ttdef"><b>Definition:</b> tridiag_solver.h:39</div></div>
+<div class="ttc" id="atridiag__solver_8h_html_a52f0bd4b681a2d1c3e47bfd6a6ebf15a"><div class="ttname"><a href="tridiag__solver_8h.html#a52f0bd4b681a2d1c3e47bfd6a6ebf15a">dlaf::eigensolver::tridiagSolver</a></div><div class="ttdeci">void tridiagSolver(Matrix&lt; BaseType&lt; T &gt;, Device::CPU &gt; &amp;tridiag, Matrix&lt; BaseType&lt; T &gt;, device &gt; &amp;evals, Matrix&lt; T, device &gt; &amp;evecs)</div><div class="ttdef"><b>Definition:</b> tridiag_solver.h:42</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="autil__matrix_8h_html"><div class="ttname"><a href="util__matrix_8h.html">util_matrix.h</a></div></div>
 </div><!-- fragment --></div><!-- contents -->
diff --git a/master/util__matrix_8h.html b/master/util__matrix_8h.html
index 6a7371ef33..383ed5b331 100644
--- a/master/util__matrix_8h.html
+++ b/master/util__matrix_8h.html
@@ -112,6 +112,11 @@
 <tr class="memitem:a355682eaf279129f2aa06c8e96eaa61b"><td class="memTemplItemLeft" align="right" valign="top">bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b">dlaf::matrix::square_blocksize</a> (const MatrixLike &amp;m) noexcept</td></tr>
 <tr class="memdesc:a355682eaf279129f2aa06c8e96eaa61b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the matrix block size is square. <br /></td></tr>
 <tr class="separator:a355682eaf279129f2aa06c8e96eaa61b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4e47364118c7bc9bb3d038ae4ec8a35c"><td class="memTemplParams" colspan="2"><a id="a4e47364118c7bc9bb3d038ae4ec8a35c"></a>
+template&lt;class MatrixLike &gt; </td></tr>
+<tr class="memitem:a4e47364118c7bc9bb3d038ae4ec8a35c"><td class="memTemplItemLeft" align="right" valign="top">bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="util__matrix_8h.html#a4e47364118c7bc9bb3d038ae4ec8a35c">dlaf::matrix::single_tile_per_block</a> (const MatrixLike &amp;m) noexcept</td></tr>
+<tr class="memdesc:a4e47364118c7bc9bb3d038ae4ec8a35c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the matrix has a single tile per block. <br /></td></tr>
+<tr class="separator:a4e47364118c7bc9bb3d038ae4ec8a35c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:ada06af4450b10ed70a5830c0d8db0302"><td class="memTemplParams" colspan="2"><a id="ada06af4450b10ed70a5830c0d8db0302"></a>
 template&lt;class MatrixLikeA , class MatrixLikeB &gt; </td></tr>
 <tr class="memitem:ada06af4450b10ed70a5830c0d8db0302"><td class="memTemplItemLeft" align="right" valign="top">bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">dlaf::matrix::equal_size</a> (const MatrixLikeA &amp;lhs, const MatrixLikeB &amp;rhs) noexcept</td></tr>
diff --git a/master/util__matrix_8h_source.html b/master/util__matrix_8h_source.html
index a3a3cd1b24..f7a0dec5bc 100644
--- a/master/util__matrix_8h_source.html
+++ b/master/util__matrix_8h_source.html
@@ -117,272 +117,277 @@
 <div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="keywordflow">return</span> m.blockSize().rows() == m.blockSize().cols();</div>
 <div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;}</div>
 <div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160; </div>
-<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLikeA, <span class="keyword">class</span> MatrixLikeB&gt;</div>
-<div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">   54</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">equal_size</a>(<span class="keyword">const</span> MatrixLikeA&amp; lhs, <span class="keyword">const</span> MatrixLikeB&amp; rhs) noexcept {</div>
-<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="keywordflow">return</span> lhs.size() == rhs.size();</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLike&gt;</div>
+<div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a4e47364118c7bc9bb3d038ae4ec8a35c">   54</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a4e47364118c7bc9bb3d038ae4ec8a35c">single_tile_per_block</a>(<span class="keyword">const</span> MatrixLike&amp; m) noexcept {</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="keywordflow">return</span> m.blockSize() == m.baseTileSize();</div>
 <div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;}</div>
 <div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160; </div>
-<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D1, Device D2&gt;</div>
-<div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe">   60</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe">equal_blocksize</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D1&gt;</a>&amp; lhs, <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D2&gt;</a>&amp; rhs) noexcept {</div>
-<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keywordflow">return</span> lhs.blockSize() == rhs.blockSize();</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> MatrixLikeA, <span class="keyword">class</span> MatrixLikeB&gt;</div>
+<div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">   60</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">equal_size</a>(<span class="keyword">const</span> MatrixLikeA&amp; lhs, <span class="keyword">const</span> MatrixLikeB&amp; rhs) noexcept {</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keywordflow">return</span> lhs.size() == rhs.size();</div>
 <div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;}</div>
 <div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160; </div>
-<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">   66</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">local_matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; m) noexcept {</div>
-<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="keywordflow">return</span> m.commGridSize() == <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">comm::Size2D</a>(1, 1);</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D1, Device D2&gt;</div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe">   66</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe">equal_blocksize</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D1&gt;</a>&amp; lhs, <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D2&gt;</a>&amp; rhs) noexcept {</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="keywordflow">return</span> lhs.blockSize() == rhs.blockSize();</div>
 <div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;}</div>
 <div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160; </div>
 <div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c">   72</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c">equal_process_grid</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; m, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; g) noexcept {</div>
-<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keywordflow">return</span> m.commGridSize() == g.size() &amp;&amp; m.rankIndex() == g.rank();</div>
+<div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">   72</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">local_matrix</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; m) noexcept {</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keywordflow">return</span> m.commGridSize() == <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">comm::Size2D</a>(1, 1);</div>
 <div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;}</div>
 <div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160; </div>
-<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D1, Device D2&gt;</div>
-<div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2">   78</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2">equal_distributions</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D1&gt;</a>&amp; lhs, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D2&gt;</a>&amp; rhs) noexcept {</div>
-<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keywordflow">return</span> lhs.distribution() == rhs.distribution();</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
+<div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c">   78</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c">equal_process_grid</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; m, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1comm_1_1_communicator_grid.html">comm::CommunicatorGrid</a>&amp; g) noexcept {</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keywordflow">return</span> m.commGridSize() == g.size() &amp;&amp; m.rankIndex() == g.rank();</div>
 <div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;}</div>
 <div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160; </div>
-<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> IndexT, <span class="keyword">class</span> Tag&gt;</div>
-<div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">   84</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">multipliable_sizes</a>(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">common::Size2D&lt;IndexT, Tag&gt;</a> a, <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">common::Size2D&lt;IndexT, Tag&gt;</a> b,</div>
-<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                        <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">common::Size2D&lt;IndexT, Tag&gt;</a> c, <span class="keyword">const</span> blas::Op opA, <span class="keyword">const</span> blas::Op opB) noexcept {</div>
-<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="keywordflow">if</span> (opA != blas::Op::NoTrans)</div>
-<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    a.transpose();</div>
-<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <span class="keywordflow">if</span> (opB != blas::Op::NoTrans)</div>
-<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    b.transpose();</div>
-<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160; </div>
-<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="keywordflow">return</span> a.rows() == c.rows() &amp;&amp; a.cols() == b.rows() &amp;&amp; b.cols() == c.cols();</div>
-<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;}</div>
-<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160; </div>
-<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86">   96</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86">multipliable</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; a, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; b, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; c,</div>
-<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;                  <span class="keyword">const</span> blas::Op opA, <span class="keyword">const</span> blas::Op opB) noexcept {</div>
-<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">multipliable_sizes</a>(a.size(), b.size(), c.size(), opA, opB) &amp;&amp;</div>
-<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;         <a class="code" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">multipliable_sizes</a>(a.blockSize(), b.blockSize(), c.blockSize(), opA, opB);</div>
-<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;}</div>
-<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160; </div>
-<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="keyword">namespace </span>util {</div>
-<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">namespace </span>internal {</div>
-<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160; </div>
-<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">  107</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a> {</div>
-<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  static_assert(std::is_same_v&lt;T, float&gt; || std::is_same_v&lt;T, double&gt;,</div>
-<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;                <span class="stringliteral">&quot;T is not compatible with random generator used.&quot;</span>);</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D1, Device D2&gt;</div>
+<div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2">   84</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2">equal_distributions</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D1&gt;</a>&amp; lhs, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;const T, D2&gt;</a>&amp; rhs) noexcept {</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="keywordflow">return</span> lhs.distribution() == rhs.distribution();</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;}</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160; </div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> IndexT, <span class="keyword">class</span> Tag&gt;</div>
+<div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">   90</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">multipliable_sizes</a>(<a class="code" href="classdlaf_1_1common_1_1_size2_d.html">common::Size2D&lt;IndexT, Tag&gt;</a> a, <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">common::Size2D&lt;IndexT, Tag&gt;</a> b,</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                        <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">common::Size2D&lt;IndexT, Tag&gt;</a> c, <span class="keyword">const</span> blas::Op opA, <span class="keyword">const</span> blas::Op opB) noexcept {</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  <span class="keywordflow">if</span> (opA != blas::Op::NoTrans)</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    a.transpose();</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="keywordflow">if</span> (opB != blas::Op::NoTrans)</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    b.transpose();</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160; </div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="keywordflow">return</span> a.rows() == c.rows() &amp;&amp; a.cols() == b.rows() &amp;&amp; b.cols() == c.cols();</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;}</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160; </div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, Device D&gt;</div>
+<div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86">  102</a></span>&#160;<span class="keywordtype">bool</span> <a class="code" href="util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86">multipliable</a>(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; a, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; b, <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">Matrix&lt;const T, D&gt;</a>&amp; c,</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                  <span class="keyword">const</span> blas::Op opA, <span class="keyword">const</span> blas::Op opB) noexcept {</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">multipliable_sizes</a>(a.size(), b.size(), c.size(), opA, opB) &amp;&amp;</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;         <a class="code" href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">multipliable_sizes</a>(a.blockSize(), b.blockSize(), c.blockSize(), opA, opB);</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160; </div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="keyword">namespace </span>util {</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="keyword">namespace </span>internal {</div>
 <div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160; </div>
-<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">public</span>:</div>
-<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>() : random_engine_(std::minstd_rand::default_seed) {}</div>
-<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>(SizeType seed) : random_engine_(<span class="keyword">static_cast&lt;</span>std::size_t<span class="keyword">&gt;</span>(seed)) {</div>
-<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    DLAF_ASSERT(seed &gt;= 0, <span class="stringliteral">&quot;&quot;</span>);</div>
-<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  }</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">  113</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a> {</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  static_assert(std::is_same_v&lt;T, float&gt; || std::is_same_v&lt;T, double&gt;,</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                <span class="stringliteral">&quot;T is not compatible with random generator used.&quot;</span>);</div>
 <div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160; </div>
-<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  T operator()() {</div>
-<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <span class="keywordflow">return</span> random_sampler_(random_engine_);</div>
-<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  }</div>
-<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160; </div>
-<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="keyword">private</span>:</div>
-<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  std::mt19937_64 random_engine_;</div>
-<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  std::uniform_real_distribution&lt;T&gt; random_sampler_{-1, 1};</div>
-<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;};</div>
-<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160; </div>
-<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_3_01std_1_1complex_3_01_t_01_4_01_4.html">  128</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>&lt;std::complex&lt;T&gt;&gt; : <span class="keyword">private</span> <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>&lt;T&gt; {</div>
-<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="keyword">public</span>:</div>
-<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random&lt;T&gt;::getter_random</a>;</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>() : random_engine_(std::minstd_rand::default_seed) {}</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>(SizeType seed) : random_engine_(<span class="keyword">static_cast&lt;</span>std::size_t<span class="keyword">&gt;</span>(seed)) {</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    DLAF_ASSERT(seed &gt;= 0, <span class="stringliteral">&quot;&quot;</span>);</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  }</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160; </div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  T operator()() {</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="keywordflow">return</span> random_sampler_(random_engine_);</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  }</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160; </div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  std::mt19937_64 random_engine_;</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  std::uniform_real_distribution&lt;T&gt; random_sampler_{-1, 1};</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;};</div>
 <div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160; </div>
-<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  std::complex&lt;T&gt; operator()() {</div>
-<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="keywordflow">return</span> std::polar&lt;T&gt;(std::abs(<a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random&lt;T&gt;::operator</a>()()),</div>
-<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                         <span class="keyword">static_cast&lt;</span>T<span class="keyword">&gt;</span>(M_PI) * <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random&lt;T&gt;::operator</a>()());</div>
-<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div>
-<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;};</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_3_01std_1_1complex_3_01_t_01_4_01_4.html">  134</a></span>&#160;<span class="keyword">class </span><a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>&lt;std::complex&lt;T&gt;&gt; : <span class="keyword">private</span> <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random</a>&lt;T&gt; {</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random&lt;T&gt;::getter_random</a>;</div>
 <div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160; </div>
-<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;}</div>
-<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160; </div>
-<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">template</span> &lt;Backend backend, <span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a6cdf6afc18a6456ed68b3fd1dffa9c39">  143</a></span>&#160;<span class="keywordtype">void</span> set0(pika::execution::thread_priority priority, <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> begin, <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> sz,</div>
-<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;          <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>&amp; matrix) {</div>
-<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
-<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <span class="keyword">using</span> pika::execution::experimental::start_detached;</div>
-<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160; </div>
-<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; idx : iterate_range2d(begin, sz))</div>
-<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    start_detached(matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(idx) | tile::set0(Policy&lt;backend&gt;(priority)));</div>
-<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;}</div>
-<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160; </div>
-<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="keyword">template</span> &lt;Backend backend, <span class="keyword">class</span> T, Device D&gt;</div>
-<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="keywordtype">void</span> set0(pika::execution::thread_priority priority, <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>&amp; matrix) {</div>
-<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  set0&lt;backend&gt;(priority, <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>(0, 0), matrix.distribution().localNrTiles(), matrix);</div>
-<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;}</div>
-<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160; </div>
-<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="keyword">template</span> &lt;Backend backend, <span class="keyword">class</span> T, Coord axis, Device D, StoreTransposed storage&gt;</div>
-<div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a79688b3669b67c143114cf2eef3ba69b">  163</a></span>&#160;<span class="keywordtype">void</span> set0(pika::execution::thread_priority priority, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">Panel&lt;axis, T, D, storage&gt;</a>&amp; panel) {</div>
-<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
-<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <span class="keyword">using</span> pika::execution::experimental::start_detached;</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  std::complex&lt;T&gt; operator()() {</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordflow">return</span> std::polar&lt;T&gt;(std::abs(<a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random&lt;T&gt;::operator</a>()()),</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;                         <span class="keyword">static_cast&lt;</span>T<span class="keyword">&gt;</span>(M_PI) * <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">getter_random&lt;T&gt;::operator</a>()());</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  }</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;};</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160; </div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;}</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160; </div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="keyword">template</span> &lt;Backend backend, <span class="keyword">class</span> T, Device D&gt;</div>
+<div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a6cdf6afc18a6456ed68b3fd1dffa9c39">  149</a></span>&#160;<span class="keywordtype">void</span> set0(pika::execution::thread_priority priority, <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a> begin, <a class="code" href="classdlaf_1_1common_1_1_size2_d.html">LocalTileSize</a> sz,</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;          <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>&amp; matrix) {</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">using</span> pika::execution::experimental::start_detached;</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160; </div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; idx : iterate_range2d(begin, sz))</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    start_detached(matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(idx) | tile::set0(Policy&lt;backend&gt;(priority)));</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;}</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160; </div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="keyword">template</span> &lt;Backend backend, <span class="keyword">class</span> T, Device D&gt;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="keywordtype">void</span> set0(pika::execution::thread_priority priority, <a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, D&gt;</a>&amp; matrix) {</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  set0&lt;backend&gt;(priority, <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">LocalTileIndex</a>(0, 0), matrix.distribution().localNrTiles(), matrix);</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;}</div>
 <div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160; </div>
-<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile_idx : panel.iteratorLocal())</div>
-<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    start_detached(panel.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(tile_idx) | tile::set0(Policy&lt;backend&gt;(priority)));</div>
-<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;}</div>
-<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160; </div>
-<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> ElementGetter&gt;</div>
-<div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">  178</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">set</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix, ElementGetter el_f) {</div>
-<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a>&amp; dist = matrix.distribution();</div>
-<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> tile_wrt_local : iterate_range2d(dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>())) {</div>
-<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> tile_wrt_global = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">globalTileIndex</a>(tile_wrt_local);</div>
-<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keyword">auto</span> tl_index = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">globalElementIndex</a>(tile_wrt_global, {0, 0});</div>
-<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160; </div>
-<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <span class="keyword">using</span> TileType = <span class="keyword">typename</span> std::decay_t&lt;decltype(matrix)&gt;::TileType;</div>
-<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <span class="keyword">auto</span> set_f = [tl_index, el_f = el_f](<span class="keyword">const</span> TileType&amp; tile) {</div>
-<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;      <span class="keywordflow">for</span> (<span class="keyword">auto</span> el_idx_l : iterate_range2d(tile.size())) {</div>
-<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a> el_idx_g(el_idx_l.row() + tl_index.row(), el_idx_l.col() + tl_index.col());</div>
-<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;        tile(el_idx_l) = el_f(el_idx_g);</div>
-<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      }</div>
-<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    };</div>
-<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160; </div>
-<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    dlaf::internal::transformDetach(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), std::move(set_f),</div>
-<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;                                    matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(tile_wrt_local));</div>
-<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  }</div>
-<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;}</div>
-<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160; </div>
-<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> ElementGetter&gt;</div>
-<div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#af07478cd4a633a1422e160863d3d8510">  207</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">set</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix, ElementGetter el_f, <span class="keyword">const</span> blas::Op op) {</div>
-<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="keyword">auto</span> el_op_f = [op, el_f](<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a>&amp; index) -&gt; T {</div>
-<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    <span class="keyword">using</span> blas::Op;</div>
-<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <span class="keywordflow">switch</span> (op) {</div>
-<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="keywordflow">case</span> Op::NoTrans:</div>
-<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        <span class="keywordflow">return</span> el_f(index);</div>
-<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="keywordflow">case</span> Op::Trans:</div>
-<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;        <span class="keywordflow">return</span> el_f(transposed(index));</div>
-<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="keywordflow">case</span> Op::ConjTrans:</div>
-<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="types_8h.html#a669723b711f94043da9793d2b24d51d9">dlaf::conj</a>(el_f(transposed(index)));</div>
-<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="keywordflow">default</span>:</div>
-<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;        DLAF_UNIMPLEMENTED(op);</div>
-<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;        <span class="keywordflow">return</span> T{};</div>
-<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    }</div>
-<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;  };</div>
-<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160; </div>
-<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  <a class="code" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">set</a>(matrix, el_op_f);</div>
-<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;}</div>
-<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160; </div>
-<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0">  237</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0">set_random</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix) {</div>
-<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a>&amp; dist = matrix.distribution();</div>
-<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> tile_wrt_local : iterate_range2d(dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>())) {</div>
-<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> tile_wrt_global = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">globalTileIndex</a>(tile_wrt_local);</div>
-<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;    <span class="keyword">auto</span> tl_index = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">globalElementIndex</a>(tile_wrt_global, {0, 0});</div>
-<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;    <span class="keyword">auto</span> seed = tl_index.col() + tl_index.row() * matrix.size().cols();</div>
-<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160; </div>
-<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    <span class="keyword">using</span> TileType = <span class="keyword">typename</span> std::decay_t&lt;decltype(matrix)&gt;::TileType;</div>
-<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <span class="keyword">auto</span> rnd_f = [seed](TileType&amp;&amp; tile) {</div>
-<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">internal::getter_random&lt;T&gt;</a> random_value(seed);</div>
-<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="keywordflow">for</span> (<span class="keyword">auto</span> el_idx : iterate_range2d(tile.size())) {</div>
-<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;        tile(el_idx) = random_value();</div>
-<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      }</div>
-<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    };</div>
-<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160; </div>
-<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    dlaf::internal::transformDetach(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), std::move(rnd_f),</div>
-<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;                                    matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(tile_wrt_local));</div>
-<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;  }</div>
-<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;}</div>
-<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160; </div>
-<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;<span class="keyword">namespace </span>internal {</div>
-<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160; </div>
-<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="keywordtype">void</span> set_diagonal_tile(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;T, Device::CPU&gt;</a>&amp; tile, internal::getter_random&lt;T&gt;&amp; random_value,</div>
-<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;                       SizeType offset_value) {</div>
-<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  <span class="comment">// DIAGONAL</span></div>
-<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;  <span class="comment">// for diagonal tiles get just lower matrix values and set value for both</span></div>
-<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;  <span class="comment">// straight and transposed indices</span></div>
-<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile.size().cols(); ++j) {</div>
-<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <span class="keywordflow">for</span> (SizeType i = 0; i &lt; j; ++i) {</div>
-<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;      <span class="keyword">auto</span> value = random_value();</div>
-<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160; </div>
-<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;      tile(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">TileElementIndex</a>{i, j}) = value;</div>
-<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;      tile(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">TileElementIndex</a>{j, i}) = dlaf::conj(value);</div>
-<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    }</div>
-<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    tile(TileElementIndex{j, j}) = std::real(random_value()) + offset_value;</div>
-<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;  }</div>
-<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;}</div>
-<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160; </div>
-<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;<span class="keywordtype">void</span> set_lower_and_upper_tile(<span class="keyword">const</span> Tile&lt;T, Device::CPU&gt;&amp; tile, internal::getter_random&lt;T&gt;&amp; random_value,</div>
-<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;                              TileElementSize full_tile_size, GlobalTileIndex tile_wrt_global) {</div>
-<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;  <span class="comment">// LOWER or UPPER (except DIAGONAL)</span></div>
-<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;  <span class="comment">// random values are requested in the same order for both original and transposed</span></div>
-<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; full_tile_size.cols(); ++j) {</div>
-<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;    <span class="keywordflow">for</span> (SizeType i = 0; i &lt; full_tile_size.rows(); ++i) {</div>
-<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <span class="keyword">auto</span> value = random_value();</div>
-<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160; </div>
-<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;      <span class="comment">// but they are set row-wise in the original tile and col-wise in the</span></div>
-<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;      <span class="comment">// transposed one</span></div>
-<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;      <span class="keywordflow">if</span> (tile_wrt_global.row() &gt; tile_wrt_global.col()) {  <span class="comment">// LOWER</span></div>
-<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;        TileElementIndex index{i, j};</div>
-<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;        <span class="keywordflow">if</span> (index.isIn(tile.size()))</div>
-<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;          tile(index) = value;</div>
-<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;      }</div>
-<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      <span class="keywordflow">else</span> {  <span class="comment">// UPPER</span></div>
-<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;        TileElementIndex index{j, i};</div>
-<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        <span class="keywordflow">if</span> (index.isIn(tile.size()))</div>
-<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;          tile(index) = <a class="code" href="types_8h.html#a669723b711f94043da9793d2b24d51d9">dlaf::conj</a>(value);</div>
-<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      }</div>
-<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    }</div>
-<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;  }</div>
-<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;}</div>
-<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160; </div>
-<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00318"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133">  318</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133">set_random_hermitian_with_offset</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix, <span class="keyword">const</span> SizeType offset_value) {</div>
-<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;  <span class="comment">// note:</span></div>
-<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;  <span class="comment">// By assuming square blocksizes, it is easier to locate elements. In fact:</span></div>
-<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;  <span class="comment">// - Elements on the diagonal are stored in the diagonal of the diagonal tiles</span></div>
-<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;  <span class="comment">// - Tiles under the diagonal store elements of the lower triangular matrix</span></div>
-<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;  <span class="comment">// - Tiles over the diagonal store elements of the upper triangular matrix</span></div>
-<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160; </div>
-<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a>&amp; dist = matrix.distribution();</div>
-<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160; </div>
-<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  DLAF_ASSERT(<a class="code" href="util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0">square_size</a>(matrix), matrix);</div>
-<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;  DLAF_ASSERT(<a class="code" href="util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b">square_blocksize</a>(matrix), matrix);</div>
-<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160; </div>
-<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;  <span class="keyword">auto</span> full_tile_size = matrix.blockSize();</div>
-<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160; </div>
-<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> tile_wrt_local : iterate_range2d(dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>())) {</div>
-<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> tile_wrt_global = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">globalTileIndex</a>(tile_wrt_local);</div>
-<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160; </div>
-<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    <span class="keyword">auto</span> tl_index = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">globalElementIndex</a>(tile_wrt_global, {0, 0});</div>
-<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160; </div>
-<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="comment">// compute the same seed for original and &quot;transposed&quot; tiles, so transposed ones will know the</span></div>
-<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <span class="comment">// values of the original one without the need of accessing real values (nor communication in case</span></div>
-<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <span class="comment">// of distributed matrices)</span></div>
-<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    SizeType seed;</div>
-<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keywordflow">if</span> (tile_wrt_global.row() &gt;= tile_wrt_global.col())  <span class="comment">// LOWER or DIAGONAL</span></div>
-<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;      seed = tl_index.col() + tl_index.row() * matrix.size().cols();</div>
-<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;      seed = tl_index.row() + tl_index.col() * matrix.size().rows();</div>
-<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160; </div>
-<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="keyword">using</span> TileType = <span class="keyword">typename</span> std::decay_t&lt;decltype(matrix)&gt;::TileType;</div>
-<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="keyword">auto</span> set_hp_f = [=](<span class="keyword">const</span> TileType&amp; tile) {</div>
-<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">internal::getter_random&lt;T&gt;</a> random_value(seed);</div>
-<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;      <span class="keywordflow">if</span> (tile_wrt_global.row() == tile_wrt_global.col())</div>
-<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        internal::set_diagonal_tile(tile, random_value, offset_value);</div>
-<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;      <span class="keywordflow">else</span></div>
-<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;        internal::set_lower_and_upper_tile(tile, random_value, full_tile_size, tile_wrt_global);</div>
-<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    };</div>
-<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160; </div>
-<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    dlaf::internal::transformDetach(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), std::move(set_hp_f),</div>
-<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;                                    matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(tile_wrt_local));</div>
-<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;  }</div>
-<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;}</div>
-<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160; </div>
-<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;}</div>
-<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160; </div>
-<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00376"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476">  376</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476">set_random_hermitian</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix) {</div>
-<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;  internal::set_random_hermitian_with_offset(matrix, 0);</div>
-<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;}</div>
-<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160; </div>
-<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
-<div class="line"><a name="l00397"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58">  397</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58">set_random_hermitian_positive_definite</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix) {</div>
-<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;  internal::set_random_hermitian_with_offset(matrix, 2 * matrix.size().rows());</div>
-<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;}</div>
-<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160; </div>
-<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;}</div>
-<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;}</div>
-<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;}</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="keyword">template</span> &lt;Backend backend, <span class="keyword">class</span> T, Coord axis, Device D, StoreTransposed storage&gt;</div>
+<div class="line"><a name="l00169"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a79688b3669b67c143114cf2eef3ba69b">  169</a></span>&#160;<span class="keywordtype">void</span> set0(pika::execution::thread_priority priority, <a class="code" href="structdlaf_1_1matrix_1_1_panel.html">Panel&lt;axis, T, D, storage&gt;</a>&amp; panel) {</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  <span class="keyword">using</span> <a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy</a>;</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  <span class="keyword">using</span> pika::execution::experimental::start_detached;</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160; </div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">const</span> <span class="keyword">auto</span>&amp; tile_idx : panel.iteratorLocal())</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    start_detached(panel.<a class="code" href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">readwrite</a>(tile_idx) | tile::set0(Policy&lt;backend&gt;(priority)));</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;}</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160; </div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> ElementGetter&gt;</div>
+<div class="line"><a name="l00184"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">  184</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">set</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix, ElementGetter el_f) {</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a>&amp; dist = matrix.distribution();</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> tile_wrt_local : iterate_range2d(dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>())) {</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> tile_wrt_global = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">globalTileIndex</a>(tile_wrt_local);</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <span class="keyword">auto</span> tl_index = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">globalElementIndex</a>(tile_wrt_global, {0, 0});</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160; </div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keyword">using</span> TileType = <span class="keyword">typename</span> std::decay_t&lt;decltype(matrix)&gt;::TileType;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="keyword">auto</span> set_f = [tl_index, el_f = el_f](<span class="keyword">const</span> TileType&amp; tile) {</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      <span class="keywordflow">for</span> (<span class="keyword">auto</span> el_idx_l : iterate_range2d(tile.size())) {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a> el_idx_g(el_idx_l.row() + tl_index.row(), el_idx_l.col() + tl_index.col());</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        tile(el_idx_l) = el_f(el_idx_g);</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      }</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    };</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160; </div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    dlaf::internal::transformDetach(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), std::move(set_f),</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;                                    matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(tile_wrt_local));</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  }</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;}</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160; </div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> ElementGetter&gt;</div>
+<div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#af07478cd4a633a1422e160863d3d8510">  213</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">set</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix, ElementGetter el_f, <span class="keyword">const</span> blas::Op op) {</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  <span class="keyword">auto</span> el_op_f = [op, el_f](<span class="keyword">const</span> <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalElementIndex</a>&amp; index) -&gt; T {</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <span class="keyword">using</span> blas::Op;</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <span class="keywordflow">switch</span> (op) {</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="keywordflow">case</span> Op::NoTrans:</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;        <span class="keywordflow">return</span> el_f(index);</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="keywordflow">case</span> Op::Trans:</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;        <span class="keywordflow">return</span> el_f(transposed(index));</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      <span class="keywordflow">case</span> Op::ConjTrans:</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="types_8h.html#a669723b711f94043da9793d2b24d51d9">dlaf::conj</a>(el_f(transposed(index)));</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <span class="keywordflow">default</span>:</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;        DLAF_UNIMPLEMENTED(op);</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;        <span class="keywordflow">return</span> T{};</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    }</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;  };</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160; </div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  <a class="code" href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">set</a>(matrix, el_op_f);</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;}</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160; </div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0">  243</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0">set_random</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix) {</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a>&amp; dist = matrix.distribution();</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> tile_wrt_local : iterate_range2d(dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>())) {</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> tile_wrt_global = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">globalTileIndex</a>(tile_wrt_local);</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="keyword">auto</span> tl_index = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">globalElementIndex</a>(tile_wrt_global, {0, 0});</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keyword">auto</span> seed = tl_index.col() + tl_index.row() * matrix.size().cols();</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160; </div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="keyword">using</span> TileType = <span class="keyword">typename</span> std::decay_t&lt;decltype(matrix)&gt;::TileType;</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    <span class="keyword">auto</span> rnd_f = [seed](TileType&amp;&amp; tile) {</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">internal::getter_random&lt;T&gt;</a> random_value(seed);</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="keywordflow">for</span> (<span class="keyword">auto</span> el_idx : iterate_range2d(tile.size())) {</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        tile(el_idx) = random_value();</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      }</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    };</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160; </div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    dlaf::internal::transformDetach(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), std::move(rnd_f),</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;                                    matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(tile_wrt_local));</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  }</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;}</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160; </div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;<span class="keyword">namespace </span>internal {</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160; </div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;<span class="keywordtype">void</span> set_diagonal_tile(<span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_tile.html">Tile&lt;T, Device::CPU&gt;</a>&amp; tile, internal::getter_random&lt;T&gt;&amp; random_value,</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;                       SizeType offset_value) {</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;  <span class="comment">// DIAGONAL</span></div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;  <span class="comment">// for diagonal tiles get just lower matrix values and set value for both</span></div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;  <span class="comment">// straight and transposed indices</span></div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; tile.size().cols(); ++j) {</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <span class="keywordflow">for</span> (SizeType i = 0; i &lt; j; ++i) {</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;      <span class="keyword">auto</span> value = random_value();</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160; </div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;      tile(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">TileElementIndex</a>{i, j}) = value;</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;      tile(<a class="code" href="classdlaf_1_1common_1_1_index2_d.html">TileElementIndex</a>{j, i}) = dlaf::conj(value);</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    }</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    tile(TileElementIndex{j, j}) = std::real(random_value()) + offset_value;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;  }</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;}</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160; </div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;<span class="keywordtype">void</span> set_lower_and_upper_tile(<span class="keyword">const</span> Tile&lt;T, Device::CPU&gt;&amp; tile, internal::getter_random&lt;T&gt;&amp; random_value,</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;                              TileElementSize full_tile_size, GlobalTileIndex tile_wrt_global) {</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;  <span class="comment">// LOWER or UPPER (except DIAGONAL)</span></div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;  <span class="comment">// random values are requested in the same order for both original and transposed</span></div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;  <span class="keywordflow">for</span> (SizeType j = 0; j &lt; full_tile_size.cols(); ++j) {</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    <span class="keywordflow">for</span> (SizeType i = 0; i &lt; full_tile_size.rows(); ++i) {</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;      <span class="keyword">auto</span> value = random_value();</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160; </div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;      <span class="comment">// but they are set row-wise in the original tile and col-wise in the</span></div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      <span class="comment">// transposed one</span></div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;      <span class="keywordflow">if</span> (tile_wrt_global.row() &gt; tile_wrt_global.col()) {  <span class="comment">// LOWER</span></div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        TileElementIndex index{i, j};</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;        <span class="keywordflow">if</span> (index.isIn(tile.size()))</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;          tile(index) = value;</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      }</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <span class="keywordflow">else</span> {  <span class="comment">// UPPER</span></div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        TileElementIndex index{j, i};</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;        <span class="keywordflow">if</span> (index.isIn(tile.size()))</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;          tile(index) = <a class="code" href="types_8h.html#a669723b711f94043da9793d2b24d51d9">dlaf::conj</a>(value);</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      }</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    }</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;  }</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;}</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160; </div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00324"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133">  324</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133">set_random_hermitian_with_offset</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix, <span class="keyword">const</span> SizeType offset_value) {</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;  <span class="comment">// note:</span></div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;  <span class="comment">// By assuming square blocksizes, it is easier to locate elements. In fact:</span></div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  <span class="comment">// - Elements on the diagonal are stored in the diagonal of the diagonal tiles</span></div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;  <span class="comment">// - Tiles under the diagonal store elements of the lower triangular matrix</span></div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;  <span class="comment">// - Tiles over the diagonal store elements of the upper triangular matrix</span></div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160; </div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;  <span class="keyword">const</span> <a class="code" href="classdlaf_1_1matrix_1_1_distribution.html">Distribution</a>&amp; dist = matrix.distribution();</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160; </div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;  DLAF_ASSERT(<a class="code" href="util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0">square_size</a>(matrix), matrix);</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;  DLAF_ASSERT(<a class="code" href="util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b">square_blocksize</a>(matrix), matrix);</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160; </div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <span class="keyword">auto</span> full_tile_size = matrix.blockSize();</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160; </div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;  <span class="keywordflow">for</span> (<span class="keyword">auto</span> tile_wrt_local : iterate_range2d(dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">localNrTiles</a>())) {</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <a class="code" href="classdlaf_1_1common_1_1_index2_d.html">GlobalTileIndex</a> tile_wrt_global = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">globalTileIndex</a>(tile_wrt_local);</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160; </div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keyword">auto</span> tl_index = dist.<a class="code" href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">globalElementIndex</a>(tile_wrt_global, {0, 0});</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160; </div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="comment">// compute the same seed for original and &quot;transposed&quot; tiles, so transposed ones will know the</span></div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <span class="comment">// values of the original one without the need of accessing real values (nor communication in case</span></div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    <span class="comment">// of distributed matrices)</span></div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    SizeType seed;</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="keywordflow">if</span> (tile_wrt_global.row() &gt;= tile_wrt_global.col())  <span class="comment">// LOWER or DIAGONAL</span></div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      seed = tl_index.col() + tl_index.row() * matrix.size().cols();</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;      seed = tl_index.row() + tl_index.col() * matrix.size().rows();</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160; </div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;    <span class="keyword">using</span> TileType = <span class="keyword">typename</span> std::decay_t&lt;decltype(matrix)&gt;::TileType;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    <span class="keyword">auto</span> set_hp_f = [=](<span class="keyword">const</span> TileType&amp; tile) {</div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;      <a class="code" href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">internal::getter_random&lt;T&gt;</a> random_value(seed);</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;      <span class="keywordflow">if</span> (tile_wrt_global.row() == tile_wrt_global.col())</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        internal::set_diagonal_tile(tile, random_value, offset_value);</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;      <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        internal::set_lower_and_upper_tile(tile, random_value, full_tile_size, tile_wrt_global);</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    };</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160; </div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    dlaf::internal::transformDetach(<a class="code" href="classdlaf_1_1internal_1_1_policy.html">dlaf::internal::Policy&lt;Backend::MC&gt;</a>(), std::move(set_hp_f),</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;                                    matrix.<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">readwrite</a>(tile_wrt_local));</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;  }</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;}</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160; </div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;}</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160; </div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00382"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476">  382</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476">set_random_hermitian</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix) {</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;  internal::set_random_hermitian_with_offset(matrix, 0);</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;}</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160; </div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00403"></a><span class="lineno"><a class="line" href="util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58">  403</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58">set_random_hermitian_positive_definite</a>(<a class="code" href="classdlaf_1_1matrix_1_1_matrix.html">Matrix&lt;T, Device::CPU&gt;</a>&amp; matrix) {</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;  internal::set_random_hermitian_with_offset(matrix, 2 * matrix.size().rows());</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;}</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160; </div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;}</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;}</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;}</div>
 <div class="ttc" id="ablas_2enum__output_8h_html"><div class="ttname"><a href="blas_2enum__output_8h.html">enum_output.h</a></div></div>
 <div class="ttc" id="aclassdlaf_1_1comm_1_1_communicator_grid_html"><div class="ttname"><a href="classdlaf_1_1comm_1_1_communicator_grid.html">dlaf::comm::CommunicatorGrid</a></div><div class="ttdef"><b>Definition:</b> communicator_grid.h:42</div></div>
 <div class="ttc" id="aclassdlaf_1_1common_1_1_index2_d_html"><div class="ttname"><a href="classdlaf_1_1common_1_1_index2_d.html">dlaf::common::Index2D&lt; SizeType, matrix::LocalTile_TAG &gt;</a></div></div>
@@ -392,11 +397,11 @@
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_a20234ff229ec8872625293b28c7d47f5"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#a20234ff229ec8872625293b28c7d47f5">dlaf::matrix::Distribution::globalElementIndex</a></div><div class="ttdeci">GlobalElementIndex globalElementIndex(const GlobalTileIndex &amp;global_tile, const TileElementIndex &amp;tile_element) const noexcept</div><div class="ttdef"><b>Definition:</b> distribution.h:176</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_a6e8c79e3f901845182c4e7e32de5eb34"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#a6e8c79e3f901845182c4e7e32de5eb34">dlaf::matrix::Distribution::localNrTiles</a></div><div class="ttdeci">const LocalTileSize &amp; localNrTiles() const noexcept</div><div class="ttdoc">Returns the number of tiles stored locally (2D size).</div><div class="ttdef"><b>Definition:</b> distribution.h:147</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_distribution_html_ae49ef916d77bf8de7e8e4710a1034299"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_distribution.html#ae49ef916d77bf8de7e8e4710a1034299">dlaf::matrix::Distribution::globalTileIndex</a></div><div class="ttdeci">GlobalTileIndex globalTileIndex(const GlobalElementIndex &amp;global_element) const noexcept</div><div class="ttdef"><b>Definition:</b> distribution.h:189</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> matrix.h:151</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:55</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:121</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix_3_01const_01_t_00_01_d_01_4.html">dlaf::matrix::Matrix&lt; const T, D &gt;</a></div><div class="ttdef"><b>Definition:</b> matrix.h:171</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html">dlaf::matrix::Matrix</a></div><div class="ttdef"><b>Definition:</b> matrix.h:56</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1_matrix_html_ad11e9036fe317b6328ae71585b19c811"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_matrix.html#ad11e9036fe317b6328ae71585b19c811">dlaf::matrix::Matrix::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(const LocalTileIndex &amp;index) noexcept</div><div class="ttdef"><b>Definition:</b> matrix.h:122</div></div>
 <div class="ttc" id="aclassdlaf_1_1matrix_1_1_tile_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1_tile.html">dlaf::matrix::Tile</a></div><div class="ttdef"><b>Definition:</b> tile.h:329</div></div>
-<div class="ttc" id="aclassdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">dlaf::matrix::util::internal::getter_random</a></div><div class="ttdoc">Callable that returns random values in the range [-1, 1].</div><div class="ttdef"><b>Definition:</b> util_matrix.h:107</div></div>
+<div class="ttc" id="aclassdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random_html"><div class="ttname"><a href="classdlaf_1_1matrix_1_1util_1_1internal_1_1getter__random.html">dlaf::matrix::util::internal::getter_random</a></div><div class="ttdoc">Callable that returns random values in the range [-1, 1].</div><div class="ttdef"><b>Definition:</b> util_matrix.h:113</div></div>
 <div class="ttc" id="aindex2d_8h_html"><div class="ttname"><a href="index2d_8h.html">index2d.h</a></div></div>
 <div class="ttc" id="alapack_2tile_8h_html"><div class="ttname"><a href="lapack_2tile_8h.html">tile.h</a></div></div>
 <div class="ttc" id="amatrix_8h_html"><div class="ttname"><a href="matrix_8h.html">matrix.h</a></div></div>
@@ -406,20 +411,21 @@
 <div class="ttc" id="astructdlaf_1_1matrix_1_1_panel_html_aac41b4dfa833e4a24839fe1d470b835a"><div class="ttname"><a href="structdlaf_1_1matrix_1_1_panel.html#aac41b4dfa833e4a24839fe1d470b835a">dlaf::matrix::Panel::readwrite</a></div><div class="ttdeci">ReadWriteSenderType readwrite(LocalTileIndex index)</div><div class="ttdef"><b>Definition:</b> panel.h:570</div></div>
 <div class="ttc" id="atypes_8h_html"><div class="ttname"><a href="types_8h.html">types.h</a></div></div>
 <div class="ttc" id="atypes_8h_html_a669723b711f94043da9793d2b24d51d9"><div class="ttname"><a href="types_8h.html#a669723b711f94043da9793d2b24d51d9">dlaf::conj</a></div><div class="ttdeci">std::complex&lt; T &gt; conj(const std::complex&lt; T &gt; number)</div><div class="ttdoc">Return complex conjugate of a complex number.</div><div class="ttdef"><b>Definition:</b> types.h:165</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a0bb54ace6dfcb245ec387c1af75e63fe"><div class="ttname"><a href="util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe">dlaf::matrix::equal_blocksize</a></div><div class="ttdeci">bool equal_blocksize(const Matrix&lt; const T, D1 &gt; &amp;lhs, Matrix&lt; const T, D2 &gt; &amp;rhs) noexcept</div><div class="ttdoc">Returns true if matrices have equal blocksizes.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:60</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a14086310f58c9ace5ceb41e040277c86"><div class="ttname"><a href="util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86">dlaf::matrix::multipliable</a></div><div class="ttdeci">bool multipliable(const Matrix&lt; const T, D &gt; &amp;a, const Matrix&lt; const T, D &gt; &amp;b, const Matrix&lt; const T, D &gt; &amp;c, const blas::Op opA, const blas::Op opB) noexcept</div><div class="ttdoc">Returns true if matrices a, b and c have matrix multipliable sizes and block sizes.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:96</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a1f796f1fd4dd705c90ac141d687843b2"><div class="ttname"><a href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">dlaf::matrix::util::set</a></div><div class="ttdeci">void set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:178</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a2f1823d0004b53105c4d4b7373208133"><div class="ttname"><a href="util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133">dlaf::matrix::util::internal::set_random_hermitian_with_offset</a></div><div class="ttdeci">void set_random_hermitian_with_offset(Matrix&lt; T, Device::CPU &gt; &amp;matrix, const SizeType offset_value)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:318</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a0bb54ace6dfcb245ec387c1af75e63fe"><div class="ttname"><a href="util__matrix_8h.html#a0bb54ace6dfcb245ec387c1af75e63fe">dlaf::matrix::equal_blocksize</a></div><div class="ttdeci">bool equal_blocksize(const Matrix&lt; const T, D1 &gt; &amp;lhs, Matrix&lt; const T, D2 &gt; &amp;rhs) noexcept</div><div class="ttdoc">Returns true if matrices have equal blocksizes.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:66</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a14086310f58c9ace5ceb41e040277c86"><div class="ttname"><a href="util__matrix_8h.html#a14086310f58c9ace5ceb41e040277c86">dlaf::matrix::multipliable</a></div><div class="ttdeci">bool multipliable(const Matrix&lt; const T, D &gt; &amp;a, const Matrix&lt; const T, D &gt; &amp;b, const Matrix&lt; const T, D &gt; &amp;c, const blas::Op opA, const blas::Op opB) noexcept</div><div class="ttdoc">Returns true if matrices a, b and c have matrix multipliable sizes and block sizes.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:102</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a1f796f1fd4dd705c90ac141d687843b2"><div class="ttname"><a href="util__matrix_8h.html#a1f796f1fd4dd705c90ac141d687843b2">dlaf::matrix::util::set</a></div><div class="ttdeci">void set(Matrix&lt; T, Device::CPU &gt; &amp;matrix, ElementGetter el_f)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:184</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a2f1823d0004b53105c4d4b7373208133"><div class="ttname"><a href="util__matrix_8h.html#a2f1823d0004b53105c4d4b7373208133">dlaf::matrix::util::internal::set_random_hermitian_with_offset</a></div><div class="ttdeci">void set_random_hermitian_with_offset(Matrix&lt; T, Device::CPU &gt; &amp;matrix, const SizeType offset_value)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:324</div></div>
 <div class="ttc" id="autil__matrix_8h_html_a355682eaf279129f2aa06c8e96eaa61b"><div class="ttname"><a href="util__matrix_8h.html#a355682eaf279129f2aa06c8e96eaa61b">dlaf::matrix::square_blocksize</a></div><div class="ttdeci">bool square_blocksize(const MatrixLike &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix block size is square.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:48</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a3f7866203ad62c615d11ca18af4d4476"><div class="ttname"><a href="util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476">dlaf::matrix::util::set_random_hermitian</a></div><div class="ttdeci">void set_random_hermitian(Matrix&lt; T, Device::CPU &gt; &amp;matrix)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:376</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a7a41b22af7fe104052668cc02d5a624c"><div class="ttname"><a href="util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c">dlaf::matrix::equal_process_grid</a></div><div class="ttdeci">bool equal_process_grid(const Matrix&lt; const T, D &gt; &amp;m, const comm::CommunicatorGrid &amp;g) noexcept</div><div class="ttdoc">Returns true if the matrix is distributed on the communication grid.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:72</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a801d4c1863ecd48a5758741b63781921"><div class="ttname"><a href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">dlaf::matrix::local_matrix</a></div><div class="ttdeci">bool local_matrix(const Matrix&lt; const T, D &gt; &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix is local to a process.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:66</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a8af8a409c1af4f1c7cdbed9b4f6b24a2"><div class="ttname"><a href="util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2">dlaf::matrix::equal_distributions</a></div><div class="ttdeci">bool equal_distributions(const Matrix&lt; const T, D1 &gt; &amp;lhs, const Matrix&lt; const T, D2 &gt; &amp;rhs) noexcept</div><div class="ttdoc">Returns true if the matrices are distributed the same way.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:78</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a8e8c0d0551fbda5968d6c84eb3c70fc0"><div class="ttname"><a href="util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0">dlaf::matrix::util::set_random</a></div><div class="ttdeci">void set_random(Matrix&lt; T, Device::CPU &gt; &amp;matrix)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:237</div></div>
-<div class="ttc" id="autil__matrix_8h_html_a93b53e9c0e942a5caa96a24242864400"><div class="ttname"><a href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">dlaf::matrix::multipliable_sizes</a></div><div class="ttdeci">bool multipliable_sizes(common::Size2D&lt; IndexT, Tag &gt; a, common::Size2D&lt; IndexT, Tag &gt; b, common::Size2D&lt; IndexT, Tag &gt; c, const blas::Op opA, const blas::Op opB) noexcept</div><div class="ttdoc">Returns true if the sizes are compatible for matrix multiplication.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:84</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a3f7866203ad62c615d11ca18af4d4476"><div class="ttname"><a href="util__matrix_8h.html#a3f7866203ad62c615d11ca18af4d4476">dlaf::matrix::util::set_random_hermitian</a></div><div class="ttdeci">void set_random_hermitian(Matrix&lt; T, Device::CPU &gt; &amp;matrix)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:382</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a4e47364118c7bc9bb3d038ae4ec8a35c"><div class="ttname"><a href="util__matrix_8h.html#a4e47364118c7bc9bb3d038ae4ec8a35c">dlaf::matrix::single_tile_per_block</a></div><div class="ttdeci">bool single_tile_per_block(const MatrixLike &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix has a single tile per block.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:54</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a7a41b22af7fe104052668cc02d5a624c"><div class="ttname"><a href="util__matrix_8h.html#a7a41b22af7fe104052668cc02d5a624c">dlaf::matrix::equal_process_grid</a></div><div class="ttdeci">bool equal_process_grid(const Matrix&lt; const T, D &gt; &amp;m, const comm::CommunicatorGrid &amp;g) noexcept</div><div class="ttdoc">Returns true if the matrix is distributed on the communication grid.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:78</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a801d4c1863ecd48a5758741b63781921"><div class="ttname"><a href="util__matrix_8h.html#a801d4c1863ecd48a5758741b63781921">dlaf::matrix::local_matrix</a></div><div class="ttdeci">bool local_matrix(const Matrix&lt; const T, D &gt; &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix is local to a process.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:72</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a8af8a409c1af4f1c7cdbed9b4f6b24a2"><div class="ttname"><a href="util__matrix_8h.html#a8af8a409c1af4f1c7cdbed9b4f6b24a2">dlaf::matrix::equal_distributions</a></div><div class="ttdeci">bool equal_distributions(const Matrix&lt; const T, D1 &gt; &amp;lhs, const Matrix&lt; const T, D2 &gt; &amp;rhs) noexcept</div><div class="ttdoc">Returns true if the matrices are distributed the same way.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:84</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a8e8c0d0551fbda5968d6c84eb3c70fc0"><div class="ttname"><a href="util__matrix_8h.html#a8e8c0d0551fbda5968d6c84eb3c70fc0">dlaf::matrix::util::set_random</a></div><div class="ttdeci">void set_random(Matrix&lt; T, Device::CPU &gt; &amp;matrix)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:243</div></div>
+<div class="ttc" id="autil__matrix_8h_html_a93b53e9c0e942a5caa96a24242864400"><div class="ttname"><a href="util__matrix_8h.html#a93b53e9c0e942a5caa96a24242864400">dlaf::matrix::multipliable_sizes</a></div><div class="ttdeci">bool multipliable_sizes(common::Size2D&lt; IndexT, Tag &gt; a, common::Size2D&lt; IndexT, Tag &gt; b, common::Size2D&lt; IndexT, Tag &gt; c, const blas::Op opA, const blas::Op opB) noexcept</div><div class="ttdoc">Returns true if the sizes are compatible for matrix multiplication.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:90</div></div>
 <div class="ttc" id="autil__matrix_8h_html_aae6464887dae32e01668a32e71397cb0"><div class="ttname"><a href="util__matrix_8h.html#aae6464887dae32e01668a32e71397cb0">dlaf::matrix::square_size</a></div><div class="ttdeci">bool square_size(const MatrixLike &amp;m) noexcept</div><div class="ttdoc">Returns true if the matrix is square.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:42</div></div>
-<div class="ttc" id="autil__matrix_8h_html_ada06af4450b10ed70a5830c0d8db0302"><div class="ttname"><a href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">dlaf::matrix::equal_size</a></div><div class="ttdeci">bool equal_size(const MatrixLikeA &amp;lhs, const MatrixLikeB &amp;rhs) noexcept</div><div class="ttdoc">Returns true if matrices have equal sizes.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:54</div></div>
-<div class="ttc" id="autil__matrix_8h_html_ae2afbf7cdec8225e544b7b71aa52ee58"><div class="ttname"><a href="util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58">dlaf::matrix::util::set_random_hermitian_positive_definite</a></div><div class="ttdeci">void set_random_hermitian_positive_definite(Matrix&lt; T, Device::CPU &gt; &amp;matrix)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:397</div></div>
+<div class="ttc" id="autil__matrix_8h_html_ada06af4450b10ed70a5830c0d8db0302"><div class="ttname"><a href="util__matrix_8h.html#ada06af4450b10ed70a5830c0d8db0302">dlaf::matrix::equal_size</a></div><div class="ttdeci">bool equal_size(const MatrixLikeA &amp;lhs, const MatrixLikeB &amp;rhs) noexcept</div><div class="ttdoc">Returns true if matrices have equal sizes.</div><div class="ttdef"><b>Definition:</b> util_matrix.h:60</div></div>
+<div class="ttc" id="autil__matrix_8h_html_ae2afbf7cdec8225e544b7b71aa52ee58"><div class="ttname"><a href="util__matrix_8h.html#ae2afbf7cdec8225e544b7b71aa52ee58">dlaf::matrix::util::set_random_hermitian_positive_definite</a></div><div class="ttdeci">void set_random_hermitian_positive_definite(Matrix&lt; T, Device::CPU &gt; &amp;matrix)</div><div class="ttdef"><b>Definition:</b> util_matrix.h:403</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>